用lucene檢索包,很強大。到官網下一個最新版本就可以進行二次開發。
成都服務器托管,成都創新互聯提供包括服務器租用、綿陽電信機房、帶寬租用、云主機、機柜租用、主機租用托管、CDN網站加速、域名與空間等業務的一體化完整服務。電話咨詢:028-86922220
至于中文支持,可以使用流行的中文分詞包,建議用用paoding。
java實現文件搜索主要使用file類和正則表達式,如下示例:
package?com.kiritor.util;
import?java.io.File;
import?java.io.FileFilter;
import?java.util.Arrays;
import?java.util.Collections;
import?java.util.List;
/**
*?文件的相關操作類
*?
*?@author?Kiritor
*/
public?class?FileOperation?{
private?static?String?contentPath;
private?static?String?filePath;
private?static?File[]?fileList?=?null;//?保存文件列表,過濾掉目錄
public?FileOperation()?{
}
/**?構造函數的參數是一個目錄?*/
public?FileOperation(String?path)?{
File?file?=?new?File(path);
if?(file.isDirectory())
this.contentPath?=?path;
else
this.filePath?=?path;
}
/**獲取文件列表*/
public?static?File[]?getFiles()?{
if?(contentPath?==?null)?{
File?file?=?new?File(filePath);
fileList?=?new?File[1];
fileList[0]?=?file;
return?fileList;
}
fileList?=?new?File(contentPath).listFiles(new?FileFilter()?{
/**使用過濾器過濾掉目錄*/
@Override
public?boolean?accept(File?pathname)?{
if(pathname.isDirectory())
{
return?false;
}else
return?true;
}
});
return?fileList;
}
/**?對當前目錄下的所有文件進行排序?*/
public?static?File[]?sort()?{
getFiles();
Arrays.sort(fileList,?new?FileComparator());
return?fileList;
}
public?static?void?tree(File?f,?int?level)?{
String?preStr?=?"";
for(int?i=0;?ilevel;?i++)?{
preStr?+=?"????";
}
File[]?childs?=?f.listFiles();
//返回一個抽象路徑名數組,這些路徑名表示此抽象路徑名表示的目錄中的文件。
for(int?i=0;?ichilds.length;?i++)?{
System.out.println(preStr?+?childs[i].getName());
if(childs[i].isDirectory())?{
tree(childs[i],?level?+?1);
}
}
}
//?提供一個"比較器"
static?class?FileComparator?implements?java.util.ComparatorFile?{
@Override
public?int?compare(File?o1,?File?o2)?{
//?按照文件名的字典順序進行比較
return?o1.getName().compareTo(o2.getName());
}
}
}
談談我的看法,并不是具體如何去編程,僅僅是一個思路而已
1\建立一個微型的數據庫,然后做一個系統服務,每隔一段時間就自動運行一次,搜索全盤文件系統的文件結構,并做索引記錄
2\你要進行搜索的時候,直接數據庫查詢就行
思路來源:Linux系統的updatedb,然后locate查找文件的機制。你可以百度一下。
在業務邏輯層里操作不是都相同的么?為什么特別指出不需要JSP要用GUI呢?難道是用ajax寫?但你說在數據庫搜索內容并顯示又不像ajax。搞不懂。
類似于下面那樣子的業務吧?:
String sql="select WP_PRODUCT.*,WP_PROD_CTGRY.C_NAME from WP_PRODUCT,WP_PROD_CTGRY where WP_PRODUCT.CTGRY_ID=WP_PROD_CTGRY.TID ";
ListObject params=new ArrayListObject();
if(type!=null!"".equals(type)){
sql+=" and CTGRY_ID like ?";
params.add(type+"%");
}
if(proName!=null!"".equals(proName)){
sql+=" and NAME like ?";
params.add("%"+proName+"%");
}
if(code!=null!"".equals(code)){
sql+=" and CUSTOM_ID like ?";
params.add(code+"%");
}
if(brandId!=null!"".equals(brandId)){
sql+=" and OWNER_ID = ?";
params.add(brandId);
}
if(netId!=null !"".equals(netId)) {
sql += " and WP_PRODUCT.TID IN(SELECT PRODUCT_ID FROM WP_NET_PRODUCT WHERE OWNER_ID = ?) ";
params.add(netId);
}
sql += " order by WP_PRODUCT.MOD_DATE desc";
this.getVisitor().createPaginationExecutor(sql, page, params.toArray()).pagination(WpProdBean.class);
import?java.io.*;
public?class?FileDemo{
public?static?void?main(String[]?args)throws?Exception{
//第一個參數是文件路徑,第二個參數是要搜索的文件擴展名
getFile("D:\\JavaDemo",".txt");
}
private?static?void?getFile(String?pathName,?final?String?endsWith)throws?Exception{
File?file?=?new?File(pathName);
if(!file.exists())
throw?new?RuntimeException("文件不存在,你檢索個P呀。");
file.listFiles(new?FileFilter(){
public?boolean?accept(File?file){
if(file.getName().endsWith(endsWith)){
System.out.println(file.getName());
return?true;
}else
return?false;
}
});
}
}
一.???????????創建索引
1.一般創建索引的核心步驟
(1).?創建索引寫入對象IndexWriter:
IndexWriter indexWriter = new IndexWriter(INDEX_STORE_PATH,new StandardAnalyzer(),create);
參數說明:INDEX_STORE_PATH:??索引文件存放路徑
new StandardAnalyzer():?分詞工具
create:?此參數為Boolean型,true表示重新創建整個索引,?false?表示增量式創建索引。
(2).創建文檔模型,并用IndexWriter對象寫入
Document doc = new Document();
Field field1 = new Field(fieldName1, fieldValue ,??Field.Store.YES, Field.Index.TOKENIZED);
doc.add(field1);
Field field2 = new Field(fieldName2, fieldValue ,??Field.Store.YES, Field.Index.TOKENIZED);
doc.add(field2);
……
indexWriter.addDocument(doc);
indexWriter.close();
參數說明:
Document?:負責搜集數據源,它可以從不同的物理文件提取數據并放入同一個Document?中或從一個物理文件中提取出不同的數據并放入同一個Document中。
如下圖所示
? ? ? ? ? ?
Field?:用來表示不同的數據源
fieldName1:?表示field名稱
fieldValue:??表示field?的值
Field.Store.YES,:表示是否在索引文件中完整的存儲該值。
在創建索引時,有些內容需要以摘要的形式完整地或以片段的方式顯示在頁面上,來便于用戶查找想要的記錄,那么就應該選擇存儲,如果不需要完整或片段的顯示就不需要存儲。
Field.Index.TOKENIZED?:表示是否索引和分詞。
只要是需要當作關鍵字讓用戶查找的字段就需要建立索引。
在建立索引的過程中,如果像文章標題、文章內容這樣的Field,?一般是靠用戶輸入幾個關鍵字來查詢的,就應該選擇分詞。
如果需要用戶輸入完整字符也就是精確查找才能查詢到的,例如:beanName,就可以不分詞。
Document最直觀的理解方式:
Document就相當于我們平臺中的一個普通javaBean,,而Field?就是javaBean中的一個屬性。lucene搜索的機制就是靠搜索指定的Field的值?,來得到含有要搜索內容的Document?集合,所以問題的關鍵在于如何組織Document .
2.結合平臺創建索引的思路
(1)?經分析搜索元素應該由如下內容組成(Document的屬性)
(2)?數據庫數據轉化為Document?的構造過程:
JavaBean / Attachment?????→???(Temp Object) BaseData??→???(Finally Object) Document
分析:
要建立索引的源數據分為兩大部分:一個是數據庫數據?BeanData ,另一個是附件數據?FileData ,?這樣可以建立一個抽象類?BaseData ,?來存放它們共有的屬性。同時為了管理這些相應的數據,在相同的等級結構上,建立了相應的管理類(xxxDataManager) ,對這些數據類的操作(建立或刪除索引)進行管理,并用一個工廠類(DataManagerFactory)來創建所需要的管理類,IndexHelper用來充當整個索引模塊對外的接口,為了實現一些與平臺特定的業務,特用SupportManager來提供一些額外的業務支持,索引模塊代碼結構如下圖所示。
二.搜索索引
1.???lucene?搜索的核心步驟:
String[]??fields??=??{“title”,?“summary”,……};?????//要查找的field范圍
BooleanClause.Occur[]???flags??=??{BooleanClause.Occur.SHOULD, BooleanClause.Occur.?MUST ,……};
Query??query = MultiFieldQueryParser.parse(queryStr, fields,flags,new StandardAnalyzer());
Hits??hits??=??new??IndexSearcher(INDEX_STORE_PATH).search(query);
for (int i = 0;i hitsLength ; i++)
{
Document doc = hits.doc(i);
String title = doc.get(“title”);
String summary = doc.get(“summary”);
//?搜索出來的結果高亮顯示在頁面上
if (title != null) {
TokenStream tokenStream = analyzer.tokenStream(“title”,new StringReader(title));
String highlighterValue = highlighter.getBestFragment(tokenStream, title) ;
if(highlighterValue != null){
title = highlighterValue ;
}
//log.info("SearchHelper.search.title="+title);
}
if(summary!= null){
TokenStream tokenStream = analyzer.tokenStream(“summary”,new StringReader(summary));
String highlighterValue = highlighter.getBestFragment(tokenStream, creator) ;
if(highlighterValue != null){
summary = highlighterValue ;
}
//log.info("SearchHelper.search. summary ="+ summary);
}
}
2.結合平臺構造搜索模塊
PageData?類用來存放檢索結果集數據。
PageInfo?類用來存放頁面相關信息例如,PageData對象集合、總記錄個數、每一頁的記錄數、?總頁面數量等等。
SearchHelper用來充當整個搜索模塊的對外接口。
三.為平臺組件添加索引的步驟(以知識中心為例)
1.在com.cscec.oa.searchengine.extend.module?目錄下添加一個新的package
例如:com.cscec.oa.searchengine.extend.module.resourcestore
2.在新的目錄下建立data package?并建立相應的數據類,并使這個數據類繼承BeanData。
例如:
package com.cscec.oa.searchengine.extend.module.resourcestore.data
public class ResourceStoreBeanData extends BeanData{
}
3.?與data package?同一級目錄建立manager package?并建立相應管理類,并使這個管理類繼承BeanDataManager
例如:
com.cscec.oa.searchengine.extend.module.resourcestore.manager
public class ResourceStoreBeanDataManagerImpl extends BeanDataManager{
}
4.以管理員的身份登陸OA后,在菜單中找到“索引模塊管理”鏈接,將相應信息添加完成后,便可以在List?頁面?點擊“創建索引”對該模塊的數據進行索引的建立,建立完成后便可以進行查詢。
文章標題:j搜索引擎java代碼 java搜索框代碼
網頁URL:http://vcdvsql.cn/article12/hehogc.html
成都網站建設公司_創新互聯,為您提供虛擬主機、網站導航、網站設計公司、網站排名、云服務器、
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯