Lucence

Lucene是apache軟件基金會4 jakarta項目組的一個子項目,是一個開放源代碼的全文檢索引擎工具包,但它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎。Lucene的目的是為軟件開發人員提供一個簡單易用的工具包.

創新互聯主要從事成都網站制作、成都網站建設、外貿營銷網站建設、網頁設計、企業做網站、公司建網站等業務。立足成都服務內江,10多年網站建設經驗,價格優惠、服務專業,歡迎來電咨詢建站服務:18982081108

粘貼這句話的意思就是想說明  Lucene僅僅是一個工具包,搜索引擎的工具包.

有人會問?Lucene和solr的區別,solr是一個搜索系統,打個比方,就如servlet和struts2的區別   Lucene就是servlet,solr就好比solr,solr封裝了Lucene.

下面說說Lucene的原理:

我們使用Lucene,其實使用的是他的倒排查詢

什么是倒排查詢?舉個例子

新華字典,我們都用過吧,新華字典分為兩部分,第一部門就是目錄的邊旁部首,第二部分就是正文,一個一個字的解釋,

我們在用新華字典的時候,一般我們都是通過邊旁部首找字,沒有人一頁一頁的翻字典找字吧.

Lucene的倒排就是如此,他會檢索文本,數據庫,web網頁,在把內容分詞,就像邊旁部首

Lucence

再次強調

搜索引擎(百度,谷歌)和lucene的區別

搜索引擎就是一個應用,lucene就是一個搜索工具類

 Lucence

name:lucene表示要搜索name這個Field域中,內容為“lucene”的文檔。

desc:lucene AND desc:java 表示要搜索即包括關鍵字“lucene”也包括“java”的文檔。

 

看不懂沒關系

我接下來說明Doucment和Field關系

Lucence

這里我用數據庫中的一條數據說明

Lucence

這一條數據就是一個document文檔

 每一個字段就是一個Field域

這樣說是不是豁然開朗了.

 

 

接下來,我們說說分詞器

這個lucene是外國人搞得,對中文的支持不說你也知道,不多外國人也想到這一點,"我是中國人">>我  是  中  國  人   >> 這樣的效果其實還不是我們想要的,我們要的是"中國","國人"這樣的詞匯,這里我也不打啞謎了,市場上有很多中文分詞器,無敵的存在我覺得就是IK了,這是一個jar包,導入項目即可,說他無敵是因為他可以自己加詞,比如"屌絲","高富帥",這也詞,可以自己加到分詞器中,讓程序認得.

LucenceLucence

這就是要用到的包;

Lucenceik下載后把這3個文件也要導入項目中,ext.dic是加詞的,stop是停詞的.

 

前面的都是Lucece的理論,只有理論搞懂了,下面的代碼實現過程也就輕松了

Lucence

                                     //分詞        testCreateIndex()               BookDao bookDao =          List<Book> listBook =                       List<Document> documents =  ArrayList<>                                   Document doc =              doc.add( TextField("id", String.valueOf(bk.getId()), Store.YES));             doc.add( TextField("name"             doc.add( TextField("price"             doc.add( TextField("pic"             doc.add( TextField("desc"                                                                     Analyzer analyzer =                        IndexWriterConfig config =                        Directory directory = FSDirectory.open( File("H:\\temp"                       IndexWriter writer =                                           

         //查        serachIndex()                   Analyzer analyzer =                   QueryParser queryParser =  QueryParser("desc"                           Query query = queryParser.parse("desc:java AND lucene"                               Directory directory = FSDirectory.open( File("H:\\temp"                           IndexReader indexReader =                           IndexSearcher indexSearcher =                                     TopDocs topDocs  = indexSearcher.search(query, 10         System.out.println("查詢到的數據總條數是:" +                  ScoreDoc[] docs =                                                      docID =             Document doc =                          System.out.println("docID:"+             System.out.println("bookid:"+doc.get("id"             System.out.println("pic:"+doc.get("pic"             System.out.println("name:"+doc.get("name"             System.out.println("desc:"+doc.get("desc"             System.out.println("price:"+doc.get("price"                      }

Lucence

網頁題目:Lucence
當前鏈接:http://m.kartarina.com/article24/pippje.html

成都網站建設公司_創新互聯,為您提供網頁設計公司微信小程序小程序開發網站設計動態網站Google

廣告

聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯

成都定制網站網頁設計
主站蜘蛛池模板: 久热中文字幕无码视频| 亚洲GV天堂GV无码男同| 国产成人无码av在线播放不卡 | 无码精品人妻一区二区三区免费看 | 无码人妻久久一区二区三区蜜桃 | 99久久国产热无码精品免费| 国产丝袜无码一区二区视频| 亚洲精品午夜无码专区| 亚洲a∨无码一区二区| 亚洲爆乳无码专区| 一本大道无码日韩精品影视| 久久久久亚洲av无码专区导航 | 国产免费黄色无码视频| 亚洲中文字幕在线无码一区二区 | 成人免费无码H在线观看不卡| 亚洲精品偷拍无码不卡av| 久久精品无码一区二区三区日韩| 人妻少妇偷人精品无码| 亚洲精品无码永久在线观看你懂的| 亚洲日韩精品无码专区加勒比☆| 人妻少妇无码精品视频区| 在线A级毛片无码免费真人| 亚洲AV无码无限在线观看不卡| 天堂Aⅴ无码一区二区三区| 成人免费无码大片A毛片抽搐色欲 成人免费无码大片a毛片 | 亚洲av无码不卡一区二区三区| 国产AV无码专区亚洲AV蜜芽| 伊人久久一区二区三区无码| 无码AV岛国片在线播放| 国产成人AV片无码免费| 中文字幕人妻无码系列第三区| 一级电影在线播放无码| 色综合久久久无码中文字幕 | 无码人妻少妇久久中文字幕| 精品久久久久久无码人妻| 在线看片无码永久免费aⅴ| 久久人午夜亚洲精品无码区| 无码人妻精品一区二区蜜桃 | 日韩av无码国产精品| 亚洲av无码日韩av无码网站冲| 久久久久av无码免费网|