
掃描右側(cè)圖片或微信搜索 “ Java技術(shù)分享屋 ” ,回復(fù) “ 驗(yàn)證碼 ” ,獲取驗(yàn)證密碼。
本資料僅供讀者預(yù)覽及學(xué)習(xí)交流使用,不能用于商業(yè)用途,請(qǐng)?jiān)谙螺d后24小時(shí)內(nèi)刪除。如果喜歡,請(qǐng)購買正版!
一.資料圖片
二.資料簡(jiǎn)介
《Lucene搜索引擎開發(fā)權(quán)威經(jīng)典》基于Lucene的當(dāng)前最新版本(2.1)精解了Lucene搜索引擎的相關(guān)知識(shí),從基礎(chǔ)知識(shí)到應(yīng)用開發(fā),精練簡(jiǎn)潔,恰到好處《Lucene搜索引擎開發(fā)權(quán)威經(jīng)典》共包括16章,分為6部分。第1部分Lucene基礎(chǔ)。介紹了Lucene的基礎(chǔ)知識(shí),包括Lucene的歷史和發(fā)展情況、使用Lucene創(chuàng)建索引和執(zhí)行搜索的基本方法以及中文分詞的應(yīng)用,最后做了兩個(gè)應(yīng)用項(xiàng)目。第2部分:數(shù)據(jù)解析。介紹解析不同格式數(shù)據(jù)(如Word、PDF等)的方法,包括常用的數(shù)據(jù)解析組件、Lucene自身的數(shù)據(jù)解析機(jī)制和Lius類庫。第3部分:索引的高級(jí)知識(shí)。介紹了 Lucene建立索引的過程,索引的查看和刪除,索引的同步,索引的合并和優(yōu)化等內(nèi)容。第4部分:搜索的高級(jí)知識(shí)。介紹使用不同的Query對(duì)象構(gòu)建搜索請(qǐng)求,使用QueryParser解析用戶的搜索請(qǐng)求,搜索結(jié)果的過濾和排序等內(nèi)容。第5部分:Lucene應(yīng)用實(shí)例。應(yīng)用本節(jié)介紹的所有知識(shí)構(gòu)建一個(gè)桌面搜索引擎和一個(gè)Web搜索引擎。這部分作為對(duì)前面所有內(nèi)容的總結(jié)。第6部分:Nutch搜索引擎框架。介紹了基于Lucene的完整搜索引擎Nutch。
《Lucene搜索引擎開發(fā)權(quán)威經(jīng)典》適合從Lucene初學(xué)者到高級(jí)開發(fā)人員之間的一切Lucene愛好者。
三.資料目錄
第1章 Lucene簡(jiǎn)介
1.1 認(rèn)識(shí)Lucene
1.1.1 Lucene是什么
1.1.2 Lucene的作者
1.1.3 Lucene的歷史
1.1.4 Lucene的現(xiàn)在
1.2 Lucene體驗(yàn)實(shí)例
1.2.1 下載Lucene
1.2.2 編寫輔助類
1.2.3 最簡(jiǎn)單的搜索引擎
1.2.4 索引器的開發(fā)
1.2.5 索引器的運(yùn)行
1.2.6 搜索器的開發(fā)
1.2.7 搜索器的運(yùn)行
小結(jié)
第2章 創(chuàng)建索引
2.1 創(chuàng)建索引的基本方式
2.1.1 理解創(chuàng)建索引的過程
2.1.2 創(chuàng)建Field
2.1.3 創(chuàng)建Document
2.1.4 創(chuàng)建IndexWriter
2.2 創(chuàng)建索引實(shí)例
2.2.1 簡(jiǎn)單索引
2.2.2 復(fù)雜一點(diǎn)的索引
2.2.3 為文件創(chuàng)建索引
2.2.4 為某一目錄下的所有文件創(chuàng)建索引
小結(jié)
第3章 執(zhí)行搜索
3.1 執(zhí)行搜索的基本方式
3.1.1 創(chuàng)建搜索器對(duì)象:Indexsearcher
3.1.2 封裝搜索條件:使用Tem和Query對(duì)象
3.1.3 執(zhí)行搜索
3.1.4 提取搜索結(jié)果:了解Hits對(duì)象
3.1.5 提取搜索結(jié)果:了解Document對(duì)象
3.1.6 提取搜索結(jié)果:了解Field對(duì)象
3.2 執(zhí)行搜索實(shí)例
3.2.1 簡(jiǎn)單搜索
3.2.2 分詞問題
小結(jié)
第4章 中文分詞
4.1 說說分詞
4.1.1 分詞的方法
4.1.2 做分詞器
4.2 Lucene的分詞器
4.2.1 二分法分詞器
4.2.2 Lucene自帶的中文分詞器
4.2.3 NGram分詞器的原理和用法
4.2.4 JE分詞器的原理和用法
4.2.5 IK分詞器的原理和用法
4.2.6 其他分詞器
小結(jié)
第5章 Lucene搜索引擎開發(fā)基礎(chǔ)實(shí)例
5.1 概述
5.2 桌面搜索引擎:索引器
5.2.1 索引器簡(jiǎn)介
5.2.2 索引器設(shè)計(jì)
5.2.3 索引器實(shí)現(xiàn)
5.2.4 實(shí)例效果
5.3 桌面搜索引擎:搜索器
5.3.1 搜索器簡(jiǎn)介
5.3.2 搜索器設(shè)計(jì)
5.3.3 搜索器實(shí)現(xiàn)
5.3.4 實(shí)例效果
5.4 web搜索引擎:搜索器
5.4.1 搜索器簡(jiǎn)介
5.4.2 搜索器界面
5.4.3 搜索器實(shí)現(xiàn)
5.4.4 搜索器部署
5.4.5 實(shí)例效果
小結(jié)
第6章 常用的數(shù)據(jù)解新組件
6.1 常見二進(jìn)制文檔的解析
6.1.1 解析PDF文檔
6.1.2 解析Word文檔
6.1.3 解析Excel文檔
6.2 XML文檔的解析
6.2.1 使用Dom4j解析XML文檔
6.2.2 XML文檔標(biāo)準(zhǔn)解析器
6.3 HTML文檔的解析
6.3.1 下載htmlparser組件
6.3.2網(wǎng)頁編碼問題
6.3.3 網(wǎng)頁解析的一般方法
6.3.4 常見的解析要求
6.4 集成的數(shù)據(jù)解析器
6.4.1 文本文件解析器
6.4.2 集成解析器
6.5 改良的搜索引擎
6.5.1 改良的索引器
6.5.2 測(cè)試搜索器
小結(jié)
第7章 Lucene自身的數(shù)據(jù)解新方
法
7.1 處理PDF文檔——LucenePDFDocument
7.2 處理純文本文件——TextDocument
7.3 綜述
小結(jié)
第8章 Lius類庫
8.1 初識(shí)Lius
8.1.1 Lius簡(jiǎn)介
8.1.2 Lius的功能
8.1.3 下載Lius
8.1.4 Lius的目錄結(jié)構(gòu)
8.1.5 一個(gè)簡(jiǎn)單的例子
8.2 借助Lius解析普通數(shù)據(jù)
8.2.1 取我所需,為我所用
8.2.2 解析Word
8.2.3 解析Excel
8.2.4 解析PDF
8.2.5 解析PowerPoint
8.2.6 解析RTF
8.2.7 解析TXT
8.2.8 解析XMI
8.3 借助Lius解析HTML數(shù)據(jù)
……
第3部分 索引的高級(jí)知識(shí)(第9~10章)
第4部分 搜索的高級(jí)知識(shí)(第11~12章)
第5部分 Lucene應(yīng)用實(shí)例(第13~14章)
第6部分 Nutch搜索引擎框架(第15~16章)