技術(shù)創(chuàng)新平臺—企業(yè)級搜索引擎搭建
本文關(guān)鍵詞:技術(shù)創(chuàng)新平臺—企業(yè)級搜索引擎搭建
更多相關(guān)文章: Solr Nutch 中文分詞 網(wǎng)頁爬蟲 搜索引擎
【摘要】:論述如何運用Nutch作為爬蟲爬取數(shù)據(jù)、Solr作為搜索引擎服務(wù)器實現(xiàn)索引、使用IKAnalyzer完成中文分詞來搭建一個企業(yè)級搜索引擎。并對定制技術(shù)創(chuàng)新平臺的搜索引擎需要解決的問題進(jìn)行分析和提供解決方案。
【作者單位】: 云南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院;昆明能訊科技有限責(zé)任公司;
【關(guān)鍵詞】: Solr Nutch 中文分詞 網(wǎng)頁爬蟲 搜索引擎
【分類號】:TP391.3
【正文快照】: 0前言各種搜索引擎的功能側(cè)重不一樣,依靠單一的搜索引擎不能完全提供需要的信息,因此需要一種軟件或網(wǎng)站把各種搜索引擎無縫地融合在一起,智能搜索引擎是結(jié)合了人工智能技術(shù)的新一代搜索引擎。除了能提供傳統(tǒng)的快速檢索、相關(guān)度排序等功能,還能提供用戶角色登記、用戶興趣自
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 王小正;侯青;;基于Nutch和Solr的基礎(chǔ)教育垂直搜索引擎的實現(xiàn)[J];電腦知識與技術(shù);2012年04期
2 趙凱;王敏;;基于Solr的企業(yè)級搜索引擎的設(shè)計[J];電子世界;2013年22期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 趙永鑫;張友華;辜麗川;胡嘉偉;陳瑩;;基于Nutch的農(nóng)村信息服務(wù)移動垂直搜索引擎研究[J];洛陽理工學(xué)院學(xué)報(自然科學(xué)版);2015年03期
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前8條
1 楊曉江;李麗娟;田俊華;李藝;;面向基礎(chǔ)教育的Web資源垂直服務(wù)體系研究[J];中國遠(yuǎn)程教育;2006年07期
2 丁偉;謝彥峰;張忠林;;一種基于用戶興趣的搜索引擎輸入信息處理方法[J];電腦與信息技術(shù);2008年05期
3 張斌;周爾寧;;基于Nutch的分布式紡織垂直搜索引擎研究[J];電腦知識與技術(shù);2009年21期
4 張敏;;中文垂直搜索引擎研究與實現(xiàn)[J];福建電腦;2010年06期
5 潘濤;梁正友;;Nutch中網(wǎng)頁排序效果的改進(jìn)方法[J];計算機(jī)工程;2010年13期
6 申晉;;基于Lucene和Nutch的林業(yè)垂直搜索引擎的研建[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2008年04期
7 李明濤;羅軍勇;尹美娟;路林;;結(jié)合詞義的文本特征詞權(quán)重計算方法[J];計算機(jī)應(yīng)用;2012年05期
8 王超;李書琴;肖紅;;基于本體的旱區(qū)農(nóng)業(yè)垂直搜索引擎研究[J];農(nóng)機(jī)化研究;2013年08期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 程傳鵬;;一種簡單高效的中文分詞方法[J];鄭州輕工業(yè)學(xué)院學(xué)報;2006年03期
2 張博;姜建國;萬平國;;對互聯(lián)網(wǎng)環(huán)境下中文分詞系統(tǒng)的一種架構(gòu)改進(jìn)[J];計算機(jī)應(yīng)用研究;2006年11期
3 夏新松;肖建國;;一種新的錯誤驅(qū)動學(xué)習(xí)方法在中文分詞中的應(yīng)用[J];計算機(jī)科學(xué);2006年03期
4 周軍;王艷紅;;一種基于詞典的中文分詞法的設(shè)計與實現(xiàn)[J];黑龍江科技信息;2008年25期
5 許高建;胡學(xué)鋼;路遙;王慶人;;一種改進(jìn)的中文分詞歧義消除算法研究[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2008年10期
6 張培穎;;運用有向圖進(jìn)行中文分詞研究[J];計算機(jī)工程與應(yīng)用;2009年22期
7 吳晶晶;荊繼武;聶曉峰;王平建;;一種快速中文分詞詞典機(jī)制[J];中國科學(xué)院研究生院學(xué)報;2009年05期
8 許華;;中文分詞系統(tǒng)設(shè)計之詞典構(gòu)造[J];科技創(chuàng)新導(dǎo)報;2010年20期
9 韓月陽;鄧世昆;賈時銀;李遠(yuǎn)方;;基于字分類的中文分詞的研究[J];計算機(jī)技術(shù)與發(fā)展;2011年07期
10 莫建文;鄭陽;首照宇;張順嵐;;改進(jìn)的基于詞典的中文分詞方法[J];計算機(jī)工程與設(shè)計;2013年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王敏;葉寬余;薛峰;;一種面向網(wǎng)店商品搜索的中文分詞系統(tǒng)設(shè)計[A];全國第22屆計算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2011)暨全國第3屆安全關(guān)鍵技術(shù)與應(yīng)用(SCA·2011)學(xué)術(shù)會議論文摘要集[C];2011年
2 黃昌寧;趙海;;由字構(gòu)詞——中文分詞新方法[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年
3 黃居仁;;瓶頸,挑戰(zhàn),與轉(zhuǎn)機(jī):中文分詞研究的新思維[A];中國計算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
4 任飛亮;石磊;姚天順;;應(yīng)用支持向量機(jī)進(jìn)行中文分詞[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
5 吳晶晶;荊繼武;王平建;;一種基于詞典的新型中文分詞機(jī)制[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(上冊)[C];2007年
6 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細(xì)則[A];第五屆全國語言文字應(yīng)用學(xué)術(shù)研討會論文集[C];2007年
7 修馳;宋柔;;基于“大詞”實例的中文分詞研究[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
8 趙海;揭春雨;;基于子串標(biāo)注的中文分詞:尋找更佳的標(biāo)注單元[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
9 李壽山;黃居仁;;基于詞邊界分類的中文分詞方法[A];中國計算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
10 張梅山;鄧知龍;車萬翔;劉挺;;統(tǒng)計與詞典相結(jié)合的領(lǐng)域自適應(yīng)中文分詞[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前4條
1 本報記者 張彤;讓計算機(jī)說中國話[N];網(wǎng)絡(luò)世界;2004年
2 清華大學(xué)IT可用性實驗室;2005中文搜索引擎質(zhì)量對比[N];計算機(jī)世界;2005年
3 蔡勇邋北京師范大學(xué)珠海分校軟件研究所所長助理;讓中藥查詢省時省力[N];科技日報;2007年
4 記者 楊朝暉;醫(yī)藥搜索:不再“眾里尋他千百度”[N];科技日報;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 修馳;適應(yīng)于不同領(lǐng)域的中文分詞方法研究與實現(xiàn)[D];北京工業(yè)大學(xué);2013年
2 何嘉;基于遺傳算法優(yōu)化的中文分詞研究[D];電子科技大學(xué);2012年
3 李志國;面向分布式文本知識管理的中文分詞與文本分類研究[D];重慶大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 曹衛(wèi)峰;中文分詞關(guān)鍵技術(shù)研究[D];南京理工大學(xué);2009年
2 許順;中文分詞規(guī)范可計算化的研究與實現(xiàn)[D];蘇州大學(xué);2006年
3 王荔;統(tǒng)計全切分中文分詞系統(tǒng)的研究與實現(xiàn)[D];西安電子科技大學(xué);2009年
4 魏博誠;中文分詞交集型歧義處理研究[D];安徽大學(xué);2011年
5 代聰;基于英漢平行語料的中文分詞研究與應(yīng)用[D];大連理工大學(xué);2012年
6 黃翼彪;開源中文分詞器的比較研究[D];鄭州大學(xué);2013年
7 許華婷;基于Active Learning的中文分詞領(lǐng)域自適應(yīng)方法的研究[D];北京交通大學(xué);2015年
8 王為磊;基于多目標(biāo)優(yōu)化的中文分詞模型的研究[D];蘇州大學(xué);2008年
9 王靖;基于機(jī)械切分和標(biāo)注的中文分詞研究[D];湖南大學(xué);2009年
10 劉春輝;基于優(yōu)化最大匹配的中文分詞方法研究[D];燕山大學(xué);2009年
,本文編號:989049
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/989049.html