面向?qū)@畔⒋怪彼阉饕娴臉?gòu)建
本文關(guān)鍵詞:面向?qū)@畔⒋怪彼阉饕娴臉?gòu)建,由筆耕文化傳播整理發(fā)布。
《大連理工大學(xué)》 2013年
面向?qū)@畔⒋怪彼阉饕娴臉?gòu)建
李聰慧
【摘要】:互聯(lián)網(wǎng)的發(fā)展帶來的海量數(shù)據(jù),在為人們提供更多信息資源的同時(shí),如何為用戶準(zhǔn)確提供所需信息,也成為其所要面對(duì)的問題。傳統(tǒng)搜索引擎,例如百度、Google等,功能基本已經(jīng)可以滿足用戶需求,但當(dāng)用戶需要檢索面向某一主題的信息時(shí),這些傳統(tǒng)通用搜索引擎所存在的時(shí)效性差、覆蓋率低、易導(dǎo)致迷航等缺點(diǎn)就會(huì)表現(xiàn)出來;谕ㄓ盟阉饕嫠嬖诘膯栴},垂直搜索引擎成為了搜索引擎發(fā)展的另外一個(gè)方向。 本文首先介紹了垂直搜索引擎的概況,并對(duì)搜索引擎的原理、全文檢索技術(shù),以及中文分詞進(jìn)行了簡(jiǎn)要介紹。而后,本文對(duì)Lucene.net搜索引擎框架的相關(guān)技術(shù)進(jìn)行了剖析,并對(duì)其分詞、索引以及搜索的工作原理進(jìn)行了介紹。在深入理解搜索相關(guān)技術(shù)的基礎(chǔ)上,本文分析設(shè)計(jì)并實(shí)現(xiàn)了面向?qū)@拇怪彼阉饕嫦到y(tǒng),該系統(tǒng)在功能上可劃分為數(shù)據(jù)導(dǎo)入、索引創(chuàng)建和檢索功能。系統(tǒng)通過抓取器獲取數(shù)據(jù),通過索引器對(duì)抓取到的信息進(jìn)行索引并創(chuàng)建索引庫(kù),通過檢索模塊為用戶提供搜索功能。其中索引創(chuàng)建時(shí),采用配置文件對(duì)索引模塊進(jìn)行配置,使系統(tǒng)具有一定的可配置性,同時(shí)采用多線程處理機(jī)制對(duì)數(shù)據(jù)進(jìn)行抓取和索引,提高了索引效率。 本文實(shí)現(xiàn)了“面向?qū)@畔⒌拇怪彼阉饕妗毕到y(tǒng),該系統(tǒng)能夠?yàn)橛脩籼峁⿲I(yè)的專利搜索服務(wù),用戶可以利用系統(tǒng)進(jìn)行專利數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù)、建立專利索引庫(kù),以及對(duì)專利信息進(jìn)行快速檢索和高級(jí)檢索等,從而有效解決了專利檢索時(shí)通用搜索引擎中所存在的問題,為用戶提供了更加精確的檢索功能。
【關(guān)鍵詞】:
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:TP391.3
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購(gòu)買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張輝;吳輝;劉瑞;周剛;;科技資源信息檢索關(guān)鍵技術(shù)[J];北京航空航天大學(xué)學(xué)報(bào);2006年09期
2 王富強(qiáng);王青山;張立朝;朱浩群;王銳;;基于Lucene的數(shù)據(jù)庫(kù)全文信息檢索[J];測(cè)繪科學(xué);2008年03期
3 吳澤彬;魏潔;李蔚清;吳慧中;;面向服務(wù)架構(gòu)的全文檢索研究[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年S1期
4 蘇潭英;郭憲勇;金鑫;;一種基于Lucene的中文全文檢索系統(tǒng)[J];計(jì)算機(jī)工程;2007年23期
5 汲業(yè);陳燕;楊健;慕蓉;;生活服務(wù)領(lǐng)域垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2010年24期
6 張曉衛(wèi);朱巧明;;一種基于Lucene的Web全文信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)與現(xiàn)代化;2006年12期
7 孫玉濤;劉鳳朝;李濱;;基于專利的中歐國(guó)家創(chuàng)新能力與發(fā)展模式比較[J];科學(xué)學(xué)研究;2009年03期
8 李永春;丁華福;;Lucene的全文檢索的研究與應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年02期
9 鄭榕增;林世平;;基于Lucene的中文倒排索引技術(shù)的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年03期
10 唐華姣;何友全;徐小樂;徐澄;;基于Lucene的分布式并行索引[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年02期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 蘇景春;基于Lucene的全文檢索系統(tǒng)的研究與應(yīng)用[D];北京交通大學(xué);2010年
2 張楠;面向汽車主題的垂直搜索引擎研究與實(shí)現(xiàn)[D];西南交通大學(xué);2010年
3 陳航哲;基于Lucene的垂直搜索引擎的研究與應(yīng)用[D];暨南大學(xué);2010年
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 曹一冰;華一新;汪軍;王關(guān)軍;;基于DotLucene的全文檢索及其在GIS中的應(yīng)用[J];測(cè)繪工程;2011年06期
2 蔡兵;胡敏;;基于Lucene2.0的書目搜索引擎設(shè)計(jì)[J];重慶圖情研究;2009年01期
3 苑雪;;網(wǎng)絡(luò)中的安全隱患及對(duì)策[J];產(chǎn)業(yè)與科技論壇;2009年05期
4 周楊;;基于Lucene的小型搜索引擎系統(tǒng)的架構(gòu)與實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2010年11期
5 湯國(guó)鋒;徐振偉;張華熊;;基于Lucene的中文分詞技術(shù)研究[J];電腦編程技巧與維護(hù);2012年10期
6 王軍;張興忠;;XML與全文檢索在CMS數(shù)據(jù)歸檔中的應(yīng)用[J];電腦開發(fā)與應(yīng)用;2012年01期
7 孔維亭;閆宏印;;基于Lucene的自動(dòng)答疑系統(tǒng)的設(shè)計(jì)[J];電腦開發(fā)與應(yīng)用;2012年04期
8 趙剛;冒亞明;劉斌;;基于Oracle和Lucene.net的文檔管理系統(tǒng)[J];電腦知識(shí)與技術(shù);2008年S2期
9 任惠靜;;基于Lucene的面向主題搜索引擎的索引技術(shù)的研究[J];電腦知識(shí)與技術(shù);2010年04期
10 劉磊安;符志強(qiáng);;基于Lucene.net網(wǎng)絡(luò)爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2010年08期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 蘇亮;孫斌;;一種基于Lucene的Hash改進(jìn)中文分詞算法的實(shí)現(xiàn)[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條
1 吳羽;面向時(shí)間敏感對(duì)象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
2 楊玲;基于知識(shí)流動(dòng)的創(chuàng)新活動(dòng)空間分布演化機(jī)理研究[D];大連理工大學(xué);2011年
3 何爽;國(guó)家創(chuàng)新系統(tǒng)國(guó)際化研究[D];上海交通大學(xué);2011年
4 武春光;知識(shí)能力與區(qū)域經(jīng)濟(jì)差異研究[D];大連理工大學(xué);2009年
5 孫玉濤;國(guó)家創(chuàng)新能力成長(zhǎng)機(jī)理研究[D];大連理工大學(xué);2010年
6 盛四輩;系統(tǒng)論視角下的我國(guó)國(guó)家創(chuàng)新體系戰(zhàn)略群演進(jìn)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
7 李鵬;數(shù)字圖書館內(nèi)容管理開源軟件應(yīng)用與評(píng)價(jià)研究[D];吉林大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 徐財(cái)應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進(jìn)[D];長(zhǎng)春理工大學(xué);2010年
2 王有權(quán);基于Web的智能答疑技術(shù)研究與實(shí)現(xiàn)[D];南京財(cái)經(jīng)大學(xué);2010年
3 周月紅;基于Lucene的站內(nèi)搜索引擎的設(shè)計(jì)與開發(fā)[D];華東理工大學(xué);2011年
4 王紅勝;多文檔全文檢索系統(tǒng)的設(shè)計(jì)與開發(fā)[D];電子科技大學(xué);2010年
5 王奕;元數(shù)據(jù)技術(shù)在科技資源數(shù)據(jù)庫(kù)查詢中的應(yīng)用研究[D];石家莊鐵道學(xué)院;2008年
6 王兆宇;個(gè)性化站內(nèi)搜索引擎的設(shè)計(jì)與應(yīng)用[D];東華大學(xué);2011年
7 檀康;基于深度網(wǎng)頁(yè)爬蟲搜索引擎原型的研究和實(shí)現(xiàn)[D];東華大學(xué);2010年
8 張盛蕾;基于Java的浙江紡織服裝學(xué)院校園網(wǎng)搜索引擎[D];電子科技大學(xué);2010年
9 趙彥勝;基于web的無線電監(jiān)測(cè)站遠(yuǎn)程故障診斷系統(tǒng)分析與設(shè)計(jì)[D];西安電子科技大學(xué);2009年
10 馬靜;基于web的數(shù)字化資源全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 曹元大,賀海軍,涂哲明;中文Web文檔全文檢索系統(tǒng)的設(shè)計(jì)及實(shí)現(xiàn)[J];北京理工大學(xué)學(xué)報(bào);2002年01期
2 周新忠;余木良;陶亮;郭朋飛;;關(guān)于地理空間元數(shù)據(jù)技術(shù)發(fā)展趨勢(shì)的理論探討[J];測(cè)繪科學(xué);2007年02期
3 王子彥,陳杰;檢索助力媒體革新[J];中國(guó)傳媒科技;2005年03期
4 劉春輝;金順福;劉國(guó)華;李穎;;基于優(yōu)化最大匹配與統(tǒng)計(jì)結(jié)合的漢語(yǔ)分詞方法[J];燕山大學(xué)學(xué)報(bào);2009年02期
5 余戰(zhàn)秋;中文分詞技術(shù)及其應(yīng)用初探[J];電腦知識(shí)與技術(shù);2004年32期
6 楊堅(jiān)爭(zhēng);李朝平;;垂直搜索引擎及其應(yīng)用[J];電子商務(wù);2006年10期
7 彭波,李曉明;搜索引擎倒排文件的一種分塊組織技術(shù)[J];電子學(xué)報(bào);2005年02期
8 蔡勇智;基于最大匹配分詞算法的中文詞語(yǔ)粗分模型[J];福建電腦;2005年09期
9 譚駿珊;吳惠雄;;一種改進(jìn)整詞二分法的中文分詞詞典設(shè)計(jì)[J];信息技術(shù);2009年05期
10 劉挺,吳巖,王開鑄;最大概率分詞問題及其解法[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);1998年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 吳曉;李丹寧;林潔;冀肖榆;李丹;;個(gè)性化搜索引擎中用戶興趣模型的研究[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 常曉燕;基于Java的新聞搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2004年
2 何勝利;礦山法律法規(guī)全文檢索系統(tǒng)的研究與應(yīng)用[D];西安建筑科技大學(xué);2005年
3 吳海明;基于Lucene的搜索引擎技術(shù)的研究與改進(jìn)[D];暨南大學(xué);2006年
4 王曉偉;垂直搜索引擎若干關(guān)鍵技術(shù)的研究[D];浙江大學(xué);2007年
5 竇亞君;Luder基于內(nèi)容的文檔搜索引擎[D];天津工業(yè)大學(xué);2007年
6 姜華;基于Lucene面向主題搜索引擎的研究與設(shè)計(jì)[D];華東師范大學(xué);2007年
7 劉婷;中文自動(dòng)分詞法在全文檢索中的研究及應(yīng)用[D];南京航空航天大學(xué);2007年
8 陳洪猛;全文檢索技術(shù)的研究與實(shí)現(xiàn)[D];北京工業(yè)大學(xué);2008年
9 劉彤;垂直搜索引擎技術(shù)研究與應(yīng)用[D];西安建筑科技大學(xué);2008年
10 史偉;中文自動(dòng)分詞關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2008年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 莊芯;;風(fēng)投押寶垂直搜索 各方巨頭介入又添疑點(diǎn)[J];IT時(shí)代周刊;2008年01期
2 顧鵬堯;;讓搜索引擎更好地服務(wù)于教育教學(xué)[J];科學(xué)24小時(shí);2003年Z1期
3 陳新顏;垂直搜索引擎辨析[J];現(xiàn)代情報(bào);2004年09期
4 胡文勝;;垂直搜索助號(hào)碼百事通與商務(wù)領(lǐng)航[J];每周電腦報(bào);2006年32期
5 胡潔;丁寧;關(guān)靜;曹福年;張磊;;基于“PUBMED+PDF”的醫(yī)學(xué)垂直搜索引擎的實(shí)踐[J];信息系統(tǒng)工程;2009年05期
6 一林;;垂直搜索:前進(jìn)路上的喜與憂[J];互聯(lián)網(wǎng)天地;2010年02期
7 牟思;;基于垂直搜索引擎的學(xué)校網(wǎng)站的研究與建設(shè)[J];中國(guó)教育技術(shù)裝備;2011年21期
8 田野;垂直搜索火熱為哪般[J];中國(guó)計(jì)算機(jī)用戶;2005年37期
9 胡文勝;;垂直搜索助號(hào)碼百事通與商務(wù)領(lǐng)航[J];每周電腦報(bào);2006年31期
10 邊凱;;你會(huì)搜索嗎?[J];中國(guó)計(jì)算機(jī)用戶;2007年23期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
2 林歡歡;王文杰;史忠植;;移動(dòng)環(huán)境下垂直搜索引擎[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
3 王旭;杜軍平;;質(zhì)檢總局互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)中聚焦爬蟲的研究[A];中國(guó)電子學(xué)會(huì)第十七屆信息論學(xué)術(shù)年會(huì)論文集[C];2010年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;[N];計(jì)算機(jī)世界;2010年
2 王艷;[N];中國(guó)旅游報(bào);2000年
3 賽迪網(wǎng) 方剛;[N];中國(guó)計(jì)算機(jī)報(bào);2000年
4 王靖;[N];人民日?qǐng)?bào)海外版;2000年
5 記者 王滸;[N];中國(guó)旅游報(bào);2009年
6 本報(bào)記者 王宏;[N];中國(guó)計(jì)算機(jī)報(bào);2001年
7 徐瑾 張玉;[N];人民郵電;2009年
8 本報(bào)記者 王曉雁;[N];法制日?qǐng)?bào);2009年
9 記者 吳德群;[N];深圳特區(qū)報(bào);2009年
10 本報(bào)記者 胡鈺;[N];華夏時(shí)報(bào);2009年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
2 吳羽;面向時(shí)間敏感對(duì)象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語(yǔ)義化若干問題的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
4 汲業(yè);面向圖像的垂直搜索引擎關(guān)鍵技術(shù)研究[D];大連海事大學(xué);2013年
5 李傳席;基于本體的自適應(yīng)Web信息抽取方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李春燕;企業(yè)信息垂直搜索引擎的研究與實(shí)現(xiàn)[D];中國(guó)地質(zhì)大學(xué)(北京);2010年
2 齊鵬;垂直搜索引擎分類索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];大連海事大學(xué);2010年
3 張楠;面向汽車主題的垂直搜索引擎研究與實(shí)現(xiàn)[D];西南交通大學(xué);2010年
4 陳向東;寵物用品垂直搜索引擎研究與設(shè)計(jì)[D];西北農(nóng)林科技大學(xué);2010年
5 周佳慶;實(shí)時(shí)垂直搜索引擎數(shù)據(jù)抓取調(diào)度研究[D];浙江大學(xué);2010年
6 華大年;手機(jī)產(chǎn)品信息垂直搜索引擎系統(tǒng)設(shè)計(jì)與開發(fā)[D];武漢理工大學(xué);2011年
7 薛萍;基于教育領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)[D];天津師范大學(xué);2011年
8 馮效棟;垂直搜索引擎技術(shù)在網(wǎng)絡(luò)輿情巡控中的研究與應(yīng)用[D];中國(guó)海洋大學(xué);2010年
9 張贏;個(gè)性化多媒體資源垂直搜索引擎技術(shù)研究[D];華東交通大學(xué);2009年
10 李海升;垂直搜索引擎的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
本文關(guān)鍵詞:面向?qū)@畔⒋怪彼阉饕娴臉?gòu)建,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):66260
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/66260.html