基于多本體的智能搜索引擎模型研究與實現(xiàn)
本文關(guān)鍵詞:基于多本體的智能搜索引擎模型研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。
《首都師范大學(xué)》 2013年
基于多本體的智能搜索引擎模型研究與實現(xiàn)
張燦
【摘要】:隨著近些年來互聯(lián)網(wǎng)的迅猛發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)量呈指數(shù)級的增長,用戶對搜索的需求越來越多迫切。如何在海量的網(wǎng)頁數(shù)據(jù)中準(zhǔn)確、迅速找到用戶期望的結(jié)果,越來越成為搜索引擎領(lǐng)域熱點問題。傳統(tǒng)的基于關(guān)鍵字匹配的搜索引擎技術(shù)顯然已經(jīng)不能夠滿足廣大互聯(lián)網(wǎng)需求。隨著語義網(wǎng)技術(shù)的發(fā)展,本體技術(shù)進(jìn)入人們的視野,基于本體的搜索引擎技術(shù)越來越受到重視。經(jīng)過這些年來的探索發(fā)展,基于單個領(lǐng)域本體的搜索引擎技術(shù)已有所進(jìn)展。然后,在現(xiàn)在互聯(lián)網(wǎng)走向個性化、社區(qū)化的趨勢中,單個網(wǎng)頁資源中包含的概念不僅限于一個領(lǐng)域中,很可能是跨領(lǐng)域的概念實體出現(xiàn)在同一個網(wǎng)頁資源中。所以,我們需要多領(lǐng)域本體支持的搜索引擎技術(shù)來應(yīng)對這一趨勢。 本文主要討論基于多領(lǐng)域本體支持的搜索引擎技術(shù)的框架設(shè)計及相關(guān)技術(shù)。首先,結(jié)合當(dāng)前搜索引擎發(fā)展?fàn)顩r,討論了搜索引擎技術(shù)的核心問題評價標(biāo)準(zhǔn),并在此基礎(chǔ)上分析了搜索引擎未來的八大發(fā)展趨勢。然后,分析和比較了現(xiàn)有的語義標(biāo)注工具和方法,闡述了一般的語義標(biāo)注流程,給出了一種基于多本體支持的語義標(biāo)注工具模型設(shè)計框圖。最后,結(jié)合語義標(biāo)注技術(shù)及傳統(tǒng)的搜索引擎的模型給出了一種基于多本體支持的搜索引擎框架。通過實驗系統(tǒng)的檢驗,并分析了結(jié)果。 該框架分為領(lǐng)域信息的采集、網(wǎng)頁資源的預(yù)處理、元數(shù)據(jù)抽取、元數(shù)據(jù)索引、查詢擴(kuò)展及查詢重排六個模塊。其中,領(lǐng)域信息采集模塊,在傳統(tǒng)的信息采集系統(tǒng)的基礎(chǔ)上,提出了一種動態(tài)判定網(wǎng)頁是否屬于特定領(lǐng)域的采集策略;預(yù)處理模塊主要是實現(xiàn)了網(wǎng)頁去噪、去重等操作,重點討論了網(wǎng)頁去重算法;元數(shù)據(jù)抽取模塊,提出了一種基于XSLT技術(shù)的HTML等結(jié)構(gòu)化文檔的元數(shù)據(jù)抽取策略;元數(shù)據(jù)索引利用倒排索引的技術(shù)將抽取到的元數(shù)據(jù)文檔進(jìn)行索引,為檢索操作打下基礎(chǔ);查詢擴(kuò)展通過對查詢請求進(jìn)行語法、語義兩方面的推理擴(kuò)展;查詢重排,在Lucene開源框架下,綜合鏈接評價、文檔綜合評分基礎(chǔ)上增加了文檔與領(lǐng)域本體的匹配程度三方面因素,提高檢索的查準(zhǔn)率。經(jīng)過試驗系統(tǒng)的試驗檢測,該模型在查全率和查準(zhǔn)率方面優(yōu)于傳統(tǒng)基于關(guān)鍵字檢索模型。
【關(guān)鍵詞】:
【學(xué)位授予單位】:首都師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.1
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 武成崗,焦文品,田啟家,史忠植;基于本體論和多主體的信息檢索服務(wù)器[J];計算機(jī)研究與發(fā)展;2001年06期
2 劉治綱;葉水生;;基于多本體的搜索引擎框架設(shè)計[J];南昌航空大學(xué)學(xué)報(自然科學(xué)版);2011年02期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 沙麗華;面向領(lǐng)域文檔的語義標(biāo)注方法研究[D];吉林大學(xué);2009年
2 于曉繁;基于本體和元數(shù)據(jù)的語義標(biāo)注平臺模型與系統(tǒng)架構(gòu)研究[D];山東理工大學(xué);2012年
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王曉東,高宏卿,張際平;基于Ontology疑難問題答疑系統(tǒng)的設(shè)計與實現(xiàn)[J];電化教育研究;2004年09期
2 袁亮環(huán);;基于本體的智能參考咨詢系統(tǒng)研究[J];電腦知識與技術(shù);2010年16期
3 楊寧;郭雷;方俊;;基于語義的查詢優(yōu)化方法[J];紡織高;A(chǔ)科學(xué)學(xué)報;2011年01期
4 楊曉東;林曉霞;崔孟榮;;基于本體的網(wǎng)絡(luò)信息檢索[J];福建電腦;2006年09期
5 魏桂英;高學(xué)東;武森;;基于領(lǐng)域本體的個性化文本信息檢索[J];遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版);2011年02期
6 羅清磊,章文,李衛(wèi)華;基于本體的Web智能信息Agent[J];廣東工業(yè)大學(xué)學(xué)報;2004年03期
7 張鳳琴;;普適計算中基于本體的上下文感知研究[J];甘肅科技;2009年03期
8 程新榮;楊仁剛;康麗;;基于Ontology的Web信息檢索方法[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期
9 林潔;;基于本體的個性化檢索技術(shù)研究[J];貴州科學(xué);2009年04期
10 馬斌;;基于本體的管理信息系統(tǒng)課程知識表示方法研究[J];電腦開發(fā)與應(yīng)用;2013年08期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 李偉剛;張克亮;王慧蘭;;基于航空領(lǐng)域本體知識庫的語義檢索研究[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
2 孫涌;韋小麗;;領(lǐng)域本體構(gòu)建研究及在專利信息服務(wù)中的應(yīng)用[A];江蘇省系統(tǒng)工程學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
3 陳康;武港山;;基于Ontology的信息檢索技術(shù)研究[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 宋巖;基于多Agent和本體的散雜貨港口集團(tuán)船舶調(diào)度系統(tǒng)研究[D];北京交通大學(xué);2011年
2 楊抒;基于WEB的林產(chǎn)品信息資源整合方法研究[D];北京林業(yè)大學(xué);2011年
3 熊回香;面向Web3.0的大眾分類研究[D];華中師范大學(xué);2011年
4 湯華茂;基于語義的產(chǎn)業(yè)鏈網(wǎng)絡(luò)化協(xié)同設(shè)計模式及關(guān)鍵技術(shù)研究[D];重慶大學(xué);2010年
5 馬沁怡;基于KBE的快速有限元分析方法研究[D];大連理工大學(xué);2011年
6 姚紹文;語義化Web的關(guān)鍵技術(shù)及其應(yīng)用研究[D];電子科技大學(xué);2002年
7 徐振寧;基于本體的Web數(shù)據(jù)語義信息的表示與處理方法研究[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2002年
8 應(yīng)曉敏;面向Internet個性化服務(wù)的用戶建模技術(shù)研究[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2003年
9 王曉東;基于Ontology知識庫系統(tǒng)建模與應(yīng)用研究[D];華東師范大學(xué);2003年
10 李景;本體理論及在農(nóng)業(yè)文獻(xiàn)檢索系統(tǒng)中的應(yīng)用研究——以花卉學(xué)本體建模為例[D];中國科學(xué)院研究生院(文獻(xiàn)情報中心);2004年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 朱利君;基于茶學(xué)領(lǐng)域本體的智能檢索研究[D];安徽農(nóng)業(yè)大學(xué);2010年
2 王娟;基于本體的課程資源管理系統(tǒng)研究[D];江西師范大學(xué);2010年
3 杜海波;本體在醫(yī)療信息檢索系統(tǒng)中的應(yīng)用研究[D];長春工業(yè)大學(xué);2010年
4 李帥;基于語義相似度的查詢擴(kuò)展優(yōu)化[D];杭州電子科技大學(xué);2011年
5 宋慶;基于領(lǐng)域本體的智能檢索技術(shù)應(yīng)用研究[D];中國農(nóng)業(yè)科學(xué)院;2011年
6 申欣;基于語義網(wǎng)的信息檢索研究[D];山東理工大學(xué);2011年
7 劉景波;基于本體的村鎮(zhèn)空間規(guī)劃信息搜索方法研究與實現(xiàn)[D];電子科技大學(xué);2011年
8 張春節(jié);基于規(guī)則的隱私本體推理研究[D];云南大學(xué);2011年
9 王利甫;基于本體的語義檢索在數(shù)字圖書館中的應(yīng)用研究[D];鄭州大學(xué);2011年
10 焦莉;基于本體技術(shù)的積件式教學(xué)系統(tǒng)的研究與設(shè)計[D];江西師范大學(xué);2011年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學(xué)學(xué)報(自然科學(xué)版);2002年05期
2 李向陽;張亞非;;一種基于遺傳算法的語義標(biāo)注[J];電子科技大學(xué)學(xué)報;2007年01期
3 傅賽香,袁鼎榮,黃柏雄,鐘智;基于統(tǒng)計的無詞典分詞方法[J];廣西科學(xué)院學(xué)報;2002年04期
4 劉群,張華平,俞鴻魁,程學(xué)旗;基于層疊隱馬模型的漢語詞法分析[J];計算機(jī)研究與發(fā)展;2004年08期
5 吳勝遠(yuǎn);一種漢語分詞方法[J];計算機(jī)研究與發(fā)展;1996年04期
6 高研博;趙京雷;陸汝占;;基于自動模板方法的漢語語義標(biāo)注[J];計算機(jī)工程與應(yīng)用;2008年07期
7 尹奇韡;李善平;;語義Web語言DAML+OIL及其應(yīng)用初探[J];計算機(jī)科學(xué);2003年01期
8 胡鶴,劉大有,王生生;Web本體語言O(shè)WL[J];計算機(jī)工程;2004年12期
9 潘宇斌,陳躍新;基于Ontology的自然語言理解[J];計算技術(shù)與自動化;2003年04期
10 殷建平;漢語自動分詞方法[J];計算機(jī)工程與科學(xué);1998年03期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 劉海學(xué);基于語義標(biāo)注的元數(shù)據(jù)自動構(gòu)建及其相關(guān)技術(shù)研究[D];華東師范大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 熊榮東;結(jié)合WordNet的領(lǐng)域語義標(biāo)注研究[D];重慶大學(xué);2011年
2 羅旋;基于復(fù)句領(lǐng)域本體的語義標(biāo)注方法研究[D];華中師范大學(xué);2006年
3 毛平;基于領(lǐng)域本體的文本信息語義檢索研究[D];南京理工大學(xué);2007年
4 湯煒;基于OWL的語義檢索系統(tǒng)的研究與應(yīng)用[D];武漢理工大學(xué);2009年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 徐險峰;;網(wǎng)絡(luò)信息檢索搜索引擎技術(shù)及發(fā)展趨勢[J];江西圖書館學(xué)刊;2005年04期
2 韓進(jìn)軍;安園園;;搜索引擎的未來發(fā)展[J];醫(yī)學(xué)信息學(xué)雜志;2007年05期
3 劉冰;胡風(fēng)華;;知識庫系統(tǒng)在智能搜索引擎中的應(yīng)用[J];光盤技術(shù);2009年02期
4 康桂英,張帆,劉春平;新一代智能搜索引擎網(wǎng)典研究[J];情報理論與實踐;2000年03期
5 袁淵;;搜索引擎關(guān)鍵技術(shù)及展望[J];湖北財經(jīng)高等專科學(xué)校學(xué)報;2006年05期
6 劉志娟;;虛擬參考咨詢與搜索引擎的結(jié)合——智能搜索引擎誕生[J];圖書情報論壇;2008年03期
7 王挺;;智能搜索引擎在企業(yè)人力資源管理決策支持系統(tǒng)中的應(yīng)用[J];電腦知識與技術(shù);2010年24期
8 劉志娟;黃立冬;;虛擬參考咨詢與搜索引擎結(jié)合——智能搜索引擎的誕生[J];科技情報開發(fā)與經(jīng)濟(jì);2008年25期
9 胡風(fēng)華;劉冰;;基于知識庫系統(tǒng)的智能搜索引擎研究[J];電腦知識與技術(shù);2009年11期
10 劉成亮;韓海偉;;知識庫系統(tǒng)的原理及其在智能搜索引擎中的應(yīng)用[J];電腦知識與技術(shù);2008年08期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 田田;馬軍;李躍軍;;應(yīng)用多本體進(jìn)行信息檢索的研究[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年
2 車萬翔;劉挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然語言理解與機(jī)器翻譯——全國第六屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2001年
3 韓近強(qiáng);趙靜;楊冬青;唐世渭;姚小波;;基于領(lǐng)域知識的網(wǎng)頁篩選系統(tǒng)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2002年
4 王曉峰;劉惟一;;從用戶需求到網(wǎng)頁集團(tuán)的模糊變換[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2003年
5 吳倩;楊逍;張兆心;;基于視覺特征的網(wǎng)頁信息提取[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
6 羅陽;季鐸;張桂平;王瑩瑩;;面向單一網(wǎng)頁的雙語資源挖掘方法[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
7 張貫虹;烏達(dá)巴拉;鞏政;;基于向量空間模型的網(wǎng)頁文本句子對齊方法研究[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
8 趙玉芳;張一鳴;;基于網(wǎng)頁信息的印象形成的初步研究[A];第十屆全國心理學(xué)學(xué)術(shù)大會論文摘要集[C];2005年
9 張陽;李戰(zhàn)懷;近藤廣幸;;WEB PAGE的自動分類[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年
10 馮玉才;胡剛;陳勝;蔡詔;向隆剛;李東;;大能量轉(zhuǎn)換系統(tǒng)遠(yuǎn)程實時數(shù)據(jù)庫設(shè)計與實現(xiàn)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2002年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 惠曉霜;[N];新華每日電訊;2009年
2 本報記者 蔣崢;[N];經(jīng)濟(jì)日報;2000年
3 王旭;[N];計算機(jī)世界;2001年
4 陸元婕;[N];中國計算機(jī)報;2001年
5 朱艷燕;[N];中華工商時報;2004年
6 壯壯;[N];電腦報;2004年
7 錢峻英;[N];光明日報;2004年
8 本報記者 張彤;[N];網(wǎng)絡(luò)世界;2003年
9 王宏亮;[N];經(jīng)濟(jì)視點報;2005年
10 張秋;[N];中國郵政報;2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳治平;智能搜索引擎理論與應(yīng)用研究[D];湖南大學(xué);2003年
2 劉竟;面向概念檢索的農(nóng)史信息門戶的設(shè)計與構(gòu)建[D];南京農(nóng)業(yè)大學(xué);2008年
3 陳潔;基于概念融合的網(wǎng)頁篩選技術(shù)研究[D];北京郵電大學(xué);2013年
4 焦斌星;用于搜索的網(wǎng)頁可視化摘要技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2012年
5 米楊;基于頂級本體整合的醫(yī)學(xué)領(lǐng)域語義標(biāo)注研究[D];吉林大學(xué);2012年
6 孟憲軍;互聯(lián)網(wǎng)文本聚類與檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2009年
7 張長利;面向特定領(lǐng)域的互聯(lián)網(wǎng)輿情分析技術(shù)研究[D];吉林大學(xué);2011年
8 王镠璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年
9 劉守群;海量網(wǎng)絡(luò)視頻快速檢索關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2010年
10 黃河;農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究及實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張燦;基于多本體的智能搜索引擎模型研究與實現(xiàn)[D];首都師范大學(xué);2013年
2 孟驍;基于語義網(wǎng)絡(luò)的智能搜索引擎研究[D];東北師范大學(xué);2011年
3 雷豐云;智能搜索引擎的理論分析與應(yīng)用研究[D];中南大學(xué);2007年
4 李振振;基于本體的智能搜索引擎研究與應(yīng)用[D];青島科技大學(xué);2010年
5 張騫;傳統(tǒng)搜索引擎與智能搜索引擎比較研究[D];鄭州大學(xué);2012年
6 楊延錕;面向油田信息服務(wù)的智能搜索引擎研究與應(yīng)用[D];大慶石油學(xué)院;2010年
7 李娟;數(shù)據(jù)挖掘技術(shù)在智能搜索引擎中的應(yīng)用[D];長春理工大學(xué);2010年
8 朱素媛;網(wǎng)絡(luò)教育中的智能搜索引擎的研究[D];合肥工業(yè)大學(xué);2004年
9 張明遠(yuǎn);基于粒計算的智能搜索引擎技術(shù)研究[D];武漢理工大學(xué);2010年
10 于洪波;中文網(wǎng)頁自動采集與分類系統(tǒng)設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2010年
本文關(guān)鍵詞:基于多本體的智能搜索引擎模型研究與實現(xiàn),,由筆耕文化傳播整理發(fā)布。
本文編號:61330
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/61330.html