基于WEB的學科資源垂直搜索引擎的設計與實現
發(fā)布時間:2021-02-02 20:48
隨著Internet技術和應用的飛速發(fā)展,Web上的信息資源量正在快速增加。其中存在著大量的對教學和科研具有參考價值的學科資源,它們?yōu)閷W校的教學和科研帶來了極大的便利。但是,通過像Google、Baidu等這樣的通用搜索引擎在海量的、異構的網絡信息資源中來檢索某一具體學科資源時,往往不能快速準確的找到有價值的專業(yè)信息。垂直搜索引擎就正好滿足了這種需求,它是面向某一個領域的專業(yè)搜索引擎,它可以為用戶提供高質量的學科資源。本文以教育技術學學科資源為例。在對搜索引擎方法的研究分析和算法實現的基礎上,提出了幾點改進方法,并據此初步構建出了一個基于WEB的學科資源垂直搜索引擎的體系結構。然后按照該體系結構的設計,對其中較為重要的模塊部分進行了詳細的解釋說明。并且在此基礎上,通過運用擴展開源組件Lucene、 Heritrix以及本體和文本分類技術實現了該系統(tǒng)。其目的是幫助廣大學科領域里的用戶快速精準的查詢學科領域資源。本文主要進行的工作如下:(1)研究垂直搜索引擎的相關理論,并對垂直搜索引擎的總體架構進行分析。(2)基于WEB的學科資源垂直搜索引擎系統(tǒng)的關鍵問題研究:構建學科資源本體,并將本體應...
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 研究現狀
1.2.1 學科資源導航庫研究現狀
1.2.2 垂直搜索引擎研究現狀
1.2.3 存在的問題
1.3 論文主要工作
1.4 論文組織結構
2 垂直搜索引擎的相關理論概述
2.1 搜索引擎的內涵
2.1.1 搜索引擎是什么
2.1.2 搜索引擎的分類
2.2 垂直搜索引擎
2.2.1 垂直搜索引擎的產生
2.2.2 垂直搜索引擎系統(tǒng)總體架構
2.3 垂直搜索引擎系統(tǒng)開發(fā)相關開源組件
2.3.1 Lucene概述
2.3.2 Heritrix介紹
2.4 本章小結
3 基于WEB的學科資源垂直搜索引擎關鍵問題研究
3.1 學科資源本體的概述與構建
3.1.1 學科資源本體相關理論概述
3.1.2 學科資源本體的構建
3.2 文本分類
3.2.1 文本分類概述
3.2.2 文本分類的實現
3.3 信息過濾
3.3.1 信息過濾概述
3.3.2 信息過濾的實現
3.4 檢索結果的可視化
3.4.1 可視化及Jena概述
3.4.2 檢索結果可視化的實現
3.5 本章小結
4 基于WEB的學科資源垂直搜索引擎的設計
4.1 設計思路
4.2 系統(tǒng)體系結構
4.3 功能模塊設計
4.3.1 信息采集模塊
4.3.2 信息抽取模塊
4.3.3 文本分類模塊
4.3.4 索引模塊
4.3.5 檢索模塊
4.3.6 信息過濾模塊
4.4 數據庫設計
4.5 本章小結
5 基于WEB的學科資源垂直搜索引擎的實現
5.1 開發(fā)環(huán)境
5.2 主要功能模塊實現
5.2.1 信息采集模塊的實現
5.2.2 信息抽取模塊的實現
5.2.3 索引模塊的實現
5.2.4 檢索模塊的實現
5.3 系統(tǒng)測試與總結
5.3.1 測試環(huán)境
5.3.2 信息采集模塊測試
5.3.3 信息抽取模塊測試
5.3.4 索引模塊測試
5.3.5 檢索模塊測試
5.3.6 系統(tǒng)總結與評價
5.4 本章小結
6 總結與展望
6.1 本文總結
6.2 問題與展望
參考文獻
論文項目資助、攻讀學位期間參與項目
致謝
【參考文獻】:
期刊論文
[1]農業(yè)高校圖書館重點學科資源導航庫的構建及問題探討——以東北農業(yè)大學農業(yè)學科資源導航系統(tǒng)為例[J]. 齊紅,陶和林. 農業(yè)圖書情報學刊. 2011(11)
[2]Heritrix在垂直搜索引擎中的應用[J]. 白萬民,蘇希樂. 計算機時代. 2011(09)
[3]面向主題的垂直搜索引擎系統(tǒng)的研究與實現[J]. 施佺,王恒山,肖仰華,丁衛(wèi)平. 微電子學與計算機. 2011(07)
[4]基于DOM的動態(tài)網頁信息抽取方法[J]. 王平根. 科技信息. 2010(31)
[5]垂直搜索引擎的研究與設計[J]. 劉運強. 計算機應用與軟件. 2010(07)
[6]基于Lucene全文檢索引擎的研究與實現[J]. 胡繼鈞. 科技創(chuàng)新導報. 2010(20)
[7]農業(yè)搜索引擎的發(fā)展現狀及關鍵技術研究[J]. 彭玉容,楊捧,高媛. 安徽農業(yè)科學. 2010(20)
[8]基于分類的智能搜索引擎研究與實現[J]. 程傳鵬. 中原工學院學報. 2010(03)
[9]基于語義查詢擴展的垂直搜索研究[J]. 趙建偉,鄭誠,吳永俊. 計算機工程. 2010(12)
[10]面向計算機教育資源的垂直搜索引擎系統(tǒng)的設計[J]. 李廣麗,張紅斌. 情報理論與實踐. 2010(05)
博士論文
[1]文本分類及其相關技術研究[D]. 尚文倩.北京交通大學 2007
碩士論文
[1]基于領域本體的智能檢索技術應用研究[D]. 宋慶.中國農業(yè)科學院 2011
[2]面向領域的垂直搜索引擎的研究與實現[D]. 邱偉林.大連海事大學 2011
[3]專家信息垂直搜索引擎關鍵技術研究與實現[D]. 劉邵斌.中南大學 2010
[4]數據挖掘可視化技術的研究與實現[D]. 鄭宏.西安電子科技大學 2010
[5]中醫(yī)臨床診療垂直搜索系統(tǒng)研究[D]. 莊力.北京交通大學 2009
[6]基于Lucene的垂直搜索引擎關鍵技術的研究應用[D]. 劉朋.武漢理工大學 2009
[7]基于本體的交通導航數據語義查詢研究[D]. 王慶連.大連海事大學 2009
[8]面向學科的基礎教育資源垂直搜索引擎的研究與實現[D]. 翟曉玲.東北師范大學 2009
[9]基于本體的垂直搜索引擎研究[D]. 劉興濤.山東大學 2009
[10]基于本體的垂直搜索系統(tǒng)的設計與實現[D]. 孔楠.北京交通大學 2008
本文編號:3015348
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 研究現狀
1.2.1 學科資源導航庫研究現狀
1.2.2 垂直搜索引擎研究現狀
1.2.3 存在的問題
1.3 論文主要工作
1.4 論文組織結構
2 垂直搜索引擎的相關理論概述
2.1 搜索引擎的內涵
2.1.1 搜索引擎是什么
2.1.2 搜索引擎的分類
2.2 垂直搜索引擎
2.2.1 垂直搜索引擎的產生
2.2.2 垂直搜索引擎系統(tǒng)總體架構
2.3 垂直搜索引擎系統(tǒng)開發(fā)相關開源組件
2.3.1 Lucene概述
2.3.2 Heritrix介紹
2.4 本章小結
3 基于WEB的學科資源垂直搜索引擎關鍵問題研究
3.1 學科資源本體的概述與構建
3.1.1 學科資源本體相關理論概述
3.1.2 學科資源本體的構建
3.2 文本分類
3.2.1 文本分類概述
3.2.2 文本分類的實現
3.3 信息過濾
3.3.1 信息過濾概述
3.3.2 信息過濾的實現
3.4 檢索結果的可視化
3.4.1 可視化及Jena概述
3.4.2 檢索結果可視化的實現
3.5 本章小結
4 基于WEB的學科資源垂直搜索引擎的設計
4.1 設計思路
4.2 系統(tǒng)體系結構
4.3 功能模塊設計
4.3.1 信息采集模塊
4.3.2 信息抽取模塊
4.3.3 文本分類模塊
4.3.4 索引模塊
4.3.5 檢索模塊
4.3.6 信息過濾模塊
4.4 數據庫設計
4.5 本章小結
5 基于WEB的學科資源垂直搜索引擎的實現
5.1 開發(fā)環(huán)境
5.2 主要功能模塊實現
5.2.1 信息采集模塊的實現
5.2.2 信息抽取模塊的實現
5.2.3 索引模塊的實現
5.2.4 檢索模塊的實現
5.3 系統(tǒng)測試與總結
5.3.1 測試環(huán)境
5.3.2 信息采集模塊測試
5.3.3 信息抽取模塊測試
5.3.4 索引模塊測試
5.3.5 檢索模塊測試
5.3.6 系統(tǒng)總結與評價
5.4 本章小結
6 總結與展望
6.1 本文總結
6.2 問題與展望
參考文獻
論文項目資助、攻讀學位期間參與項目
致謝
【參考文獻】:
期刊論文
[1]農業(yè)高校圖書館重點學科資源導航庫的構建及問題探討——以東北農業(yè)大學農業(yè)學科資源導航系統(tǒng)為例[J]. 齊紅,陶和林. 農業(yè)圖書情報學刊. 2011(11)
[2]Heritrix在垂直搜索引擎中的應用[J]. 白萬民,蘇希樂. 計算機時代. 2011(09)
[3]面向主題的垂直搜索引擎系統(tǒng)的研究與實現[J]. 施佺,王恒山,肖仰華,丁衛(wèi)平. 微電子學與計算機. 2011(07)
[4]基于DOM的動態(tài)網頁信息抽取方法[J]. 王平根. 科技信息. 2010(31)
[5]垂直搜索引擎的研究與設計[J]. 劉運強. 計算機應用與軟件. 2010(07)
[6]基于Lucene全文檢索引擎的研究與實現[J]. 胡繼鈞. 科技創(chuàng)新導報. 2010(20)
[7]農業(yè)搜索引擎的發(fā)展現狀及關鍵技術研究[J]. 彭玉容,楊捧,高媛. 安徽農業(yè)科學. 2010(20)
[8]基于分類的智能搜索引擎研究與實現[J]. 程傳鵬. 中原工學院學報. 2010(03)
[9]基于語義查詢擴展的垂直搜索研究[J]. 趙建偉,鄭誠,吳永俊. 計算機工程. 2010(12)
[10]面向計算機教育資源的垂直搜索引擎系統(tǒng)的設計[J]. 李廣麗,張紅斌. 情報理論與實踐. 2010(05)
博士論文
[1]文本分類及其相關技術研究[D]. 尚文倩.北京交通大學 2007
碩士論文
[1]基于領域本體的智能檢索技術應用研究[D]. 宋慶.中國農業(yè)科學院 2011
[2]面向領域的垂直搜索引擎的研究與實現[D]. 邱偉林.大連海事大學 2011
[3]專家信息垂直搜索引擎關鍵技術研究與實現[D]. 劉邵斌.中南大學 2010
[4]數據挖掘可視化技術的研究與實現[D]. 鄭宏.西安電子科技大學 2010
[5]中醫(yī)臨床診療垂直搜索系統(tǒng)研究[D]. 莊力.北京交通大學 2009
[6]基于Lucene的垂直搜索引擎關鍵技術的研究應用[D]. 劉朋.武漢理工大學 2009
[7]基于本體的交通導航數據語義查詢研究[D]. 王慶連.大連海事大學 2009
[8]面向學科的基礎教育資源垂直搜索引擎的研究與實現[D]. 翟曉玲.東北師范大學 2009
[9]基于本體的垂直搜索引擎研究[D]. 劉興濤.山東大學 2009
[10]基于本體的垂直搜索系統(tǒng)的設計與實現[D]. 孔楠.北京交通大學 2008
本文編號:3015348
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3015348.html