天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向微博的醫(yī)學健康智能搜索的研究與應用

發(fā)布時間:2017-06-06 20:16

  本文關鍵詞:面向微博的醫(yī)學健康智能搜索的研究與應用,,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)的廣泛應用,web上的數(shù)據(jù)信息正在呈指數(shù)級增長,因此,如何在這種海量級的數(shù)據(jù)中查找到目標信息并對其進行自動處理已成為當前重點的研究課題,F(xiàn)在信息速度急劇上升,以微博、微信等新媒體所產生的巨大的碎片化信息極具代表性,新的研究方向是將這些傳統(tǒng)的領域知識與智能技術相結合,從而產生基于海量數(shù)據(jù)的智能搜索引擎。 本文主要介紹web上微博信息的采集與存儲、智能信息檢索的原理及相關算法與實現(xiàn)、數(shù)據(jù)挖掘中聚類算法與應用等。利用新浪微博的API接口按照事先定義好的字段抓取相關內容,將信息批量存入非關系型數(shù)據(jù)庫MongoDB中,利用Lucene4.0工具對MongoDB數(shù)據(jù)庫中已存入的信息建立索引文件并存放在本地,使用carrot2開源框架與建立好的索引文件進行關聯(lián),carrot2是一個庫包,利用它可以建立一個基于聚類的搜索引擎,只要向這個基于聚類的搜索引擎提供搜索關鍵詞即可獲得相關結果集,對返回的結果集使用Lingo聚類算法對其進行聚類操作,給用戶展現(xiàn)樹狀形式的聚類結果圖。通過上述實現(xiàn)的各個模塊,并且伴隨著生物醫(yī)學模式向“生物-心理-社會醫(yī)學”模式轉變以及人們對健康的要求越來越高,人們的認識也從以疾病為中心轉向以患者或人為中心。最終本文建立起面向微博的基于醫(yī)學健康信息的智能搜索系統(tǒng)。 本論文在最后對系統(tǒng)中聚類結果進行了優(yōu)化操作,主要對系統(tǒng)中Lingo聚類算法所引用的字典文件以及停用詞文件進行修正,可以得到優(yōu)化后的聚類結果圖。為了本文中實現(xiàn)的智能搜索引擎系統(tǒng)能夠在未來應用中得到擴展,分析并提出了幾點可以改進的意見,可以使系統(tǒng)在性能和功能上更加健壯、完善。
【關鍵詞】:微博MongoDB 智能信息檢索 carrot2 文本聚類 Lingo算法
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.3
【目錄】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第一章 緒論9-13
  • 1.1 研究背景和研究意義9-10
  • 1.2 研究的現(xiàn)狀和問題的提出10-11
  • 1.2.1 國內外研究現(xiàn)狀10
  • 1.2.2 問題的提出10-11
  • 1.3 研究內容11-12
  • 1.3.1 主要研究內容11
  • 1.3.2 當前研究重點11-12
  • 1.3.3 本文的創(chuàng)新之處12
  • 1.4 論文結構12-13
  • 第二章 關鍵技術的研究13-42
  • 2.1 智能信息檢索的基本原理與組成13-25
  • 2.1.1 概述13
  • 2.1.2 Web信息采集13-14
  • 2.1.3 詞項詞典和文檔分析14-16
  • 2.1.4 索引構建和壓縮16-18
  • 2.1.5 文檔的評分18-20
  • 2.1.6 信息檢索反饋20
  • 2.1.7 聚類算法20-24
  • 2.1.8 Web智能搜索24-25
  • 2.2 微博信息抓取技術的研究25-27
  • 2.2.1 新浪微博概述25-26
  • 2.2.2 新浪微博API接口26-27
  • 2.3 信息存儲技術的研究27-32
  • 2.3.1 海量數(shù)據(jù)介紹27-28
  • 2.3.2 數(shù)據(jù)存儲方式分類28-31
  • 2.3.3 Mongodb數(shù)據(jù)庫的應用31-32
  • 2.4 索引的應用32-35
  • 2.4.1 索引的概念32
  • 2.4.2 Lucene工具32-33
  • 2.4.3 索引的建立33-35
  • 2.5 搜索引擎中聚類算法的研究和應用35-38
  • 2.5.1 聚類介紹35
  • 2.5.2 聚類算法的選擇和應用35-38
  • 2.6 信息搜索技術的研究與應用38-41
  • 2.6.1 搜索的定義38
  • 2.6.2 基于概率搜索的研究38-39
  • 2.6.3 基于語言建模的信息搜索技術的研究39-40
  • 2.6.4 搜索的應用40-41
  • 2.7 本章小結41-42
  • 第三章 智能搜索系統(tǒng)的設計42-49
  • 3.1 智能搜索系統(tǒng)的需求概述42
  • 3.2 智能搜索系統(tǒng)的總體結構設計42-44
  • 3.2.1 總體框架42-43
  • 3.2.2 Carrot2介紹43-44
  • 3.3 智能搜索系統(tǒng)的數(shù)據(jù)存儲設計44-47
  • 3.4 智能搜索系統(tǒng)的開發(fā)和運行環(huán)境47-48
  • 3.5 系統(tǒng)開發(fā)的可行性分析48
  • 3.6 本章小結48-49
  • 第四章 智能搜索系統(tǒng)的實現(xiàn)49-64
  • 4.1 微博信息抓取模塊49-50
  • 4.2 微博信息存儲模塊50-54
  • 4.3 用戶創(chuàng)建索引模塊54-57
  • 4.4 微博信息搜索模塊57-61
  • 4.5 微博信息聚類模塊61-63
  • 4.6 本章小結63-64
  • 第五章 智能搜索系統(tǒng)的性能測試與優(yōu)化64-66
  • 第六章 總結與展望66-68
  • 6.1 課題研究小結66-67
  • 6.2 下一步研究工作展望67-68
  • 參考文獻68-69
  • 致謝69-70
  • 攻讀學位期間發(fā)表的學術論文目錄70

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前6條

1 劉文婷;滕奇志;;后綴樹聚類在專用搜索引擎中的應用研究與改進[J];成都信息工程學院學報;2010年03期

2 李虎;田金文;王緩緩;石勇;;基于Ontology的數(shù)據(jù)庫自然語言查詢接口的研究[J];計算機科學;2010年06期

3 蘇坤,夏旭;搜索引擎分類研究的現(xiàn)狀與發(fā)展[J];圖書館論壇;2005年01期

4 張興華;智能搜索引擎的機理、實現(xiàn)技術及發(fā)展趨勢[J];現(xiàn)代情報;2003年12期

5 雷立異,岳一平;重視醫(yī)院社會屬性,促進醫(yī)院管理模式的轉變[J];西北民族學院學報(自然科學版);2002年02期

6 馬勇;;一種改進的K-means聚類分析算法在醫(yī)院信息系統(tǒng)中的應用研究[J];信息資源管理學報;2012年03期


  本文關鍵詞:面向微博的醫(yī)學健康智能搜索的研究與應用,由筆耕文化傳播整理發(fā)布。



本文編號:427425

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/427425.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶514de***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com