天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

醫(yī)學(xué)文獻(xiàn)相似性研究

發(fā)布時(shí)間:2021-10-24 07:34
  科學(xué)技術(shù)突飛猛進(jìn)的發(fā)展使得科學(xué)領(lǐng)域的每一項(xiàng)技術(shù)都有日新月異的變化。隨之產(chǎn)生的則是海量的數(shù)據(jù)信息,而計(jì)算機(jī)技術(shù)的發(fā)展為其創(chuàng)造了新的存儲(chǔ)方式一數(shù)據(jù)庫(kù)。而不同的時(shí)代會(huì)有不同的結(jié)構(gòu)的數(shù)據(jù),如何把這些異構(gòu)數(shù)據(jù)統(tǒng)一成一個(gè)易查詢的數(shù)據(jù)庫(kù),已經(jīng)越來(lái)越成為人們關(guān)注的焦點(diǎn)。國(guó)內(nèi)外相繼涌現(xiàn)出了大量的文獻(xiàn)數(shù)據(jù)庫(kù),如:MEDLINE、中文科技期刊數(shù)據(jù)庫(kù)、中國(guó)期刊網(wǎng)等,充分顯示出人們對(duì)信息檢索問(wèn)題的重視。雖然數(shù)據(jù)庫(kù)資源異常豐富,檢索文獻(xiàn)的手段多種多樣,但是檢索結(jié)果的正確性和準(zhǔn)確性卻往往因檢索出很多無(wú)關(guān)的文獻(xiàn)而不盡如人意。因而,提高檢索效率、正確性及相關(guān)性已經(jīng)成為檢索領(lǐng)域迫切需要解決的問(wèn)題。本文針對(duì)上述兩個(gè)問(wèn)題,以各種形式的醫(yī)學(xué)文檔信息數(shù)據(jù)為基礎(chǔ),設(shè)計(jì)出一個(gè)基于關(guān)系數(shù)據(jù)庫(kù)模型的異構(gòu)數(shù)據(jù)存儲(chǔ)方案,該方案統(tǒng)一了異構(gòu)數(shù)據(jù);并在此數(shù)據(jù)庫(kù)基礎(chǔ)上,利用后綴樹(shù)向量空間模型(VSM),為每篇文獻(xiàn)建立相應(yīng)的基于內(nèi)容的向量模型,通過(guò)計(jì)算夾角的余弦值得出文獻(xiàn)之間的相似度,最終構(gòu)建一個(gè)醫(yī)學(xué)文獻(xiàn)相關(guān)性數(shù)據(jù)庫(kù)。接著,以醫(yī)學(xué)文獻(xiàn)的相似性研究為出發(fā)點(diǎn),從搜集數(shù)據(jù)、整理數(shù)據(jù)、處理數(shù)據(jù)直到為用戶提供檢索接口,最終構(gòu)建了一個(gè)“醫(yī)學(xué)文獻(xiàn)信息檢索系統(tǒng)”。本... 

【文章來(lái)源】:首都師范大學(xué)北京市

【文章頁(yè)數(shù)】:59 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

醫(yī)學(xué)文獻(xiàn)相似性研究


系統(tǒng)設(shè)計(jì)過(guò)程

流程圖,流程,中英文,中介


圖2一2系統(tǒng)主要流程2.IJ系統(tǒng)流程如圖2一2所示,系統(tǒng)分為兩個(gè)部分:(1)數(shù)據(jù)處理部分,(2)系統(tǒng)功能部分。其中數(shù)據(jù)處理部分又可以分為兩個(gè)部分:(1)數(shù)據(jù)的導(dǎo)入;(2)相關(guān)性計(jì)算。系統(tǒng)功能部分在下2.2節(jié)中介紹,有關(guān)相關(guān)性的具體計(jì)算將在第四章中介紹。數(shù)據(jù)處理部分:如圖2一3所示,異構(gòu)數(shù)據(jù)分為三個(gè)部分,第一部分是中英文XML文獻(xiàn),第二部分是中英文DBF文獻(xiàn),第三部分是EXCEL文檔,最終將三者統(tǒng)一導(dǎo)入到 MssQLservcr數(shù)據(jù)庫(kù)HcaithyGuide中。其中

計(jì)算流程,DBF數(shù)據(jù)庫(kù),中英文,異構(gòu)數(shù)據(jù)


紹系統(tǒng)的主要功能及其子功能。2.2.1導(dǎo)入異構(gòu)數(shù)據(jù)如圖2一4所示,數(shù)據(jù)導(dǎo)入部分,可以導(dǎo)入XML,中英文DBF數(shù)據(jù)庫(kù),Exeel數(shù)據(jù)表等。導(dǎo)入的過(guò)程中如果發(fā)現(xiàn)數(shù)據(jù)有異常,可以及時(shí)清理數(shù)據(jù)。

【參考文獻(xiàn)】:
期刊論文
[1]向量空間模型在醫(yī)學(xué)文獻(xiàn)相關(guān)性研究中的應(yīng)用[J]. 邱宇紅,郭繼軍.  現(xiàn)代圖書情報(bào)技術(shù). 2007(07)
[2]基于后綴樹(shù)的骨干網(wǎng)絡(luò)垃圾郵件檢測(cè)方法[J]. 鄭耀東,譚建龍,郭莉.  計(jì)算機(jī)工程與應(yīng)用. 2006(28)
[3]向量空間模型信息檢索技術(shù)討論[J]. 劉斌,陳樺.  情報(bào)雜志. 2006(07)
[4]基于后綴樹(shù)模型的文本實(shí)時(shí)分類系統(tǒng)的研究和實(shí)現(xiàn)[J]. 郭莉,張吉,譚建龍.  中文信息學(xué)報(bào). 2005(05)
[5]基于向量空間模型的信息檢索系統(tǒng)的設(shè)計(jì)[J]. 包金龍.  情報(bào)雜志. 2005(07)
[6]基于N元漢字串模型的文本表示和實(shí)時(shí)分類的研究與實(shí)現(xiàn)[J]. 王映,常毅,譚建龍,白碩.  計(jì)算機(jī)工程與應(yīng)用. 2005(05)
[7]基于規(guī)則的自動(dòng)分類在文本分類中的應(yīng)用[J]. 李渝勤,孫麗華.  中文信息學(xué)報(bào). 2004(04)
[8]基于向量空間模型的文本自動(dòng)分類系統(tǒng)的研究與實(shí)現(xiàn)[J]. 龐劍鋒,卜東波,白碩.  計(jì)算機(jī)應(yīng)用研究. 2001(09)
[9]獨(dú)立于語(yǔ)種的文本分類方法[J]. 黃萱菁,吳立德,石崎洋之,徐國(guó)偉.  中文信息學(xué)報(bào). 2000(06)
[10]文檔中詞語(yǔ)權(quán)重計(jì)算方法的改進(jìn)[J]. 魯松,李曉黎,白碩,王實(shí).  中文信息學(xué)報(bào). 2000(06)

碩士論文
[1]基于Agent專業(yè)搜索引擎的研究[D]. 鄒慶欣.大連海事大學(xué) 2008
[2]專業(yè)搜索引擎的數(shù)據(jù)存儲(chǔ)研究[D]. 陳小峰.南京師范大學(xué) 2007
[3]中國(guó)生物醫(yī)學(xué)工程文獻(xiàn)相關(guān)性數(shù)據(jù)庫(kù)建設(shè)研究[D]. 萬(wàn)莉莉.中國(guó)協(xié)和醫(yī)科大學(xué) 2007
[4]搜索引擎中的數(shù)據(jù)存儲(chǔ)問(wèn)題研究[D]. 何華.浙江大學(xué) 2005



本文編號(hào):3454863

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/3454863.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶511a0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com