醫(yī)學(xué)文獻(xiàn)相似性研究
發(fā)布時(shí)間:2021-10-24 07:34
科學(xué)技術(shù)突飛猛進(jìn)的發(fā)展使得科學(xué)領(lǐng)域的每一項(xiàng)技術(shù)都有日新月異的變化。隨之產(chǎn)生的則是海量的數(shù)據(jù)信息,而計(jì)算機(jī)技術(shù)的發(fā)展為其創(chuàng)造了新的存儲(chǔ)方式一數(shù)據(jù)庫(kù)。而不同的時(shí)代會(huì)有不同的結(jié)構(gòu)的數(shù)據(jù),如何把這些異構(gòu)數(shù)據(jù)統(tǒng)一成一個(gè)易查詢的數(shù)據(jù)庫(kù),已經(jīng)越來(lái)越成為人們關(guān)注的焦點(diǎn)。國(guó)內(nèi)外相繼涌現(xiàn)出了大量的文獻(xiàn)數(shù)據(jù)庫(kù),如:MEDLINE、中文科技期刊數(shù)據(jù)庫(kù)、中國(guó)期刊網(wǎng)等,充分顯示出人們對(duì)信息檢索問(wèn)題的重視。雖然數(shù)據(jù)庫(kù)資源異常豐富,檢索文獻(xiàn)的手段多種多樣,但是檢索結(jié)果的正確性和準(zhǔn)確性卻往往因檢索出很多無(wú)關(guān)的文獻(xiàn)而不盡如人意。因而,提高檢索效率、正確性及相關(guān)性已經(jīng)成為檢索領(lǐng)域迫切需要解決的問(wèn)題。本文針對(duì)上述兩個(gè)問(wèn)題,以各種形式的醫(yī)學(xué)文檔信息數(shù)據(jù)為基礎(chǔ),設(shè)計(jì)出一個(gè)基于關(guān)系數(shù)據(jù)庫(kù)模型的異構(gòu)數(shù)據(jù)存儲(chǔ)方案,該方案統(tǒng)一了異構(gòu)數(shù)據(jù);并在此數(shù)據(jù)庫(kù)基礎(chǔ)上,利用后綴樹(shù)向量空間模型(VSM),為每篇文獻(xiàn)建立相應(yīng)的基于內(nèi)容的向量模型,通過(guò)計(jì)算夾角的余弦值得出文獻(xiàn)之間的相似度,最終構(gòu)建一個(gè)醫(yī)學(xué)文獻(xiàn)相關(guān)性數(shù)據(jù)庫(kù)。接著,以醫(yī)學(xué)文獻(xiàn)的相似性研究為出發(fā)點(diǎn),從搜集數(shù)據(jù)、整理數(shù)據(jù)、處理數(shù)據(jù)直到為用戶提供檢索接口,最終構(gòu)建了一個(gè)“醫(yī)學(xué)文獻(xiàn)信息檢索系統(tǒng)”。本...
【文章來(lái)源】:首都師范大學(xué)北京市
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
系統(tǒng)設(shè)計(jì)過(guò)程
圖2一2系統(tǒng)主要流程2.IJ系統(tǒng)流程如圖2一2所示,系統(tǒng)分為兩個(gè)部分:(1)數(shù)據(jù)處理部分,(2)系統(tǒng)功能部分。其中數(shù)據(jù)處理部分又可以分為兩個(gè)部分:(1)數(shù)據(jù)的導(dǎo)入;(2)相關(guān)性計(jì)算。系統(tǒng)功能部分在下2.2節(jié)中介紹,有關(guān)相關(guān)性的具體計(jì)算將在第四章中介紹。數(shù)據(jù)處理部分:如圖2一3所示,異構(gòu)數(shù)據(jù)分為三個(gè)部分,第一部分是中英文XML文獻(xiàn),第二部分是中英文DBF文獻(xiàn),第三部分是EXCEL文檔,最終將三者統(tǒng)一導(dǎo)入到 MssQLservcr數(shù)據(jù)庫(kù)HcaithyGuide中。其中
紹系統(tǒng)的主要功能及其子功能。2.2.1導(dǎo)入異構(gòu)數(shù)據(jù)如圖2一4所示,數(shù)據(jù)導(dǎo)入部分,可以導(dǎo)入XML,中英文DBF數(shù)據(jù)庫(kù),Exeel數(shù)據(jù)表等。導(dǎo)入的過(guò)程中如果發(fā)現(xiàn)數(shù)據(jù)有異常,可以及時(shí)清理數(shù)據(jù)。
【參考文獻(xiàn)】:
期刊論文
[1]向量空間模型在醫(yī)學(xué)文獻(xiàn)相關(guān)性研究中的應(yīng)用[J]. 邱宇紅,郭繼軍. 現(xiàn)代圖書情報(bào)技術(shù). 2007(07)
[2]基于后綴樹(shù)的骨干網(wǎng)絡(luò)垃圾郵件檢測(cè)方法[J]. 鄭耀東,譚建龍,郭莉. 計(jì)算機(jī)工程與應(yīng)用. 2006(28)
[3]向量空間模型信息檢索技術(shù)討論[J]. 劉斌,陳樺. 情報(bào)雜志. 2006(07)
[4]基于后綴樹(shù)模型的文本實(shí)時(shí)分類系統(tǒng)的研究和實(shí)現(xiàn)[J]. 郭莉,張吉,譚建龍. 中文信息學(xué)報(bào). 2005(05)
[5]基于向量空間模型的信息檢索系統(tǒng)的設(shè)計(jì)[J]. 包金龍. 情報(bào)雜志. 2005(07)
[6]基于N元漢字串模型的文本表示和實(shí)時(shí)分類的研究與實(shí)現(xiàn)[J]. 王映,常毅,譚建龍,白碩. 計(jì)算機(jī)工程與應(yīng)用. 2005(05)
[7]基于規(guī)則的自動(dòng)分類在文本分類中的應(yīng)用[J]. 李渝勤,孫麗華. 中文信息學(xué)報(bào). 2004(04)
[8]基于向量空間模型的文本自動(dòng)分類系統(tǒng)的研究與實(shí)現(xiàn)[J]. 龐劍鋒,卜東波,白碩. 計(jì)算機(jī)應(yīng)用研究. 2001(09)
[9]獨(dú)立于語(yǔ)種的文本分類方法[J]. 黃萱菁,吳立德,石崎洋之,徐國(guó)偉. 中文信息學(xué)報(bào). 2000(06)
[10]文檔中詞語(yǔ)權(quán)重計(jì)算方法的改進(jìn)[J]. 魯松,李曉黎,白碩,王實(shí). 中文信息學(xué)報(bào). 2000(06)
碩士論文
[1]基于Agent專業(yè)搜索引擎的研究[D]. 鄒慶欣.大連海事大學(xué) 2008
[2]專業(yè)搜索引擎的數(shù)據(jù)存儲(chǔ)研究[D]. 陳小峰.南京師范大學(xué) 2007
[3]中國(guó)生物醫(yī)學(xué)工程文獻(xiàn)相關(guān)性數(shù)據(jù)庫(kù)建設(shè)研究[D]. 萬(wàn)莉莉.中國(guó)協(xié)和醫(yī)科大學(xué) 2007
[4]搜索引擎中的數(shù)據(jù)存儲(chǔ)問(wèn)題研究[D]. 何華.浙江大學(xué) 2005
本文編號(hào):3454863
【文章來(lái)源】:首都師范大學(xué)北京市
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
系統(tǒng)設(shè)計(jì)過(guò)程
圖2一2系統(tǒng)主要流程2.IJ系統(tǒng)流程如圖2一2所示,系統(tǒng)分為兩個(gè)部分:(1)數(shù)據(jù)處理部分,(2)系統(tǒng)功能部分。其中數(shù)據(jù)處理部分又可以分為兩個(gè)部分:(1)數(shù)據(jù)的導(dǎo)入;(2)相關(guān)性計(jì)算。系統(tǒng)功能部分在下2.2節(jié)中介紹,有關(guān)相關(guān)性的具體計(jì)算將在第四章中介紹。數(shù)據(jù)處理部分:如圖2一3所示,異構(gòu)數(shù)據(jù)分為三個(gè)部分,第一部分是中英文XML文獻(xiàn),第二部分是中英文DBF文獻(xiàn),第三部分是EXCEL文檔,最終將三者統(tǒng)一導(dǎo)入到 MssQLservcr數(shù)據(jù)庫(kù)HcaithyGuide中。其中
紹系統(tǒng)的主要功能及其子功能。2.2.1導(dǎo)入異構(gòu)數(shù)據(jù)如圖2一4所示,數(shù)據(jù)導(dǎo)入部分,可以導(dǎo)入XML,中英文DBF數(shù)據(jù)庫(kù),Exeel數(shù)據(jù)表等。導(dǎo)入的過(guò)程中如果發(fā)現(xiàn)數(shù)據(jù)有異常,可以及時(shí)清理數(shù)據(jù)。
【參考文獻(xiàn)】:
期刊論文
[1]向量空間模型在醫(yī)學(xué)文獻(xiàn)相關(guān)性研究中的應(yīng)用[J]. 邱宇紅,郭繼軍. 現(xiàn)代圖書情報(bào)技術(shù). 2007(07)
[2]基于后綴樹(shù)的骨干網(wǎng)絡(luò)垃圾郵件檢測(cè)方法[J]. 鄭耀東,譚建龍,郭莉. 計(jì)算機(jī)工程與應(yīng)用. 2006(28)
[3]向量空間模型信息檢索技術(shù)討論[J]. 劉斌,陳樺. 情報(bào)雜志. 2006(07)
[4]基于后綴樹(shù)模型的文本實(shí)時(shí)分類系統(tǒng)的研究和實(shí)現(xiàn)[J]. 郭莉,張吉,譚建龍. 中文信息學(xué)報(bào). 2005(05)
[5]基于向量空間模型的信息檢索系統(tǒng)的設(shè)計(jì)[J]. 包金龍. 情報(bào)雜志. 2005(07)
[6]基于N元漢字串模型的文本表示和實(shí)時(shí)分類的研究與實(shí)現(xiàn)[J]. 王映,常毅,譚建龍,白碩. 計(jì)算機(jī)工程與應(yīng)用. 2005(05)
[7]基于規(guī)則的自動(dòng)分類在文本分類中的應(yīng)用[J]. 李渝勤,孫麗華. 中文信息學(xué)報(bào). 2004(04)
[8]基于向量空間模型的文本自動(dòng)分類系統(tǒng)的研究與實(shí)現(xiàn)[J]. 龐劍鋒,卜東波,白碩. 計(jì)算機(jī)應(yīng)用研究. 2001(09)
[9]獨(dú)立于語(yǔ)種的文本分類方法[J]. 黃萱菁,吳立德,石崎洋之,徐國(guó)偉. 中文信息學(xué)報(bào). 2000(06)
[10]文檔中詞語(yǔ)權(quán)重計(jì)算方法的改進(jìn)[J]. 魯松,李曉黎,白碩,王實(shí). 中文信息學(xué)報(bào). 2000(06)
碩士論文
[1]基于Agent專業(yè)搜索引擎的研究[D]. 鄒慶欣.大連海事大學(xué) 2008
[2]專業(yè)搜索引擎的數(shù)據(jù)存儲(chǔ)研究[D]. 陳小峰.南京師范大學(xué) 2007
[3]中國(guó)生物醫(yī)學(xué)工程文獻(xiàn)相關(guān)性數(shù)據(jù)庫(kù)建設(shè)研究[D]. 萬(wàn)莉莉.中國(guó)協(xié)和醫(yī)科大學(xué) 2007
[4]搜索引擎中的數(shù)據(jù)存儲(chǔ)問(wèn)題研究[D]. 何華.浙江大學(xué) 2005
本文編號(hào):3454863
本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/3454863.html
最近更新
教材專著