基于MeSH的醫(yī)學(xué)文獻(xiàn)主題分類與可視化研究
發(fā)布時(shí)間:2021-10-30 23:07
醫(yī)學(xué)文獻(xiàn)數(shù)量爆炸式的增長(zhǎng),醫(yī)生和研究人員如何快速分析大規(guī)模文獻(xiàn)數(shù)據(jù)、迅速有效地獲得有用信息是一個(gè)巨大的挑戰(zhàn)。本文研究文獻(xiàn)自動(dòng)分類與文獻(xiàn)主題可視化技術(shù),能夠?qū)鹘y(tǒng)的數(shù)據(jù)分析方法與文獻(xiàn)信息數(shù)據(jù)的處理算法相結(jié)合,幫助研究人員獲取研究信息。文獻(xiàn)自動(dòng)分類技術(shù)可以在文獻(xiàn)探究的初步階段作為知識(shí)發(fā)現(xiàn)、分析的啟發(fā)式方法,進(jìn)行有意義的經(jīng)驗(yàn)聚集與內(nèi)容比較。我們提出一種基于組合特征的醫(yī)學(xué)領(lǐng)域文獻(xiàn)主題分類算法,用于解決醫(yī)學(xué)文獻(xiàn)中由于醫(yī)學(xué)文獻(xiàn)術(shù)語復(fù)雜,數(shù)量多引起的分類問題。本文的算法首先提取文獻(xiàn)信息構(gòu)建基于MeSH(Medical Subject Headings)主題詞與LDA(Latent Dirichlet allocation)潛在概率的組合特征向量,可以進(jìn)入語義層面提取文獻(xiàn)特征;然后采用支持向量機(jī)(Support Vector Machine)作為算法的分類模型,在組合特征向量空間中構(gòu)建可以將文獻(xiàn)進(jìn)行分類的最優(yōu)超平面。本文使用TREC-2005中的文獻(xiàn)集進(jìn)行文獻(xiàn)主題多分類實(shí)驗(yàn),本文算法的準(zhǔn)確率達(dá)到72%,相比于傳統(tǒng)的基于MeSH分類算法65%、MeSH主題詞加權(quán)的分類算法53%的準(zhǔn)確率,有效地提高了醫(yī)學(xué)...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 醫(yī)學(xué)文獻(xiàn)國(guó)內(nèi)外研究歷史與現(xiàn)狀
1.2.1 文獻(xiàn)主題分類的研究
1.2.2 主題可視化研究
1.3 本文的主要貢獻(xiàn)與創(chuàng)新
1.4 本文結(jié)構(gòu)安排
第二章 基于組合特征向量的醫(yī)學(xué)文獻(xiàn)主題分類算法研究
2.1 算法主要解決問題
2.2 算法主要思想與原理
2.3 算法設(shè)計(jì)與實(shí)現(xiàn)
2.3.1 文獻(xiàn)預(yù)處理階段
2.3.2 特征構(gòu)建階段
2.3.3 文獻(xiàn)主題分類模型構(gòu)建
2.4 分類實(shí)驗(yàn)與結(jié)果分析
2.4.1 實(shí)驗(yàn)環(huán)境
2.4.2 文獻(xiàn)數(shù)據(jù)集
2.4.3 特征構(gòu)建與分類模型參數(shù)設(shè)置
2.4.4 評(píng)估標(biāo)準(zhǔn)與分類結(jié)果
2.5 結(jié)果討論
2.6 本章小結(jié)
第三章 基于MeSH的醫(yī)學(xué)文獻(xiàn)主題可視化方法研究
3.1 文獻(xiàn)主題研究進(jìn)展與可視化問題分析
3.2 基于MeSH共現(xiàn)的文獻(xiàn)主題可視化方法設(shè)計(jì)
3.2.1 方法原理
3.2.2 實(shí)現(xiàn)流程
3.3醫(yī)學(xué)文獻(xiàn)主題可視化實(shí)驗(yàn)
3.3.1 實(shí)驗(yàn)環(huán)境
3.3.2 實(shí)驗(yàn)數(shù)據(jù)來源
3.3.3 主題交叉分析可視化實(shí)驗(yàn)驗(yàn)證
3.3.4 主題趨勢(shì)可視化實(shí)驗(yàn)驗(yàn)證
3.4 結(jié)果分析
3.4.1 結(jié)構(gòu)圖圖示說明
3.4.2 兩種主題交叉可視化方法比較
3.4.3 趨勢(shì)圖圖示說明
3.4.4 兩種趨勢(shì)圖可視化方法比較
3.5 本章小結(jié)
第四章 總結(jié)與展望
致謝
參考文獻(xiàn)
【參考文獻(xiàn)】:
期刊論文
[1]基于上下文特征的領(lǐng)域文獻(xiàn)實(shí)體消歧算法[J]. 王靜,譚紹峰,賀東東,陳建輝,閆健卓. 北京生物醫(yī)學(xué)工程. 2018(04)
[2]多維主題演化分析模型構(gòu)建與實(shí)證研究[J]. 劉自強(qiáng),王效岳,白如江. 情報(bào)理論與實(shí)踐. 2017(03)
[3]生物醫(yī)學(xué)文獻(xiàn)中的術(shù)語分類和術(shù)語映射研究[J]. 周玉新. 智能城市. 2016(09)
[4]基于Citespace Ⅲ的大數(shù)據(jù)研究的可視化分析[J]. 姜俊鋒,丁香乾,侯瑞春,曲麗君. 計(jì)算機(jī)與數(shù)字工程. 2016(02)
[5]基于LDA模型的研究領(lǐng)域熱點(diǎn)及趨勢(shì)分析[J]. 楊星,李保利,金明舉. 計(jì)算機(jī)技術(shù)與發(fā)展. 2012(10)
[6]數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)領(lǐng)域熱點(diǎn)主題分析[J]. 吳思竹. 情報(bào)雜志. 2010(07)
[7]MeSH詞表的語義相似度計(jì)算研究[J]. 孫海霞,錢慶,吳英杰,李軍蓮. 現(xiàn)代圖書情報(bào)技術(shù). 2010(06)
[8]PubMed主題詞檢索與自由詞檢索的檢索效率比較研究[J]. 胡德華,梁麗明. 情報(bào)科學(xué). 2006(05)
碩士論文
[1]兩種探測(cè)研究熱點(diǎn)趨勢(shì)的時(shí)間線方法比較[D]. 阮文靜.大連理工大學(xué) 2017
[2]基于領(lǐng)域本體的生物醫(yī)學(xué)文獻(xiàn)挖掘算法研究及其系統(tǒng)實(shí)現(xiàn)[D]. 楊開欣.北京交通大學(xué) 2016
本文編號(hào):3467592
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 醫(yī)學(xué)文獻(xiàn)國(guó)內(nèi)外研究歷史與現(xiàn)狀
1.2.1 文獻(xiàn)主題分類的研究
1.2.2 主題可視化研究
1.3 本文的主要貢獻(xiàn)與創(chuàng)新
1.4 本文結(jié)構(gòu)安排
第二章 基于組合特征向量的醫(yī)學(xué)文獻(xiàn)主題分類算法研究
2.1 算法主要解決問題
2.2 算法主要思想與原理
2.3 算法設(shè)計(jì)與實(shí)現(xiàn)
2.3.1 文獻(xiàn)預(yù)處理階段
2.3.2 特征構(gòu)建階段
2.3.3 文獻(xiàn)主題分類模型構(gòu)建
2.4 分類實(shí)驗(yàn)與結(jié)果分析
2.4.1 實(shí)驗(yàn)環(huán)境
2.4.2 文獻(xiàn)數(shù)據(jù)集
2.4.3 特征構(gòu)建與分類模型參數(shù)設(shè)置
2.4.4 評(píng)估標(biāo)準(zhǔn)與分類結(jié)果
2.5 結(jié)果討論
2.6 本章小結(jié)
第三章 基于MeSH的醫(yī)學(xué)文獻(xiàn)主題可視化方法研究
3.1 文獻(xiàn)主題研究進(jìn)展與可視化問題分析
3.2 基于MeSH共現(xiàn)的文獻(xiàn)主題可視化方法設(shè)計(jì)
3.2.1 方法原理
3.2.2 實(shí)現(xiàn)流程
3.3醫(yī)學(xué)文獻(xiàn)主題可視化實(shí)驗(yàn)
3.3.1 實(shí)驗(yàn)環(huán)境
3.3.2 實(shí)驗(yàn)數(shù)據(jù)來源
3.3.3 主題交叉分析可視化實(shí)驗(yàn)驗(yàn)證
3.3.4 主題趨勢(shì)可視化實(shí)驗(yàn)驗(yàn)證
3.4 結(jié)果分析
3.4.1 結(jié)構(gòu)圖圖示說明
3.4.2 兩種主題交叉可視化方法比較
3.4.3 趨勢(shì)圖圖示說明
3.4.4 兩種趨勢(shì)圖可視化方法比較
3.5 本章小結(jié)
第四章 總結(jié)與展望
致謝
參考文獻(xiàn)
【參考文獻(xiàn)】:
期刊論文
[1]基于上下文特征的領(lǐng)域文獻(xiàn)實(shí)體消歧算法[J]. 王靜,譚紹峰,賀東東,陳建輝,閆健卓. 北京生物醫(yī)學(xué)工程. 2018(04)
[2]多維主題演化分析模型構(gòu)建與實(shí)證研究[J]. 劉自強(qiáng),王效岳,白如江. 情報(bào)理論與實(shí)踐. 2017(03)
[3]生物醫(yī)學(xué)文獻(xiàn)中的術(shù)語分類和術(shù)語映射研究[J]. 周玉新. 智能城市. 2016(09)
[4]基于Citespace Ⅲ的大數(shù)據(jù)研究的可視化分析[J]. 姜俊鋒,丁香乾,侯瑞春,曲麗君. 計(jì)算機(jī)與數(shù)字工程. 2016(02)
[5]基于LDA模型的研究領(lǐng)域熱點(diǎn)及趨勢(shì)分析[J]. 楊星,李保利,金明舉. 計(jì)算機(jī)技術(shù)與發(fā)展. 2012(10)
[6]數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)領(lǐng)域熱點(diǎn)主題分析[J]. 吳思竹. 情報(bào)雜志. 2010(07)
[7]MeSH詞表的語義相似度計(jì)算研究[J]. 孫海霞,錢慶,吳英杰,李軍蓮. 現(xiàn)代圖書情報(bào)技術(shù). 2010(06)
[8]PubMed主題詞檢索與自由詞檢索的檢索效率比較研究[J]. 胡德華,梁麗明. 情報(bào)科學(xué). 2006(05)
碩士論文
[1]兩種探測(cè)研究熱點(diǎn)趨勢(shì)的時(shí)間線方法比較[D]. 阮文靜.大連理工大學(xué) 2017
[2]基于領(lǐng)域本體的生物醫(yī)學(xué)文獻(xiàn)挖掘算法研究及其系統(tǒng)實(shí)現(xiàn)[D]. 楊開欣.北京交通大學(xué) 2016
本文編號(hào):3467592
本文鏈接:http://www.sikaile.net/tushudanganlunwen/3467592.html
最近更新
教材專著