天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

面向精準(zhǔn)醫(yī)學(xué)知識庫的基因—變異—疾病關(guān)系抽取技術(shù)研究

發(fā)布時間:2022-10-19 15:54
  精準(zhǔn)醫(yī)學(xué)時代背景下,伴隨生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)爆發(fā)式增長與技術(shù)跨越式發(fā)展,單純依賴人工編審的傳統(tǒng)知識庫構(gòu)建策略已不合時宜且不切實(shí)際,從海量文獻(xiàn)中抽取信息和挖掘知識成為近年研究重點(diǎn)與應(yīng)用熱點(diǎn)。經(jīng)過學(xué)術(shù)和產(chǎn)業(yè)界的積極探索,命名實(shí)體識別、術(shù)語抽取、關(guān)系抽取、事件抽取和共指消解等文本挖掘技術(shù)已取得重要進(jìn)展,然而當(dāng)面向精準(zhǔn)醫(yī)學(xué)知識庫構(gòu)建中的“基因-變異-疾病”關(guān)系抽取特定研究任務(wù)時,現(xiàn)有的關(guān)系抽取方法、模型和算法仍存在諸多局限和不足,難以滿足實(shí)際需求,主要表現(xiàn)在以下五個方面:(1)命名實(shí)體識別算法高度依賴特征工程,特征選擇、特征表達(dá)和特征預(yù)處理過程耗時費(fèi)力,重要詞法特征與句法特征湮沒于詞性特征、依存特征和上下文特征集合中;(2)關(guān)系類型定義單純考慮醫(yī)學(xué)背景,基于關(guān)聯(lián)強(qiáng)弱或概率高低的分類無法表達(dá)上下位關(guān)系,缺少頂層關(guān)系類型指導(dǎo)關(guān)系映射,缺乏底層關(guān)系觸發(fā)指示詞表輔助關(guān)系定位;(3)缺乏用于“基因-變異-疾病”關(guān)系抽取算法研究的標(biāo)準(zhǔn)語料庫和易用的語料庫構(gòu)建工具,關(guān)系抽取語料庫構(gòu)建主要依靠專家人工編審,專家需要在理解語境內(nèi)容的基礎(chǔ)上,結(jié)合先驗(yàn)知識判斷不同位置與不同表述實(shí)體組合的關(guān)系狀態(tài)與關(guān)系類型,語料規(guī)模和質(zhì)... 

【文章頁數(shù)】:125 頁

【學(xué)位級別】:博士

【文章目錄】:
縮略語表
摘要
Abstract
前言
第一章 融合深度神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)機(jī)器學(xué)習(xí)的高性能、可拓展“基因-變異-疾病”命名實(shí)體識別算法
    1.1 引言
    1.2 材料與方法
        1.2.1 材料
        1.2.2 預(yù)處理過程
        1.2.3 神經(jīng)網(wǎng)絡(luò)過程
        1.2.4 后處理過程
    1.3 結(jié)果與討論
        1.3.1 性能評價
        1.3.2 不同組件的貢獻(xiàn)分析
        1.3.3 錯誤分析
    1.4 小結(jié)
第二章 融合無監(jiān)督聚類和領(lǐng)域本體限定的多層次、細(xì)粒度“基因-變異-疾病”關(guān)聯(lián)關(guān)系類型
    2.1 引言
    2.2 材料與方法
        2.2.1 材料
        2.2.2 預(yù)處理過程
        2.2.3 語義關(guān)系類型構(gòu)建過程
        2.2.4 語義關(guān)系類型評價過程
    2.3 結(jié)果與討論
        2.3.1 構(gòu)建結(jié)果
        2.3.2 覆蓋度評價
        2.3.3 指導(dǎo)能力評價
    2.4 小結(jié)
第三章 融合遠(yuǎn)程監(jiān)督指導(dǎo)與專家人工編審的半自動、高質(zhì)量“基因-變異-疾病”語料庫構(gòu)建
    3.1 引言
    3.2 材料和方法
        3.2.1 材料
        3.2.2 預(yù)處理過程
        3.2.3 機(jī)器注釋過程
        3.2.4 專家編審過程
    3.3 結(jié)果與討論
        3.3.1 構(gòu)建結(jié)果
        3.3.2 機(jī)器注釋分析
        3.3.3 專家編審分析
    3.4 小結(jié)
第四章 融合深度神經(jīng)網(wǎng)絡(luò)與領(lǐng)域先驗(yàn)知識的多實(shí)體、跨語句“基因-變異-疾病”關(guān)系抽取算法
    4.1 引言
    4.2 材料與方法
        4.2.1 材料
        4.2.2 預(yù)處理過程
        4.2.3 神經(jīng)網(wǎng)絡(luò)過程
        4.2.4 后處理過程
    4.3 結(jié)果與討論
        4.3.1 性能評價
        4.3.2 不同組件貢獻(xiàn)分析
        4.3.3 錯誤分析
    4.4 小結(jié)
第五章 融合異源編審數(shù)據(jù)與多元標(biāo)注文獻(xiàn)的易交互、可溯源“基因-變異-疾病”知識圖譜構(gòu)建和可視化平臺
    5.1 引言
    5.2 材料與方法
        5.2.1 材料
        5.2.2 知識集成過程
        5.2.3 知識存儲過程
        5.2.4 知識檢索和可視化展示過程
    5.3 結(jié)果與討論
        5.3.1 構(gòu)建結(jié)果
        5.3.2 應(yīng)用場景
        5.3.3 局限分析
    5.4 小結(jié)
第六章 結(jié)論與展望
參考文獻(xiàn)
附錄A ClinVar關(guān)系文獻(xiàn)分布情況統(tǒng)計表
附錄B 語義關(guān)系構(gòu)建選用文獻(xiàn)來源匯總表
附錄C BERT模型補(bǔ)充詞表
附錄D “基因-變異-疾病”知識圖譜構(gòu)建和可視化平臺
作者在學(xué)期間取得的學(xué)術(shù)成果
附件
主要簡歷
致謝


【參考文獻(xiàn)】:
期刊論文
[1]國外生物醫(yī)學(xué)文本語料庫分類及特點(diǎn)研究[J]. 晏歸來,安新穎,范少萍,周永稱.  醫(yī)學(xué)信息學(xué)雜志. 2018(10)
[2]精準(zhǔn)醫(yī)學(xué)知識庫的構(gòu)建[J]. 劉雷,王星.  中華醫(yī)學(xué)圖書情報雜志. 2018(06)
[3]中國、美國、英國精準(zhǔn)醫(yī)學(xué)計劃比較研究[J]. 吳思竹,錢慶,楊林.  中國醫(yī)院管理. 2017(09)
[4]開放環(huán)境科技語料庫質(zhì)量評價研究[J]. 屈鵬.  情報理論與實(shí)踐. 2016(05)
[5]一種基于知識挖掘與知識組織的知識型數(shù)據(jù)庫——中國疾病知識總庫之臨床醫(yī)藥學(xué)知識服務(wù)系統(tǒng)介紹[J]. 楊志.  中華醫(yī)學(xué)圖書情報雜志. 2008(03)
[6]中國生物醫(yī)學(xué)知識庫(全文版)檢索與應(yīng)用[J]. 溫華影,高嶺,姚延芳,步肇宏.  中國現(xiàn)代醫(yī)生. 2008(08)
[7]中國醫(yī)院知識倉庫建設(shè)與服務(wù)標(biāo)準(zhǔn)[J]. 張群山.  中國醫(yī)院管理. 2003(11)



本文編號:3693659

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3693659.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fea50***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com