在線醫(yī)療社區(qū)問答文本的知識圖譜構建研究
發(fā)布時間:2021-04-06 09:53
【目的/意義】針對醫(yī)療問答社區(qū)數(shù)據(jù)量大、規(guī)范性差、數(shù)據(jù)稀疏等特性,綜合利用雙向長短記憶神經(jīng)網(wǎng)絡(BiLSTM)、條件隨機場(CRF)、雙向門控循環(huán)單元(BiGRU)等深度學習模型,對社區(qū)文本的實體識別及關系抽取方法進行研究!痉椒/過程】首先,對實體作了進一步細分,利用BiLSTM-CRF模型對BIO標注的數(shù)據(jù)集進行實體識別,實驗發(fā)現(xiàn)細分實體比未細分實體在結(jié)果上表現(xiàn)更好;接著利用BiGRU-Attention模型抽取各實體間的關系,實驗結(jié)果顯示,該模型無論是在準確率、召回率還是F值上都比BiLSTM-Attention抽取模型有較大的提升;最后利用Neo4j圖數(shù)據(jù)庫構建了一個可視化的知識圖譜!窘Y(jié)果/結(jié)論】本研究將非結(jié)構化的社區(qū)文本轉(zhuǎn)化為結(jié)構化數(shù)據(jù),在醫(yī)療社區(qū)的智能知識服務、知識表示、個性化知識推薦等方面具有推動作用!緞(chuàng)新/局限】在醫(yī)療實體識別過程中將實體進行細分,成功構建了基于在線醫(yī)療社區(qū)問答文本的乳腺癌知識圖譜。但由于某些關系樣本量較少,對整體關系抽取的評價指標存在一定的影響。
【文章來源】:情報科學. 2021,39(03)北大核心CSSCI
【文章頁數(shù)】:10 頁
【部分圖文】:
GRU模型內(nèi)部結(jié)構圖Figure6InternalstructurediagramofGRUmodel隱藏層各個參數(shù)可由以下公式計算得出:
幕埃?切枰?固?瘟頻?梢遠喑緣憒笤嫻摹?…表6關系抽取標注示例Table6Anexampleofrelationextractionandannotation實體1乳腺癌乳腺增生乳腺癌…實體2乳頭溢液乳癖消酸牛奶…關系DCSMIDRD…實驗語句女39歲乳腺癌出現(xiàn)腫塊到乳頭溢液需要多久。一般3到5年的時間的,每個人一樣的女47歲乳腺增生六味地黃丸可以吃嗎?可口服乳癖散結(jié)膠囊和枸櫞酸他莫昔芬片乳癖消治療。女32歲我乳腺癌患者低級別原位癌做了保乳手術放療33次可以吃酸牛奶嗎?可以吃酸牛奶…圖8BiGRU-Attention實體關系抽取結(jié)果Figure8BiGRU-Attentionentityrelationshipextractionresults·TheoryResearch·INFORMATIONSCIENCEVol.39,No.3March,2021--56
?飛窬???RNN以及其他深度學習模型的效果,表明了深度學習模型在關系抽取任務中的有效性。Zhou等【11】將注意力機制引入關系抽取模型中,提出BiLSTM-Attention模型,在公開數(shù)據(jù)集SeValE-2010上進行試驗,結(jié)果顯示該模型取得了較之其他模型較高的F1值。而張?zhí)m霞等【12】提出BiGRU-雙層Attention的模型,用于抽取中文文本的人物關系,結(jié)果與未加入Attention層的數(shù)據(jù)進行對比發(fā)現(xiàn),該模型在準確率、召回率上都有顯著提升,說明Attention層在關系抽取上具有突出表現(xiàn)。圖1在線醫(yī)療社區(qū)問答文本知識圖譜構建框架Figure1TheconstructionframeworkoftheonlinemedicalcommunityQ&AtextKnowledgeGraphNeo4j圖數(shù)據(jù)庫能夠?qū)⒆R別出的實體及關系以知識圖譜的方式進行可視化展示,通過查詢語句獲知具體醫(yī)療實體間的不同關系,對個性化醫(yī)療,便捷醫(yī)療查詢具有極大的幫助。結(jié)合知識圖譜,利用深度學習挖掘醫(yī)療社區(qū)文本的實體及關系的研究并不多,通過融合相關模型及方法,本文綜合利用雙向長短記憶神經(jīng)網(wǎng)絡(BiLSTM)、條件隨機場(CRF)、雙向門控循環(huán)單元(BiGRU)等深度學習模型,對社區(qū)文本的實體識別及關系抽取方法進行了研究并成功構建了知識圖譜。2整體框架和模型設計2..1研究框架在線醫(yī)療社區(qū)領域,圖1展示了一種基于深度學習的知識圖譜構建框架,成功將知識圖譜與在線醫(yī)療社區(qū)問答文本相融合。無論是從研究角度還是應用角度,都是一次創(chuàng)新。首先對獲取的文本進行清洗和標注處理;然后利用BiLSTM-CRF模型對在線醫(yī)療社區(qū)問答文本進行實體識別,在此任務中加入細分實體,提高了實體識別的效果,也為接下來的關系抽取提供了更加準確的輸入;接著利用BiGRU-A
【參考文獻】:
期刊論文
[1]在線醫(yī)療問答文本的命名實體識別[J]. 楊文明,褚偉杰. 計算機系統(tǒng)應用. 2019(02)
[2]基于GRU-Attention的中文文本分類[J]. 孫明敏. 現(xiàn)代信息科技. 2019(03)
[3]基于深度學習的文本表示方法[J]. 李楓林,柯佳. 情報科學. 2019(01)
[4]基于電子病歷的實體識別和知識圖譜構建的研究[J]. 黃夢醒,李夢龍,韓惠蕊. 計算機應用研究. 2019(12)
[5]基于雙向GRU神經(jīng)網(wǎng)絡和雙層注意力機制的中文文本中人物關系抽取研究[J]. 張?zhí)m霞,胡文心. 計算機應用與軟件. 2018(11)
[6]在線醫(yī)療文本中的實體識別研究[J]. 蘇婭,劉杰,黃亞樓. 北京大學學報(自然科學版). 2016(01)
[7]電子病歷命名實體識別和實體關系抽取研究綜述[J]. 楊錦鋒,于秋濱,關毅,蔣志鵬. 自動化學報. 2014(08)
[8]電子病歷中命名實體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國生物醫(yī)學工程學報. 2011(02)
本文編號:3121234
【文章來源】:情報科學. 2021,39(03)北大核心CSSCI
【文章頁數(shù)】:10 頁
【部分圖文】:
GRU模型內(nèi)部結(jié)構圖Figure6InternalstructurediagramofGRUmodel隱藏層各個參數(shù)可由以下公式計算得出:
幕埃?切枰?固?瘟頻?梢遠喑緣憒笤嫻摹?…表6關系抽取標注示例Table6Anexampleofrelationextractionandannotation實體1乳腺癌乳腺增生乳腺癌…實體2乳頭溢液乳癖消酸牛奶…關系DCSMIDRD…實驗語句女39歲乳腺癌出現(xiàn)腫塊到乳頭溢液需要多久。一般3到5年的時間的,每個人一樣的女47歲乳腺增生六味地黃丸可以吃嗎?可口服乳癖散結(jié)膠囊和枸櫞酸他莫昔芬片乳癖消治療。女32歲我乳腺癌患者低級別原位癌做了保乳手術放療33次可以吃酸牛奶嗎?可以吃酸牛奶…圖8BiGRU-Attention實體關系抽取結(jié)果Figure8BiGRU-Attentionentityrelationshipextractionresults·TheoryResearch·INFORMATIONSCIENCEVol.39,No.3March,2021--56
?飛窬???RNN以及其他深度學習模型的效果,表明了深度學習模型在關系抽取任務中的有效性。Zhou等【11】將注意力機制引入關系抽取模型中,提出BiLSTM-Attention模型,在公開數(shù)據(jù)集SeValE-2010上進行試驗,結(jié)果顯示該模型取得了較之其他模型較高的F1值。而張?zhí)m霞等【12】提出BiGRU-雙層Attention的模型,用于抽取中文文本的人物關系,結(jié)果與未加入Attention層的數(shù)據(jù)進行對比發(fā)現(xiàn),該模型在準確率、召回率上都有顯著提升,說明Attention層在關系抽取上具有突出表現(xiàn)。圖1在線醫(yī)療社區(qū)問答文本知識圖譜構建框架Figure1TheconstructionframeworkoftheonlinemedicalcommunityQ&AtextKnowledgeGraphNeo4j圖數(shù)據(jù)庫能夠?qū)⒆R別出的實體及關系以知識圖譜的方式進行可視化展示,通過查詢語句獲知具體醫(yī)療實體間的不同關系,對個性化醫(yī)療,便捷醫(yī)療查詢具有極大的幫助。結(jié)合知識圖譜,利用深度學習挖掘醫(yī)療社區(qū)文本的實體及關系的研究并不多,通過融合相關模型及方法,本文綜合利用雙向長短記憶神經(jīng)網(wǎng)絡(BiLSTM)、條件隨機場(CRF)、雙向門控循環(huán)單元(BiGRU)等深度學習模型,對社區(qū)文本的實體識別及關系抽取方法進行了研究并成功構建了知識圖譜。2整體框架和模型設計2..1研究框架在線醫(yī)療社區(qū)領域,圖1展示了一種基于深度學習的知識圖譜構建框架,成功將知識圖譜與在線醫(yī)療社區(qū)問答文本相融合。無論是從研究角度還是應用角度,都是一次創(chuàng)新。首先對獲取的文本進行清洗和標注處理;然后利用BiLSTM-CRF模型對在線醫(yī)療社區(qū)問答文本進行實體識別,在此任務中加入細分實體,提高了實體識別的效果,也為接下來的關系抽取提供了更加準確的輸入;接著利用BiGRU-A
【參考文獻】:
期刊論文
[1]在線醫(yī)療問答文本的命名實體識別[J]. 楊文明,褚偉杰. 計算機系統(tǒng)應用. 2019(02)
[2]基于GRU-Attention的中文文本分類[J]. 孫明敏. 現(xiàn)代信息科技. 2019(03)
[3]基于深度學習的文本表示方法[J]. 李楓林,柯佳. 情報科學. 2019(01)
[4]基于電子病歷的實體識別和知識圖譜構建的研究[J]. 黃夢醒,李夢龍,韓惠蕊. 計算機應用研究. 2019(12)
[5]基于雙向GRU神經(jīng)網(wǎng)絡和雙層注意力機制的中文文本中人物關系抽取研究[J]. 張?zhí)m霞,胡文心. 計算機應用與軟件. 2018(11)
[6]在線醫(yī)療文本中的實體識別研究[J]. 蘇婭,劉杰,黃亞樓. 北京大學學報(自然科學版). 2016(01)
[7]電子病歷命名實體識別和實體關系抽取研究綜述[J]. 楊錦鋒,于秋濱,關毅,蔣志鵬. 自動化學報. 2014(08)
[8]電子病歷中命名實體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國生物醫(yī)學工程學報. 2011(02)
本文編號:3121234
本文鏈接:http://www.sikaile.net/guanlilunwen/shequguanli/3121234.html
最近更新
教材專著