天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

面向中文電子病歷的醫(yī)療實體及關(guān)系識別技術(shù)研究

發(fā)布時間:2022-01-25 05:26
  隨著醫(yī)療信息系統(tǒng)的加快建設(shè),電子病歷數(shù)量急劇增長。電子病歷中不僅包含患者的臨床信息(如檢查結(jié)果、臨床診斷等),還包含豐富的醫(yī)療實體,這些醫(yī)療實體大部分之間存在一定關(guān)系。使用自然語言處理技術(shù)從電子病歷文本中抽取醫(yī)療實體以及實體間的語義關(guān)系,構(gòu)建可用于臨床決策的醫(yī)療知識庫,對于推動電子病歷在智慧醫(yī)療中的應(yīng)用具有重要意義。目前,電子病歷醫(yī)療實體識別和實體關(guān)系識別的研究主要面向英文電子病歷,在中文電子病歷上公開的評測及語料較少;另外,已有的研究主要基于傳統(tǒng)機器學(xué)習(xí)方法,這些方法依賴大量人工構(gòu)造的特征。綜上,本文的研究內(nèi)容是中文電子病歷醫(yī)療實體識別及實體關(guān)系識別,主要的研究工作包括:(1)在標(biāo)注規(guī)則及語料方面,制定了中文電子病歷實體關(guān)系標(biāo)注規(guī)則,并標(biāo)注構(gòu)建了實體關(guān)系語料庫。在參考2010年I2B2/VA挑戰(zhàn)評測發(fā)布的英文電子病歷標(biāo)注規(guī)范的基礎(chǔ)上,并根據(jù)中文電子病歷的語言和結(jié)構(gòu)特點,制定了適用于中文電子病歷的實體關(guān)系標(biāo)注規(guī)則。在標(biāo)注人員熟悉標(biāo)注規(guī)則的前提下,采取傳統(tǒng)的標(biāo)注方案,以抽樣檢查的方式,確保標(biāo)注結(jié)果真實可靠,共標(biāo)注了3500份電子病歷。(2)在醫(yī)療實體識別方面,提出了基于醫(yī)療知識注意力增強... 

【文章來源】:西北師范大學(xué)甘肅省

【文章頁數(shù)】:67 頁

【學(xué)位級別】:碩士

【部分圖文】:

面向中文電子病歷的醫(yī)療實體及關(guān)系識別技術(shù)研究


醫(yī)療實體關(guān)系語義圖

實體關(guān)系圖,電子病歷,實體關(guān)系,中文


第2章中文電子病歷實體關(guān)系標(biāo)注體系及語料構(gòu)建13檢查結(jié)果等。首次病程記錄里主要包含醫(yī)生對患者的診斷結(jié)果、診斷依據(jù)和診療計劃等。病例特點是對病史、檢查結(jié)果等進行全面分析,歸納整理出的病例特征;診斷依據(jù)和鑒別診斷是醫(yī)生根據(jù)病例特點給出的初步診斷結(jié)果;診療計劃是根據(jù)初步診斷結(jié)果和病例特征提出具體的檢查項目和治療措施。這兩種類型的電子病歷文本中包含了大量的實體與實體關(guān)系,其電子病歷在不同科室的分布情況如表2-2所示。首次病程記錄的數(shù)量多于出院小結(jié)的電子病歷數(shù)量,其中包含的實體與實體關(guān)系數(shù)量也高于出院小結(jié)部分,在所有的科室中,普通外科和普通內(nèi)科的電子病歷數(shù)量遠(yuǎn)高于其他科室的電子病歷數(shù)量。2.3.2語料標(biāo)注考慮到電子病歷文本的特殊性以及標(biāo)注的成本,我們的語料構(gòu)建采取了傳統(tǒng)的標(biāo)注模式,標(biāo)注人員和標(biāo)注體系制定人員一起標(biāo)注,遇到難以標(biāo)注的實體或?qū)嶓w關(guān)系,兩方經(jīng)過討論后達(dá)成一致來構(gòu)建了實體關(guān)系語料。我們的標(biāo)注體系參照了2010年I2B2自然語言挑戰(zhàn)評測發(fā)布的英文電子病歷實體關(guān)系標(biāo)注規(guī)范,并在專業(yè)人員的指導(dǎo)下完成。對于標(biāo)注完成的語料,我們還采取抽樣檢查的方式,確保標(biāo)注結(jié)果真實可靠。最終我們共標(biāo)注了3500份中文電子病歷實體關(guān)系語料庫。整個標(biāo)注過程共分為兩輪,其中第一輪是預(yù)標(biāo)注部分,是為了讓標(biāo)注人員熟悉標(biāo)注體系,并對標(biāo)注人員進行培訓(xùn),以便于對在標(biāo)注過程中出現(xiàn)的問題及時進行處理,并對標(biāo)注規(guī)范進行修正。經(jīng)過預(yù)標(biāo)注使標(biāo)注體系趨于穩(wěn)定,便開始正式標(biāo)注。正式標(biāo)注和預(yù)標(biāo)注使用相同的標(biāo)注工具和相同的標(biāo)注規(guī)范。根據(jù)出現(xiàn)的問題,補充病歷樣本并完善規(guī)范。圖2-2所示為我們的中文電子病歷實體關(guān)系標(biāo)注工具。圖2-2中文電子病歷實體關(guān)系標(biāo)注工具

模型圖,注意力,實體,電子病歷


西北師范大學(xué)碩士學(xué)位論文 于人工特征,并且泛化性能弱,沒有充分考慮到中文電子病歷的特點。近年來,神經(jīng)網(wǎng)絡(luò)的方法在實體識別任務(wù)中取得了較好的表現(xiàn)[56],但是電子病歷是一種半結(jié)構(gòu)化的文本數(shù)據(jù),包含大量的醫(yī)學(xué)知識、專業(yè)術(shù)語效果,每個醫(yī)生對標(biāo)點,專業(yè)術(shù)語的使用習(xí)慣不一樣,導(dǎo)致實體邊界難以識別。因此,本文提出一種 BiLSTM-CRF和醫(yī)療知識注意力(Medical Knowledge Attention,MKA)機制結(jié)合的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),醫(yī)療知識詞典中包含的實體定義能夠為電子病歷實體識別提供不同的上下文信息,注意力機制可以學(xué)習(xí)醫(yī)療知識詞典中實體的語義信息,并用于提升電子病歷文本中實體的識別效果,本文提出的模型結(jié)構(gòu)如圖 3-1 所示。

【參考文獻】:
期刊論文
[1]基于CNN-BLSTM-CRF模型的生物醫(yī)學(xué)命名實體識別[J]. 李麗雙,郭元凱.  中文信息學(xué)報. 2018(01)
[2]電子病歷命名實體識別和實體關(guān)系抽取研究綜述[J]. 楊錦鋒,于秋濱,關(guān)毅,蔣志鵬.  自動化學(xué)報. 2014(08)
[3]基于知識庫的臨床決策支持系統(tǒng)構(gòu)建[J]. 張秀梅,徐建武,程煜華,楊公亮.  中華醫(yī)院管理雜志. 2014 (06)
[4]電子病歷中命名實體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩.  中國生物醫(yī)學(xué)工程學(xué)報. 2011(02)
[5]基于UMLS的疾病知識整合框架研究[J]. 李亞子,錢慶,劉崢,方安,洪娜,王軍輝.  現(xiàn)代圖書情報技術(shù). 2011(02)
[6]電子病歷基本規(guī)范(試行)[J].   中國衛(wèi)生質(zhì)量管理. 2010(04)
[7]生物醫(yī)學(xué)命名實體識別的研究與進展[J]. 鄭強,劉齊軍,王正華,朱云平.  計算機應(yīng)用研究. 2010(03)
[8]電子病歷給醫(yī)療行為帶來的變革[J]. 沈偉.  醫(yī)學(xué)信息學(xué)雜志. 2007(04)



本文編號:3607969

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3607969.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶465d6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com