基于深度學(xué)習(xí)的中文電子病歷實(shí)體及其修飾識(shí)別技術(shù)研究
發(fā)布時(shí)間:2020-06-28 17:16
【摘要】:智慧醫(yī)療是當(dāng)前人工智能領(lǐng)域的研究熱點(diǎn),而在各種醫(yī)療數(shù)據(jù)中,電子病歷具有重要價(jià)值。電子病歷是醫(yī)務(wù)人員通過電子病歷系統(tǒng)在醫(yī)療活動(dòng)過程中產(chǎn)生的一種臨床文本信息,是一種記錄患者信息的數(shù)字化信息。通過對(duì)電子病歷的分析與挖掘,可以得到大量的與患者密切相關(guān)的醫(yī)療信息,這對(duì)臨床決策能起到很大的幫助。自然語(yǔ)言處理技術(shù)可以幫助我們實(shí)現(xiàn)對(duì)電子病歷文本信息的挖掘,如命名實(shí)體識(shí)別、實(shí)體修飾識(shí)別等技術(shù)。其中實(shí)體識(shí)別旨在識(shí)別出病歷中不同實(shí)體的實(shí)體邊界與類別,實(shí)體修飾旨在識(shí)別出特定實(shí)體與患者之間的修飾關(guān)系。但是與其他文本相比,中文電子病歷存在大量包括書寫不規(guī)范、專業(yè)術(shù)語(yǔ)較多、特殊字符頻繁、句子結(jié)構(gòu)不完整等問題。同時(shí),由于涉及到患者的隱私,導(dǎo)致目前開源的電子病歷數(shù)據(jù)不多。這些問題加大了對(duì)電子病歷的信息進(jìn)行挖掘和識(shí)別的難度。因此為了更好地對(duì)電子病歷信息進(jìn)行抽取,本文利用深度學(xué)習(xí)方法在自主標(biāo)注的數(shù)據(jù)集上對(duì)中文電子病歷的醫(yī)療實(shí)體與修飾識(shí)別及其聯(lián)合識(shí)別技術(shù)進(jìn)行了研究:(1)基于知識(shí)注意力機(jī)制增強(qiáng)的實(shí)體識(shí)別。雖然以往的相關(guān)工作都取得了較好的成果,但是卻忽略了能夠提供豐富實(shí)體信息的外部醫(yī)療知識(shí),因此本文提出了基于醫(yī)療知識(shí)注意力增強(qiáng)的CNN-BLSTM-CRF方法。通過使用注意力機(jī)制,對(duì)醫(yī)療詞典中的醫(yī)療實(shí)體的定義與邊界信息進(jìn)行編碼,來增強(qiáng)神經(jīng)網(wǎng)絡(luò)模型的性能。其中,在BLSTM對(duì)文本信息編碼前,先用CNN預(yù)先提取了文本的字級(jí)別表示并作為文本信息的補(bǔ)充信息,有效地解決了上文中提出的電子病歷存在的書寫不規(guī)范和特殊詞頻繁等問題。(2)基于CNN-GRU神經(jīng)網(wǎng)絡(luò)的實(shí)體修飾識(shí)別。使用了 GRU網(wǎng)絡(luò)對(duì)電子病歷文本信息進(jìn)行了編碼,并使用Softmax進(jìn)行解碼。其中,GRU網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)一個(gè)變體,與之相比GRU更好地解決了遠(yuǎn)距離依賴的問題且計(jì)算方式更簡(jiǎn)單。同時(shí)使用了 CNN網(wǎng)絡(luò)預(yù)先提取了字符級(jí)表示以解決書寫不規(guī)范和特殊字符頻繁等問題。(3)實(shí)體及其修飾聯(lián)合識(shí)別。在聯(lián)合識(shí)別任務(wù)中本文提出了一種基于多標(biāo)簽方案的聯(lián)合識(shí)別方法,并使用BLSTM-LSTM模型進(jìn)行識(shí)別。與傳統(tǒng)的串聯(lián)式識(shí)別方法相比,基于多標(biāo)簽方案的方法,可以成功的將兩個(gè)步驟轉(zhuǎn)換為一個(gè)步驟:通過多標(biāo)簽方案,使用端到端模型一步識(shí)別。實(shí)驗(yàn)結(jié)果表明,在相同的數(shù)據(jù)集上,本文的方法相較于其他方法取得了較好的性能。
【學(xué)位授予單位】:西北師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:R-05;TP391.1;TP18
【圖文】:
圖2-3實(shí)體與修飾標(biāo)注工具逡逑
圖3-1深度學(xué)習(xí)模型結(jié)構(gòu)逡逑在本文中,模型首先將輸入文本分別轉(zhuǎn)換為每個(gè)字對(duì)應(yīng)的預(yù)訓(xùn)練字符的嵌入逡逑向量矩陣和隨機(jī)生成的字符向量矩陣,其中預(yù)訓(xùn)練的字符嵌入向量通過查詢預(yù)先逡逑'
【學(xué)位授予單位】:西北師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:R-05;TP391.1;TP18
【圖文】:
圖2-3實(shí)體與修飾標(biāo)注工具逡逑
圖3-1深度學(xué)習(xí)模型結(jié)構(gòu)逡逑在本文中,模型首先將輸入文本分別轉(zhuǎn)換為每個(gè)字對(duì)應(yīng)的預(yù)訓(xùn)練字符的嵌入逡逑向量矩陣和隨機(jī)生成的字符向量矩陣,其中預(yù)訓(xùn)練的字符嵌入向量通過查詢預(yù)先逡逑'
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 葉楓;陳鶯鶯;周根貴;李昊e
本文編號(hào):2733254
本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/2733254.html
最近更新
教材專著