天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于雙層標注的中文電子病歷命名實體識別

發(fā)布時間:2023-10-22 10:39
  計算機信息技術(shù)的發(fā)展帶來了海量的醫(yī)療數(shù)據(jù)。作為臨床信息系統(tǒng)最重要的組成部分,電子病歷記錄了患者診療過程中的詳細信息,包含了眾多寶貴的醫(yī)療資源。電子病歷中的自由文本以半結(jié)構(gòu)或是無結(jié)構(gòu)的形式存在,要將這些非結(jié)構(gòu)化的病歷數(shù)據(jù)所包含的有效信息快速提取出來,采用自然語言處理技術(shù)進行文本挖掘是必不可少的。命名實體識別是文本數(shù)據(jù)挖掘的關(guān)鍵技術(shù),因此,對電子病歷中的醫(yī)療實體進行識別具有重要作用。本研究提出了一種基于領(lǐng)域詞典和條件隨機場的雙層標注模型。該模型通過構(gòu)建一個小規(guī)模的醫(yī)療領(lǐng)域詞典,再結(jié)合條件隨機場,進行了兩次不同粒度的標注,對中文電子病歷中的疾病、癥狀、操作、藥品四類醫(yī)療實體進行識別。同時對比分析了深度神經(jīng)網(wǎng)絡(luò)的識別效果。本文的主要內(nèi)容包括以下部分:(1)利用統(tǒng)計方法從中文電子病歷中獲取關(guān)鍵詞以及利用外部專業(yè)資源獲取關(guān)鍵詞這兩種途徑構(gòu)建領(lǐng)域詞典,并標注中文電子病歷命名實體識別標注語料庫。(2)基于雙層標注的中文電子病歷命名實體識別。將富含領(lǐng)域知識的領(lǐng)域詞典與序列標注算法CRF相結(jié)合,提出了一種一次預(yù)標注-二次精確標注的雙層標注模型。通過兩次不同粒度的標注,將領(lǐng)域詞典的準確性和機器學(xué)習(xí)的自動性融...

【文章頁數(shù)】:58 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景及意義
    1.2 研究現(xiàn)狀
        1.2.1 通用領(lǐng)域命名實體識別研究現(xiàn)狀
        1.2.2 電子病歷命名實體識別研究現(xiàn)狀
    1.3 本文主要研究內(nèi)容
    1.4 本文組織結(jié)構(gòu)
第二章 基于雙層標注的中文電子病歷命名實體識別
    2.1 中文電子病歷文本語言特點
    2.2 領(lǐng)域詞典構(gòu)建
        2.2.1 統(tǒng)計方法構(gòu)建領(lǐng)域詞典
        2.2.2 外部專業(yè)資源構(gòu)建領(lǐng)域詞典
    2.3 條件隨機場模型原理介紹
    2.4 基于領(lǐng)域詞典和條件隨機場的雙層標注模型
    2.5 實驗準備
        2.5.1 特征模板
        2.5.2 實驗數(shù)據(jù)集及評估方法
    2.6 實驗結(jié)果與分析
    2.7 本章小結(jié)
第三章 雙層標注模型與深度學(xué)習(xí)對醫(yī)療實體識別的比較
    3.1 深度學(xué)習(xí)處理命名實體識別問題原理
        3.1.1 Bi LSTM-CRF
        3.1.2 Transformer-CRF
    3.2 深度神經(jīng)網(wǎng)絡(luò)的領(lǐng)域預(yù)處理
    3.3 實驗結(jié)果與分析
        3.3.1 深度學(xué)習(xí)的對比分析
        3.3.2 深度學(xué)習(xí)方法與雙層標注模型的對比分析
    3.4 本章小結(jié)
第四章 雙層標注模型的其他應(yīng)用
    4.1 雙層標注模型對不區(qū)分科室病歷的普適性
    4.2 真實兒科病歷醫(yī)療實體識別
    4.3 本章小結(jié)
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻
附錄1 攻讀碩士學(xué)位期間撰寫的論文
致謝



本文編號:3856353

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3856353.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b9e64***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com