天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于命名實(shí)體識(shí)別的醫(yī)學(xué)術(shù)語(yǔ)發(fā)現(xiàn)及應(yīng)用

發(fā)布時(shí)間:2024-05-10 05:38
  隨著計(jì)算機(jī)應(yīng)用于醫(yī)療事業(yè)的發(fā)展,電子病歷逐漸成為我國(guó)醫(yī)生記錄患者入院、病史、治療、出院的主要載體。電子病歷的特殊作用決定了其必定包含豐富的醫(yī)學(xué)實(shí)體以及復(fù)雜的實(shí)體關(guān)系。醫(yī)學(xué)實(shí)體以及實(shí)體間的關(guān)系是構(gòu)建醫(yī)學(xué)知識(shí)的基礎(chǔ),因此本文提出用機(jī)器學(xué)習(xí)算法對(duì)中文電子病歷進(jìn)行命名實(shí)體識(shí)別以及關(guān)系抽取。針對(duì)中文電子病歷實(shí)體識(shí)別問(wèn)題,本文設(shè)計(jì)了一種基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)合條件隨機(jī)場(chǎng)(Convolutional Neural Network-Conditional Random Field,CNN-CRF)的實(shí)體識(shí)別算法框架。為得到高質(zhì)量的詞向量,本文將標(biāo)注實(shí)體加入詞典進(jìn)行分詞,并將已標(biāo)注和未標(biāo)注文本作為語(yǔ)料,用word2vec工具對(duì)已分詞文本進(jìn)行無(wú)監(jiān)督學(xué)習(xí)。為避免擴(kuò)張卷積層數(shù)增加導(dǎo)致過(guò)擬合,本文采用迭代擴(kuò)張卷積處理輸入向量,并運(yùn)用dropout隨機(jī)丟棄一些連接,最后,利用條件隨機(jī)場(chǎng)對(duì)網(wǎng)絡(luò)的分類結(jié)果進(jìn)行修正。該方法在中文電子病歷上進(jìn)行對(duì)比試驗(yàn),從病歷中提取出身體部位、疾病、癥狀、檢查及治療五類實(shí)體。實(shí)驗(yàn)結(jié)果表明,該方法能有效地辨別病歷中的實(shí)體,其識(shí)別的精確率、召回率和F值分別為90.01%、90.62%、90.31...

【文章頁(yè)數(shù)】:63 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
注釋表
第1章 緒論
    1.1 研究背景與意義
    1.2 命名實(shí)體識(shí)別的研究現(xiàn)狀
        1.2.1 傳統(tǒng)機(jī)器學(xué)習(xí)方法
        1.2.2 深度學(xué)習(xí)方法
    1.3 關(guān)系抽取的研究現(xiàn)狀
        1.3.1 有監(jiān)督的關(guān)系抽取
        1.3.2 半監(jiān)督的關(guān)系抽取
        1.3.3 無(wú)監(jiān)督的關(guān)系抽取
    1.4 論文的主要工作
    1.5 論文結(jié)構(gòu)
第2章 相關(guān)技術(shù)理論
    2.1 卷積神經(jīng)網(wǎng)絡(luò)
        2.1.1 卷積層
        2.1.2 池化層
        2.1.3 全連接層
    2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.2.1 普通循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.2.2 長(zhǎng)短期記憶網(wǎng)絡(luò)
    2.3 條件隨機(jī)場(chǎng)
    2.4 標(biāo)注策略
    2.5 評(píng)測(cè)方法
    2.6 本章小結(jié)
第3章 基于CNN-CRF的中文電子病歷命名實(shí)體識(shí)別
    3.1 數(shù)據(jù)處理
        3.1.1 數(shù)據(jù)集及標(biāo)注
        3.1.2 數(shù)據(jù)預(yù)處理
    3.2 網(wǎng)絡(luò)結(jié)構(gòu)
        3.2.1 擴(kuò)張卷積
        3.2.2 迭代擴(kuò)張卷積
        3.2.3 算法架構(gòu)
    3.3 實(shí)驗(yàn)結(jié)果與分析
        3.3.1 實(shí)驗(yàn)設(shè)置
        3.3.2 實(shí)驗(yàn)結(jié)果對(duì)比分析
    3.4 本章小結(jié)
第4章 基于序列標(biāo)注的中文電子病歷實(shí)體關(guān)系抽取
    4.1 中文電子病歷實(shí)體關(guān)系
    4.2 標(biāo)注模式
    4.3 實(shí)驗(yàn)
        4.3.1 實(shí)驗(yàn)數(shù)據(jù)介紹
        4.3.2 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
        4.3.3 實(shí)驗(yàn)框架
        4.3.4 實(shí)驗(yàn)結(jié)果與分析
    4.4 本章小結(jié)
第5章 總結(jié)與展望
    5.1 工作總結(jié)
    5.2 未來(lái)展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果



本文編號(hào):3968772

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3968772.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1106b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com