天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

虛擬健康社區(qū)中的命名實(shí)體識(shí)別方法研究

發(fā)布時(shí)間:2021-11-01 02:51
  虛擬健康社區(qū)已經(jīng)成為當(dāng)前非常流行的健康信息交流平臺(tái),人們可以從其他人那里獲取有用的信息并和他們交流經(jīng)驗(yàn)。然而,很多有價(jià)值的健康信息是隱藏在非結(jié)構(gòu)化文檔中,這些信息很難變成能夠?yàn)獒t(yī)生和病人提供醫(yī)學(xué)幫助的知識(shí)。現(xiàn)有的研究往往聚焦于電子病歷中的文本信息提取和知識(shí)發(fā)現(xiàn),而不考慮目前被人們廣泛使用的虛擬健康社區(qū)。然而,虛擬健康社區(qū)已經(jīng)成為一種新的健康信息交流手段,其中蘊(yùn)涵了大量的健康知識(shí),這些健康知識(shí)的提取和發(fā)現(xiàn)對(duì)輔助醫(yī)療決策具有重要意義。命名實(shí)體識(shí)別是文本中的信息提取和知識(shí)發(fā)現(xiàn)的重要環(huán)節(jié),本論文針對(duì)虛擬健康社區(qū),研究網(wǎng)絡(luò)文本中的健康實(shí)體抽取方法,提出了一種新的命名實(shí)體和實(shí)體修飾識(shí)別方法。該方法引入了中文統(tǒng)一醫(yī)學(xué)語(yǔ)言系統(tǒng)(CUMLS),并基于中文在線醫(yī)療網(wǎng)站構(gòu)建了一個(gè)新的醫(yī)學(xué)詞典。在此基礎(chǔ)上,該方法使用潛在狄利克雷概率模型(LDA)和基于規(guī)則的方法抽取文本中的特征,并應(yīng)用BIEO方法進(jìn)行特征標(biāo)注,進(jìn)而應(yīng)用條件隨機(jī)場(chǎng)(CRF)識(shí)別健康命名實(shí)體和它們的類(lèi)型。此外,本文采用基于中文語(yǔ)義規(guī)則的方法對(duì)實(shí)體修飾進(jìn)行了識(shí)別,主要針對(duì)否定修飾、時(shí)間修飾和檢查實(shí)體的修飾,通過(guò)對(duì)中文表達(dá)的分析,提取相關(guān)修飾的規(guī)則,... 

【文章來(lái)源】:北京理工大學(xué)北京市 211工程院校 985工程院校

【文章頁(yè)數(shù)】:58 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景
    1.2 研究目的和意義
    1.3 研究?jī)?nèi)容
    1.4 論文組織結(jié)構(gòu)
第2章 研究現(xiàn)狀
    2.1 基于詞典和規(guī)則方法的命名實(shí)體識(shí)別
    2.2 基于機(jī)器學(xué)習(xí)方法的命名實(shí)體識(shí)別
        2.2.1 基于分類(lèi)算法的機(jī)器學(xué)習(xí)
        2.2.2 基于序列標(biāo)記的機(jī)器學(xué)習(xí)
    2.3 命名實(shí)體修飾識(shí)別
    2.4 研究述評(píng)
第3章 命名實(shí)體識(shí)別方法
    3.1 概述
    3.2 命名實(shí)體及詞典
        3.2.1 命名實(shí)體類(lèi)型
        3.2.2 受控詞典
    3.3 分詞及詞性標(biāo)記
    3.4 狄利克雷主題概率模型
        3.4.1 主題概率模型
        3.4.2 吉布斯采樣
        3.4.3 最短編輯距離
    3.5 中文語(yǔ)義特征
    3.6 文本特征標(biāo)記
    3.7 條件隨機(jī)場(chǎng)模型
        3.7.1 序列標(biāo)記
        3.7.2 條件隨機(jī)場(chǎng)
        3.7.3 CRF++
    3.8 本章小結(jié)
第4章 實(shí)體修飾識(shí)別方法
    4.1 概述
    4.2 否定修飾的提取
    4.3 時(shí)間的修飾
        4.3.1 時(shí)間表達(dá)的劃分
        4.3.2 時(shí)間修飾識(shí)別
    4.4 檢查實(shí)體的修飾提取
    4.5 本章小結(jié)
第5章 實(shí)驗(yàn)過(guò)程與結(jié)果分析
    5.1 數(shù)據(jù)準(zhǔn)備
    5.2 實(shí)體識(shí)別評(píng)價(jià)標(biāo)準(zhǔn)
    5.3 LDA參數(shù)選擇
    5.4 實(shí)驗(yàn)結(jié)果
        5.4.1 不同特征選擇的比較
        5.4.2 命名實(shí)體結(jié)果的比較
        5.4.3 顯著性分析
        5.4.4 修飾識(shí)別結(jié)果
第6章 討論與展望
    6.1 工作總結(jié)
    6.2 主要?jiǎng)?chuàng)新點(diǎn)
    6.3 未來(lái)展望
參考文獻(xiàn)
攻讀學(xué)位期間發(fā)表論文與研究成果清單
致謝


【參考文獻(xiàn)】:
期刊論文
[1]中文一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)的構(gòu)建與應(yīng)用[J]. 李丹亞,胡鐵軍,李軍蓮,錢(qián)慶,諸文雁.  情報(bào)雜志. 2011(02)

碩士論文
[1]中文病歷文本的時(shí)間信息提取研究[D]. 周小甲.浙江大學(xué) 2011



本文編號(hào):3469378

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/3469378.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f5159***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com