天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

Web文本中癥狀命名實(shí)體識(shí)別系統(tǒng)

發(fā)布時(shí)間:2025-01-04 05:34
  網(wǎng)絡(luò)上存在著大量的、寶貴的臨床醫(yī)療信息,僅專(zhuān)業(yè)醫(yī)療網(wǎng)站就幾十個(gè)。但從網(wǎng)絡(luò)上提取醫(yī)學(xué)知識(shí)并結(jié)構(gòu)化、建立醫(yī)學(xué)知識(shí)圖譜,進(jìn)而實(shí)施醫(yī)學(xué)診斷一直是WEB挖掘領(lǐng)域非常具有挑戰(zhàn)的工作。在以往的研究中,很多學(xué)者通過(guò)命名實(shí)體識(shí)別技術(shù)從網(wǎng)頁(yè)文本信息中識(shí)別疾病、癥狀、誘因、化驗(yàn)指標(biāo)、治療措施等相關(guān)術(shù)語(yǔ),并建立起各類(lèi)詞語(yǔ)間的相互關(guān)系。由于癥狀實(shí)體的表述有很多俗語(yǔ)表示,至今還沒(méi)有標(biāo)準(zhǔn)、完善的癥狀庫(kù)。對(duì)癥狀實(shí)體的識(shí)別,也一直沒(méi)有較好的途徑。為解決這一問(wèn)題,本文使用JAVA語(yǔ)言開(kāi)發(fā)了一個(gè)基于癥狀實(shí)體構(gòu)成規(guī)則的Web文本中癥狀實(shí)體識(shí)別系統(tǒng)。并針對(duì)癥狀實(shí)體識(shí)別過(guò)程中的具體問(wèn)題設(shè)計(jì)了相應(yīng)的策略:(1)識(shí)別、提取專(zhuān)業(yè)醫(yī)療網(wǎng)站中的結(jié)構(gòu)化癥狀信息。策略1給出了通用網(wǎng)站中提取癥狀實(shí)體的流程。策略2給出了爬取過(guò)程中斷點(diǎn)續(xù)傳的功能途徑,用于解決程序中斷問(wèn)題。系統(tǒng)運(yùn)行結(jié)果表明,共獲取癥狀實(shí)體18114個(gè)。(2)從癥狀列表中提取部位詞和強(qiáng)癥狀詞,為之后的部位詞+強(qiáng)癥狀詞組合成癥狀提供基礎(chǔ)數(shù)據(jù)。根據(jù)大部分癥狀是由部位詞+強(qiáng)癥狀詞組合而成的特點(diǎn),設(shè)計(jì)了策略3,從策略1、策略2中已獲取的癥狀實(shí)體18114個(gè)中提取部位詞。系統(tǒng)運(yùn)行后,共獲取部位詞...

【文章頁(yè)數(shù)】:63 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-1基本分詞使用示例

圖2-1基本分詞使用示例

AnsjSeg分詞工具有四種可供選擇的調(diào)用方式,即基本分詞-BaseAnalysis、精準(zhǔn)分詞-ToAnalysis、nlp分詞-NlpAnalysis、面向索引的分詞-IndexAnalysis。(1)基本分詞基本分詞是這四種模式中最簡(jiǎn)單快捷的一種模式,它所涉及的詞匯量近....


圖2-2精準(zhǔn)分詞使用示例

圖2-2精準(zhǔn)分詞使用示例

圖2-2精準(zhǔn)分詞使用示例(3)NLP分詞NLP分詞是在功能支持上最全面的一種模式,對(duì)比精準(zhǔn)分詞,它增加了機(jī)構(gòu)名識(shí)別和新詞發(fā)現(xiàn)的功能,可以識(shí)別出未登錄的詞。適用于以下幾種情景:實(shí)體名抽取、整理未登錄詞、文本分析等。功能上較為齊全,只是在速度上較其他幾種分詞模式都要慢,僅4....


圖2-3NLP分詞使用示例

圖2-3NLP分詞使用示例

圖2-2精準(zhǔn)分詞使用示例(3)NLP分詞NLP分詞是在功能支持上最全面的一種模式,對(duì)比精準(zhǔn)分詞,它增加了機(jī)構(gòu)名識(shí)別和新詞發(fā)現(xiàn)的功能,可以識(shí)別出未登錄的詞。適用于以下幾種情景:實(shí)體名抽取、整理未登錄詞、文本分析等。功能上較為齊全,只是在速度上較其他幾種分詞模式都要慢,僅4....


圖2-4面向索引的分詞使用示例

圖2-4面向索引的分詞使用示例

第2章相關(guān)技術(shù)和資源東路/nr]。準(zhǔn)確率準(zhǔn)確率和召回本身是具有一定矛盾性的,AnsjSeg其中一個(gè)優(yōu)點(diǎn)就是巧妙的避開(kāi)了召回率和準(zhǔn)確率之間的沖突。召回的過(guò)程是先通過(guò)精準(zhǔn)分詞模式獲得分詞后結(jié)果,再對(duì)其進(jìn)行細(xì)分,很好的解決了這個(gè)問(wèn)題。如表2-7,面向索引的分詞方法有以下功....



本文編號(hào):4022982

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/4022982.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)4b45a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com