在線醫(yī)療文本中的實體識別研究
發(fā)布時間:2018-01-01 07:45
本文關(guān)鍵詞:在線醫(yī)療文本中的實體識別研究 出處:《北京大學學報(自然科學版)》2016年01期 論文類型:期刊論文
更多相關(guān)文章: 實體識別 數(shù)據(jù)挖掘 條件隨機場 醫(yī)療信息
【摘要】:針對在線醫(yī)療文本,設計考慮醫(yī)療領(lǐng)域特性的識別特征,并在自建數(shù)據(jù)集上進行實體識別實驗。針對常見的5類疾病:胃炎、肺癌、哮喘、高血壓和糖尿病,采用近年來較先進的機器學習模型條件隨機場,進行訓練和測試,抽取目標實體包括疾病、癥狀、藥品、治療方法和檢查5類。通過采用逐一添加特征的實驗方式,驗證所提特征的有效性,取得總體上81.26%的準確率和60.18%的召回率,隨后對識別特征給出進一步分析。
[Abstract]:According to the online medical text recognition, feature design considering the characteristics of the medical field, and entity recognition experiment in self built data sets. For 5 kinds of common diseases, gastritis, lung cancer, asthma, hypertension and diabetes in recent years, with the more advanced machine learning model of CRFs, training and testing, including the target entity extraction diseases, symptoms, drug, treatment and examination of 5 class. The experimental way through one by one to add features, to verify the effectiveness of the proposed feature, achieved recall rate of overall accuracy rate of 81.26% and 60.18%, as well as the recognition features are further analyzed.
【作者單位】: 南開大學計算機與控制工程學院(軟件學院);
【基金】:天津市科技支撐項目(13ZCZDGX01098) 天津市自然科學基金(14JCQNJC00600) 中國民航信息技術(shù)科研基地開放課題(CAAC-ITRB-201303)資助
【分類號】:TP391.1
【正文快照】: 天津市科技支撐項目(13ZCZDGX01098)、天津市自然科學基金(14JCQNJC00600)和中國民航信息技術(shù)科研基地開放課題(CAAC-ITRB-201303)資助隨著生活水平的提高,人們對于健康問題日益關(guān)注;ヂ(lián)網(wǎng)行業(yè)的迅猛發(fā)展催生一大批在線醫(yī)療社區(qū)和醫(yī)療信息網(wǎng)站,為患者提供了多元化的醫(yī)療信息
【參考文獻】
相關(guān)期刊論文 前2條
1 楊錦鋒;于秋濱;關(guān)毅;蔣志鵬;;電子病歷命名實體識別和實體關(guān)系抽取研究綜述[J];自動化學報;2014年08期
2 葉楓;陳鶯鶯;周根貴;李昊e,
本文編號:1363572
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1363572.html
最近更新
教材專著