面向急性加重型慢阻肺的計算機輔助診斷模型研究
發(fā)布時間:2021-01-19 12:15
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,簡稱慢阻肺)是一種嚴重危害人類健康的常見病、多發(fā)病,居全球死亡原因第4位。目前,診斷方法是通過病人臨床癥狀、體征、實驗室檢查指標等綜合診斷。一般的診斷方法診斷時間長,治療價格比較高,而且臨床癥狀的描述,缺乏量化指標,容易造成漏診和誤診。本文主要通過對急性加重型慢阻肺特有臨床特征等特征結合分析,并使用自然語言處理相關技術,建立了對急性加重型慢阻肺(AECOPD)電子病歷進行輔助診斷的模型。本文研究對于將電子病歷應用在醫(yī)療輔助診斷領域具有非常重要的學術價值。本文主要從下面幾個方面進行研究且創(chuàng)新點如下:(1)對比目前單獨使用數(shù)據(jù)驅動或使用專家系統(tǒng)在醫(yī)療領域做疾病診斷,本文結合NLP(自然語言處理)技術,通過數(shù)據(jù)驅動的方式結合知識驅動,對文本分類處理,針對患者使特征更具可解釋性,這也是本文的創(chuàng)新點;(2)對于知識驅動,主要是人工讀取專家手冊,并與專家溝通確定AECOPD已有的特征;(3)對于數(shù)據(jù)驅動,根據(jù)AECOPD臨床特征,對電子病歷數(shù)據(jù)進行實體抽取、詞頻特征提取,并將兩者結合;(4)將數(shù)據(jù)驅動與知...
【文章來源】:中北大學山西省
【文章頁數(shù)】:50 頁
【學位級別】:碩士
【部分圖文】:
知識圖譜建設框架圖
首先需要閱讀 AECOPD 診治專家發(fā)表的診治指南或者專家共識手冊,然后通過手動方式標注 AECOPD 診斷主要特征,通過 Bilstm+crf 再根據(jù)數(shù)據(jù)語義識別抽出特征各類,進行學習分類電子病例文本。2.1.2 基于 protege 的本體知識表示本體作為表達知識的共享概念模型,是知識工程中的的重要組成部分。信息提取是從純文本中自動獲取知識的過程。由于書面自然語言的模糊性,信息提取是一項困難的任務;诒倔w的信息提。╫bie)通過以領域本體的形式包含上下文信息來降低這種復雜性。本體通過提供有關領域的概念和關系,為提取過程提供指導。本文正是使用本體構建系統(tǒng) Protege 進行本體表示。在充分了解領域知識之后,人工將整理出的重要概念進行收集并整理,通過簡短的自然語言表達出來,在經(jīng)過該領域的專家確認之后,將下面以 AECOPD 診斷標準為基礎建立的專業(yè)知識體系結構本體:
2.2AECOPD 數(shù)據(jù)清洗2.2.1 電子病例數(shù)據(jù)來源本次研究語料數(shù)據(jù)來源于中日友好醫(yī)院(簡稱“中日醫(yī)院”),由于醫(yī)院較大,年住院 10 萬多人次,每年產(chǎn)生的電子病歷數(shù)據(jù)快速增長,為了提高針對 AECOPD 的診斷準確率,我們與中日友好醫(yī)院呼吸科研究中心合作,獲取到 998 份電子病例記錄,記錄能夠涵蓋病人所有的記錄,病史,檢查等內容。并對出院診斷為慢阻肺急性加重的語料進行標注,約 200 條。所有數(shù)據(jù)均進行了脫敏處理。2.2.2 電子病例結構分析原始的數(shù)據(jù)是本地網(wǎng)頁形式,如圖 2.3 所示。首先進行網(wǎng)頁爬蟲獲取對應的字段值,并存入表格中,如圖 2.4 所示。
【參考文獻】:
期刊論文
[1]基于結構化電子病歷構建臨床路徑的數(shù)據(jù)利用方法探討[J]. 劉建. 信息記錄材料. 2019(02)
[2]基于支持向量機的文本分類[J]. 李蕓初. 中國新技術新產(chǎn)品. 2019(01)
[3]首診慢阻肺錯失早期診斷時間與疾病嚴重程度相關[J]. 彭顯如,黃敏於,趙文驅,袁亞飛,李博厚,葉艷梅,粱健鵬,朱順芳,劉來昱,蔡紹曦,趙海金. 南方醫(yī)科大學學報. 2018(12)
[4]多因素影響特征選擇的短文本分類方法[J]. 李文慧,張英俊,潘理虎. 計算機系統(tǒng)應用. 2018(12)
[5]基于CRF和BI-LSTM的命名實體識別方法[J]. 柏兵,侯霞,石松. 北京信息科技大學學報(自然科學版). 2018(06)
[6]一種基于SVM的線性分類算法[J]. 程鳳偉. 太原學院學報(自然科學版). 2018(04)
[7]基于條件隨機場的地名識別[J]. 田婧,李玉森. 無線互聯(lián)科技. 2018(23)
[8]中文分詞技術綜述[J]. 馮俐. 現(xiàn)代計算機(專業(yè)版). 2018(34)
[9]基于在線評論情感分析的海淘APP用戶滿意度研究[J]. 趙楊,李齊齊,陳雨涵,曹文航. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(11)
[10]基于隱馬爾可夫模型的中文分詞[J]. 吳帥,潘海珍. 現(xiàn)代計算機(專業(yè)版). 2018(33)
博士論文
[1]面向小樣本的文本分類模型及算法研究[D]. 劉川.電子科技大學 2017
[2]基于信息融合的中文筆跡鑒別研究[D]. 鄢煜塵.武漢大學 2009
碩士論文
[1]基于機器學習的文本分類研究與實現(xiàn)[D]. 王振.南京郵電大學 2018
[2]基于核學習方法的非線性系統(tǒng)建模與辨識研究[D]. 張觀東.蘭州交通大學 2018
[3]微信公眾號文本的類別標注方法研究[D]. 鄧羅丹.北京交通大學 2018
[4]半結構化中文簡歷的信息抽取[D]. 晏文壇.華南理工大學 2018
[5]基于詞典與統(tǒng)計結合的中文分詞方法研究及全文檢索系統(tǒng)設計[D]. 周世宇.華中師范大學 2017
[6]中文電子病歷命名實體識別研究[D]. 曲春燕.哈爾濱工業(yè)大學 2015
[7]基于多核融合的中文領域實體關系抽取研究[D]. 陳鵬.昆明理工大學 2014
[8]基于理解的漢語分詞系統(tǒng)的設計與實現(xiàn)[D]. 蘇勇.電子科技大學 2011
本文編號:2986968
【文章來源】:中北大學山西省
【文章頁數(shù)】:50 頁
【學位級別】:碩士
【部分圖文】:
知識圖譜建設框架圖
首先需要閱讀 AECOPD 診治專家發(fā)表的診治指南或者專家共識手冊,然后通過手動方式標注 AECOPD 診斷主要特征,通過 Bilstm+crf 再根據(jù)數(shù)據(jù)語義識別抽出特征各類,進行學習分類電子病例文本。2.1.2 基于 protege 的本體知識表示本體作為表達知識的共享概念模型,是知識工程中的的重要組成部分。信息提取是從純文本中自動獲取知識的過程。由于書面自然語言的模糊性,信息提取是一項困難的任務;诒倔w的信息提。╫bie)通過以領域本體的形式包含上下文信息來降低這種復雜性。本體通過提供有關領域的概念和關系,為提取過程提供指導。本文正是使用本體構建系統(tǒng) Protege 進行本體表示。在充分了解領域知識之后,人工將整理出的重要概念進行收集并整理,通過簡短的自然語言表達出來,在經(jīng)過該領域的專家確認之后,將下面以 AECOPD 診斷標準為基礎建立的專業(yè)知識體系結構本體:
2.2AECOPD 數(shù)據(jù)清洗2.2.1 電子病例數(shù)據(jù)來源本次研究語料數(shù)據(jù)來源于中日友好醫(yī)院(簡稱“中日醫(yī)院”),由于醫(yī)院較大,年住院 10 萬多人次,每年產(chǎn)生的電子病歷數(shù)據(jù)快速增長,為了提高針對 AECOPD 的診斷準確率,我們與中日友好醫(yī)院呼吸科研究中心合作,獲取到 998 份電子病例記錄,記錄能夠涵蓋病人所有的記錄,病史,檢查等內容。并對出院診斷為慢阻肺急性加重的語料進行標注,約 200 條。所有數(shù)據(jù)均進行了脫敏處理。2.2.2 電子病例結構分析原始的數(shù)據(jù)是本地網(wǎng)頁形式,如圖 2.3 所示。首先進行網(wǎng)頁爬蟲獲取對應的字段值,并存入表格中,如圖 2.4 所示。
【參考文獻】:
期刊論文
[1]基于結構化電子病歷構建臨床路徑的數(shù)據(jù)利用方法探討[J]. 劉建. 信息記錄材料. 2019(02)
[2]基于支持向量機的文本分類[J]. 李蕓初. 中國新技術新產(chǎn)品. 2019(01)
[3]首診慢阻肺錯失早期診斷時間與疾病嚴重程度相關[J]. 彭顯如,黃敏於,趙文驅,袁亞飛,李博厚,葉艷梅,粱健鵬,朱順芳,劉來昱,蔡紹曦,趙海金. 南方醫(yī)科大學學報. 2018(12)
[4]多因素影響特征選擇的短文本分類方法[J]. 李文慧,張英俊,潘理虎. 計算機系統(tǒng)應用. 2018(12)
[5]基于CRF和BI-LSTM的命名實體識別方法[J]. 柏兵,侯霞,石松. 北京信息科技大學學報(自然科學版). 2018(06)
[6]一種基于SVM的線性分類算法[J]. 程鳳偉. 太原學院學報(自然科學版). 2018(04)
[7]基于條件隨機場的地名識別[J]. 田婧,李玉森. 無線互聯(lián)科技. 2018(23)
[8]中文分詞技術綜述[J]. 馮俐. 現(xiàn)代計算機(專業(yè)版). 2018(34)
[9]基于在線評論情感分析的海淘APP用戶滿意度研究[J]. 趙楊,李齊齊,陳雨涵,曹文航. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(11)
[10]基于隱馬爾可夫模型的中文分詞[J]. 吳帥,潘海珍. 現(xiàn)代計算機(專業(yè)版). 2018(33)
博士論文
[1]面向小樣本的文本分類模型及算法研究[D]. 劉川.電子科技大學 2017
[2]基于信息融合的中文筆跡鑒別研究[D]. 鄢煜塵.武漢大學 2009
碩士論文
[1]基于機器學習的文本分類研究與實現(xiàn)[D]. 王振.南京郵電大學 2018
[2]基于核學習方法的非線性系統(tǒng)建模與辨識研究[D]. 張觀東.蘭州交通大學 2018
[3]微信公眾號文本的類別標注方法研究[D]. 鄧羅丹.北京交通大學 2018
[4]半結構化中文簡歷的信息抽取[D]. 晏文壇.華南理工大學 2018
[5]基于詞典與統(tǒng)計結合的中文分詞方法研究及全文檢索系統(tǒng)設計[D]. 周世宇.華中師范大學 2017
[6]中文電子病歷命名實體識別研究[D]. 曲春燕.哈爾濱工業(yè)大學 2015
[7]基于多核融合的中文領域實體關系抽取研究[D]. 陳鵬.昆明理工大學 2014
[8]基于理解的漢語分詞系統(tǒng)的設計與實現(xiàn)[D]. 蘇勇.電子科技大學 2011
本文編號:2986968
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2986968.html
最近更新
教材專著