基于機器學習與鏈路預測的醫(yī)療問答檢測與推薦系統(tǒng)
發(fā)布時間:2020-05-22 22:34
【摘要】:隨著“互聯(lián)網(wǎng)+醫(yī)療”的政策不斷推動,市場上以患者為中心的醫(yī)患問答平臺越來越多,人們現(xiàn)在可以輕松的在網(wǎng)上進行一些醫(yī)療咨詢與疾病診斷。但是目前還是存在許多問題,比如各個醫(yī)患問答平臺的數(shù)據(jù)不互通、平臺醫(yī)生的質(zhì)量良莠不齊、不能在用戶有限時間內(nèi)回答問題、醫(yī)生根據(jù)片面的描述容易誤診等。本文通過市場調(diào)研和分析,開發(fā)一個在B/S架構(gòu)下的醫(yī)療問答檢測與推薦系統(tǒng),該系統(tǒng)使用命名實體識別算法和鏈路預測算法,來實現(xiàn)諸如問答分析、疾病自查、歷史記錄檢索、誤診疾病預測、疾病預測等功能。不僅如此,系統(tǒng)還可以進行新的疾病、癥狀以及問答記錄的更新,可以讓系統(tǒng)不斷注入新數(shù)據(jù)。具體來說,本文主要有以下幾個方面工作:首先,利用java的htmlunit工具類,針對目前使用頻次最多的幾個醫(yī)患問答平臺依次編寫相應的爬蟲規(guī)則,爬取當前已經(jīng)記錄的疾病、病癥以及醫(yī)患問答記錄,并對數(shù)據(jù)進行結(jié)構(gòu)化處理。其次,使用雙向長短時記憶網(wǎng)絡和條件隨機場算法,對每個問答記錄進行命名實體識別,提取出每個問答的疾病和癥狀的相關信息,并構(gòu)建相應的“疾病-癥狀”網(wǎng)絡。然后,本文針對實際數(shù)據(jù)的特點提出一個更能表現(xiàn)單節(jié)點預測正確率的N點連接精確度指標,并在已有的鏈路預測算法上進行改進,提出NIS算法來進行疾病之間連邊的預測和癥狀之間連邊的預測。同時,本文分析了醫(yī)患平臺上疾病頻次的分布以及癥狀在每個疾病中的分布,提出了兩種權(quán)重矩陣的計算方法來進行疾病的預測。最后,使用SSM框架來搭建該系統(tǒng),在系統(tǒng)中集成了命名實體識別算法、鏈路預測算法以及疾病預測算法。系統(tǒng)的前端開發(fā),使用AJAX異步傳輸所有信息,提升用戶使用系統(tǒng)的流暢度。為了提高系統(tǒng)的可維護性,在開發(fā)該系統(tǒng)時候,采用前后端分離,前后端的交互利用JSON格式傳輸數(shù)據(jù)。同時對外提供了API接口,方便其他開發(fā)人員使用本系統(tǒng)的方法和結(jié)果。
【圖文】:
和 NIS 算法。2.1 命名實體識別相關算法命名實體識別[20]就是在一句或者一段話中,識別一些具有特殊含義或者某一領域的實體,這些實體可以是字、詞也可以是特殊文本片段。目前業(yè)界較為常用的模型是長短時記憶網(wǎng)絡(LSTM)模型,該模型可以很好的處理和預測序列數(shù)據(jù)。在命名實體識別任務中,詞嵌入是較為重要的預訓練方法,,目前大多使用的是字嵌入或者詞嵌入。在中文詞嵌入的研究上,RongchaoYin 等提出 MGE[21]模型,該模型可以結(jié)合偏旁部首信息。Shaosheng Cao 等提出以筆畫粒度來進行訓練[22]。在本文中,我們需要的實體就是“疾病”和“病癥”這兩類相對應的詞語。我們的任務就是在得到的醫(yī)療問答中,提取提及到的相應的疾病和病癥。2.1.1 循環(huán)神經(jīng)網(wǎng)絡循環(huán)神經(jīng)網(wǎng)絡可以記住以前的信息,并且利用已經(jīng)記錄下來的以前信息來影響后續(xù)信息的輸出。
圖 2-2 LSTM 結(jié)構(gòu)示意圖圖 2-2 所示,LSTM 在時刻 t 的輸入有 3 個,分別是:當前的信息輸入 X(t);刻的輸出 A(t-1);上一時刻的單元狀態(tài) C(t-1)。為了控制長期狀態(tài) C,LSTM些“門”來讓信息有選擇性的來影響網(wǎng)絡的輸出。圖 2-3 長短時記憶單元結(jié)構(gòu)示意圖
【學位授予單位】:電子科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP181;TP391.3;R-05
本文編號:2676712
【圖文】:
和 NIS 算法。2.1 命名實體識別相關算法命名實體識別[20]就是在一句或者一段話中,識別一些具有特殊含義或者某一領域的實體,這些實體可以是字、詞也可以是特殊文本片段。目前業(yè)界較為常用的模型是長短時記憶網(wǎng)絡(LSTM)模型,該模型可以很好的處理和預測序列數(shù)據(jù)。在命名實體識別任務中,詞嵌入是較為重要的預訓練方法,,目前大多使用的是字嵌入或者詞嵌入。在中文詞嵌入的研究上,RongchaoYin 等提出 MGE[21]模型,該模型可以結(jié)合偏旁部首信息。Shaosheng Cao 等提出以筆畫粒度來進行訓練[22]。在本文中,我們需要的實體就是“疾病”和“病癥”這兩類相對應的詞語。我們的任務就是在得到的醫(yī)療問答中,提取提及到的相應的疾病和病癥。2.1.1 循環(huán)神經(jīng)網(wǎng)絡循環(huán)神經(jīng)網(wǎng)絡可以記住以前的信息,并且利用已經(jīng)記錄下來的以前信息來影響后續(xù)信息的輸出。
圖 2-2 LSTM 結(jié)構(gòu)示意圖圖 2-2 所示,LSTM 在時刻 t 的輸入有 3 個,分別是:當前的信息輸入 X(t);刻的輸出 A(t-1);上一時刻的單元狀態(tài) C(t-1)。為了控制長期狀態(tài) C,LSTM些“門”來讓信息有選擇性的來影響網(wǎng)絡的輸出。圖 2-3 長短時記憶單元結(jié)構(gòu)示意圖
【學位授予單位】:電子科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP181;TP391.3;R-05
【參考文獻】
相關期刊論文 前4條
1 汪鵬;吳昊;;國內(nèi)外移動互聯(lián)網(wǎng)醫(yī)療應用現(xiàn)狀及未來發(fā)展趨勢探討[J];中國數(shù)字醫(yī)學;2014年01期
2 袁小毅;;在線醫(yī)療革命重啟:醫(yī)療APP成開路先鋒[J];互聯(lián)網(wǎng)周刊;2012年19期
3 呂琳媛;;復雜網(wǎng)絡鏈路預測[J];電子科技大學學報;2010年05期
4 沈麗寧;;國外健康信息服務現(xiàn)狀掃描及啟示[J];醫(yī)學信息學雜志;2010年06期
本文編號:2676712
本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/2676712.html
最近更新
教材專著