基于多維時間序列的甲亢疾病數據分析
本文選題:甲亢疾病 + 時間序列; 參考:《東華大學》2016年碩士論文
【摘要】:甲亢(甲狀腺功能亢進癥)是一種病程長、并發(fā)癥多且嚴重危害人類健康的病癥,近年來發(fā)病率更有增高的趨勢。各大醫(yī)院在為甲亢患者提供臨床醫(yī)療服務的過程中,隨著時間的累積會產生大量的臨床檢驗數據,這類檢驗數據對于分析甲亢患者病情有著重要的意義。通過患者疾病數據與大數據分析技術相結合的方法來研究甲亢疾病的產生與發(fā)展過程,有助于實現(xiàn)甲亢患者的個體化醫(yī)療。甲亢患者在治療過程中,醫(yī)生會根據某甲亢患者的T3(三碘甲腺原氨酸)、T4(甲狀腺素)、FT3(游離三碘甲腺原氨酸)、FT4(游離甲狀腺素)、TRAB(甲狀腺受體抗體)、TSH(促甲狀腺素)、TGAB(甲狀腺球蛋白抗體)、TPOAB(甲狀腺過氧化物酶抗體)等八項臨床檢驗指標,對患者的病情進行判斷,相應地給出具體的治療方案。針對單個甲亢患者的所有臨床檢驗指標,以患者體為基本單位,并按治療時間的順序進行排序,則可形成對應于該患者臨床檢驗指標的多維時間序列。在此基礎上深入研究甲亢疾病多維臨床檢驗指標時間序列的聚類分析,從中發(fā)現(xiàn)臨床檢驗指標變化趨勢相似的患者群體,幫助醫(yī)生全面深入的了解甲亢檢驗指標與疾病之間的關系,可以為患者提供更加準確的診斷和更具針對性的治療。本文以真實的甲亢患者臨床檢驗數據為基礎,設計并實現(xiàn)了一種基于多維時間序列的甲亢患者臨床檢驗指標數據分析系統(tǒng)。該系統(tǒng)主要包含三個模塊:1)數據預處理模塊,主要作用是對源數據的預處理和對結構化數據的同步化處理;由于從醫(yī)院拿到的真實甲亢患者數據,是包含了許多噪音的非結構化數據,本文首先通過對復雜非結構化數據進行預處理,然后根據數據本身特點,提出了一種適用于時間序列的規(guī)則化算法,實現(xiàn)不同時間序列維度及時間點的同步化。2)多維時間序列聚類分析模塊,主要功能是同步化臨床檢驗指標時間序列的深度挖掘與分析;在同步化臨床檢驗指標時間序列數據的基礎上,通過引入一個用戶自定義參數即噪聲點占有率Noise Pro,對DBScan算法進行了改進,提出了一種基于密度劃分思想的多維非同步臨床檢驗指標時間序列聚類Lab TS-CLU算法。3)并行化處理模塊,主要功能是提高整個系統(tǒng)的執(zhí)行效率,應對規(guī)模龐大的數據量;考慮到各個機構甲亢患者臨床檢驗數據經過長期的積累,形成了規(guī)模龐大的數據量,本文利用Map Reduce并行計算框架實現(xiàn)了甲亢患者臨床檢驗指標時間序列的處理分析過程,并將其部署到開源分布式平臺Hadoop上。最后,本文利用某三甲醫(yī)院大量甲亢患者近10年的臨床檢驗數據集進行實驗,結果表明該系統(tǒng)提出的算法無論是在執(zhí)行效率還是在準確率方面都優(yōu)于現(xiàn)存的主流時間序列分析算法。并且通過Hadoop并行化平臺的處理,大大提高了系統(tǒng)分析的執(zhí)行效率。實驗結果證明了本系統(tǒng)的有效性,可以為醫(yī)生對于甲亢疾病的全面了解提供一定的技術支持。
[Abstract]:A data analysis system for patients with hyperthyroidism is presented based on the clinical test data of patients with hyperthyroidism , which is based on the clinical test data of patients with hyperthyroidism . This paper makes use of the Map Reduce parallel computing framework to realize the process of processing and analyzing the time series of clinical test indexes of patients with hyperthyroidism . The results show that the proposed algorithm is superior to the existing mainstream time series analysis algorithm in the past ten years in a large number of patients with hyperthyroidism . The results show that the proposed algorithm can provide some technical support for the doctor ' s comprehensive understanding of hyperthyroidism .
【學位授予單位】:東華大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:O211.61
【參考文獻】
相關期刊論文 前7條
1 王連喜;蔣盛益;;一種基于特征聚類的特征選擇方法[J];計算機應用研究;2015年05期
2 高漢松;肖凌;許德瑋;桑梓勤;;基于云計算的醫(yī)療大數據挖掘平臺[J];醫(yī)學信息學雜志;2013年05期
3 潘定;沈鈞毅;;時態(tài)數據挖掘的相似性發(fā)現(xiàn)技術[J];軟件學報;2007年02期
4 段江嬌;薛永生;林子雨;汪衛(wèi);施伯樂;;一種新的基于隱Markov模型的分層時間序列聚類算法[J];計算機研究與發(fā)展;2006年01期
5 李愛國,覃征;大規(guī)模時間序列數據庫降維及相似搜索[J];計算機學報;2005年09期
6 李愛國,覃征;在線分割時間序列數據[J];軟件學報;2004年11期
7 李斌,譚立湘,章勁松,莊鎮(zhèn)泉;面向數據挖掘的時間序列符號化方法研究[J];電路與系統(tǒng)學報;2000年02期
相關博士學位論文 前1條
1 李俊奎;時間序列相似性問題研究[D];華中科技大學;2008年
相關碩士學位論文 前4條
1 舒康;基于HDFS的分布式存儲研究與實現(xiàn)[D];電子科技大學;2014年
2 李嬌龍;基于Hadoop的云計算應用研究[D];電子科技大學;2014年
3 黃曉云;基于HDFS的云存儲服務系統(tǒng)研究[D];大連海事大學;2010年
4 朱珠;基于Hadoop的海量數據處理模型研究和應用[D];北京郵電大學;2008年
,本文編號:1935815
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/1935815.html