Hadoop環(huán)境下電子病歷檢索研究
發(fā)布時(shí)間:2020-09-19 17:17
電子病歷是醫(yī)院信息管理的一個(gè)重要組成部分,包含了病人在醫(yī)院、縣鄉(xiāng)衛(wèi)生院就診期間產(chǎn)生的全部醫(yī)療臨床信息資源。電子病歷系統(tǒng)的優(yōu)劣對醫(yī)療信息共享、同病種案例對比以及醫(yī)學(xué)領(lǐng)域?qū)W術(shù)研究具有重大的意義。然而,目前國內(nèi)各大醫(yī)院電子病歷系統(tǒng)發(fā)展出現(xiàn)了很多問題,例如電子病歷系統(tǒng)開發(fā)沒有遵循統(tǒng)一標(biāo)準(zhǔn),病歷信息查詢只能按照病人住院號或姓名之類的關(guān)鍵字,電子病歷數(shù)據(jù)的增加導(dǎo)致檢索速度慢等。所以如何存儲劇增的電子病歷數(shù)據(jù),如何提高電子病歷的檢索效率,如果分析海量電子病歷數(shù)據(jù)已經(jīng)成為醫(yī)療界的研究熱點(diǎn)。針對這種情況,本文在對電子病歷國際標(biāo)準(zhǔn)、Hadoop平臺、Lucene搜索框架以及數(shù)據(jù)挖掘技術(shù)進(jìn)行深入研究的基礎(chǔ)上,提出了一種Hadoop環(huán)境下的電子病歷存儲、檢索和分析的解決方案,設(shè)計(jì)并實(shí)現(xiàn)了相應(yīng)的原型系統(tǒng)。首先,將集中式存儲與Hadoop的HDFS分布式存儲相結(jié)合,創(chuàng)新地利用混合式存儲方式來解決電子病歷數(shù)據(jù)劇增的問題。其次,利用分布式、高性能的Map Reduce編程框架對電子病歷數(shù)據(jù)進(jìn)行預(yù)處理、分析器的實(shí)現(xiàn)以及建立電子病歷的Lucene索引,從而實(shí)現(xiàn)電子病歷的全文索引,解決了電子病歷檢索方式單一、檢索速度慢的問題。接著,在Hadoop電子病歷檢索平臺的基礎(chǔ)上利用Map Reduce框架對檢索后的數(shù)據(jù)進(jìn)行Apriori數(shù)據(jù)挖掘優(yōu)化算法分析,獲取電子病歷數(shù)據(jù)固定屬性間的關(guān)聯(lián)關(guān)系。最后,在實(shí)驗(yàn)室Hadoop集群環(huán)境下完成了系統(tǒng)的集成以及數(shù)據(jù)測試。結(jié)果表明,本文的方案不僅可以實(shí)現(xiàn)電子病歷數(shù)據(jù)的存儲、檢索和分析,而且在檢索功能、效率上都有明顯的改善,具有一定的應(yīng)用前景。
【學(xué)位單位】:河北工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2016
【中圖分類】:R197.3;TP311.13
【學(xué)位單位】:河北工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2016
【中圖分類】:R197.3;TP311.13
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 馬錫坤;楊國斌;于京杰;;國內(nèi)電子病歷發(fā)展與應(yīng)用現(xiàn)狀分析[J];計(jì)算機(jī)應(yīng)用與軟件;2015年01期
2 朱媛媛;王曉京;;基于GE碼的HDFS優(yōu)化方案[J];計(jì)算機(jī)應(yīng)用;2013年03期
3 劉娟;豆育升;何晨;唐紅;;基于調(diào)度器的Hadoop性能優(yōu)化方法研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年01期
4 劉樹仁;宋亞奇;朱永利;王德文;;基于Hadoop的智能電網(wǎng)狀態(tài)監(jiān)測數(shù)據(jù)存儲研究[J];計(jì)算機(jī)科學(xué);2013年01期
5 張春明;芮建武;何婷婷;;一種Hadoop小文件存儲和讀取的方法[J];計(jì)算機(jī)應(yīng)用與軟件;2012年11期
6 何安勇;徐敏;吳敏U
本文編號:2822789
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2822789.html
最近更新
教材專著