醫(yī)療健康大數(shù)據(jù)的并行處理方法研究
發(fā)布時(shí)間:2020-07-02 22:44
【摘要】:隨著信息技術(shù)的不斷發(fā)展,醫(yī)院內(nèi)信息系統(tǒng)愈加完善,特別是物聯(lián)網(wǎng)、移動(dòng)醫(yī)療、自動(dòng)化分析檢測(cè)儀、可穿戴設(shè)備的普及,醫(yī)院、醫(yī)生和患者都成了數(shù)據(jù)的直接創(chuàng)造者,每天都會(huì)有大量的數(shù)據(jù)產(chǎn)生并存儲(chǔ)。充分挖掘醫(yī)療健康大數(shù)據(jù)中包含的潛在價(jià)值,對(duì)提高醫(yī)療服務(wù)質(zhì)量、節(jié)約醫(yī)療成本、加強(qiáng)個(gè)人健康管理具有重要作用。但是將潛在價(jià)值挖掘出來的過程卻充滿挑戰(zhàn)。其中一個(gè)問題就是計(jì)算負(fù)擔(dān)的問題,數(shù)據(jù)量的增長(zhǎng)、數(shù)據(jù)維度的增長(zhǎng)都使得現(xiàn)有的串行計(jì)算方式不堪重負(fù),醫(yī)生如果想從海量臨床記錄中挖掘出有效的信息,可能僅在算法模型訓(xùn)練階段就耗費(fèi)幾小時(shí)甚至幾天的時(shí)間,數(shù)據(jù)處理的工作會(huì)占用醫(yī)生大量寶貴的時(shí)間和精力。還有一個(gè)問題就是醫(yī)療健康大數(shù)據(jù)的不完整性和時(shí)效性常常導(dǎo)致研究人員訓(xùn)練出的模型具有較差的泛化能力,在面對(duì)真實(shí)的數(shù)據(jù)時(shí),經(jīng)常表現(xiàn)出較大的精度落差。在醫(yī)療健康大數(shù)據(jù)環(huán)境下,針對(duì)現(xiàn)有數(shù)據(jù)分析算法處理能力不足,數(shù)據(jù)分析耗時(shí)長(zhǎng),分析算法適應(yīng)能力較差等問題,本論文研究了當(dāng)今主流的并行計(jì)算方法,來應(yīng)對(duì)這些挑戰(zhàn)。主要研究?jī)?nèi)容包括:在臨床數(shù)據(jù)方面,研究了 CUDA并行平臺(tái),結(jié)合心電數(shù)據(jù)特點(diǎn),設(shè)計(jì)了并行的心拍分割和特征提取方法,再結(jié)合算法特點(diǎn),設(shè)計(jì)出并行的廣義回歸神經(jīng)網(wǎng)絡(luò)用于心拍的分類任務(wù),為心血管疾病的診斷提供輔助信息。在保證較高分類精度的前提下,并行算法使得程序的運(yùn)行效率獲得上百倍的提升,大大縮短了數(shù)據(jù)處理時(shí)間,為醫(yī)生節(jié)約出更多的時(shí)間,使得醫(yī)生可以將更多的精力放在診療過程中。在個(gè)人健康數(shù)據(jù)方面,研究了 OpenCL并行平臺(tái),設(shè)計(jì)出了一種基于智能手機(jī)的個(gè)性化運(yùn)動(dòng)分類方法,通過集成在智能手機(jī)中的加速度傳感器和陀螺儀收集運(yùn)動(dòng)數(shù)據(jù),設(shè)計(jì)實(shí)現(xiàn)了并行Adaboost-stump算法用于分類模型的訓(xùn)練,對(duì)坐、站、走、跑、騎車五種常見的運(yùn)動(dòng)進(jìn)行分類,并取得了令人滿意的分類精度。OpenCL下的并行設(shè)計(jì)充分發(fā)揮了智能手機(jī)的計(jì)算能力,大大縮短了數(shù)據(jù)處理時(shí)間,使得用戶可以便捷、高效地在智能手機(jī)上訓(xùn)練屬于自己的個(gè)性化模型。在數(shù)據(jù)分析平臺(tái)方面,設(shè)計(jì)實(shí)現(xiàn)了基于并行計(jì)算和機(jī)器學(xué)習(xí)的臨床決策支持系統(tǒng),在機(jī)器學(xué)習(xí)算法方面實(shí)現(xiàn)了 6種常用的機(jī)器學(xué)習(xí)模型,以適應(yīng)不同的數(shù)據(jù)分析需求。在程序運(yùn)行效率方面分別把上述6種算法在3種不同框架下并行化,使得系統(tǒng)可以在不同的硬件環(huán)境下都能獲得效率提升。實(shí)驗(yàn)中,系統(tǒng)表現(xiàn)出了出色的運(yùn)行效率和分類精度,可以高效、精確地完成提供醫(yī)療輔助建議的作用。
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:R-05
【圖文】:
GHJ則面對(duì)的是類翌較為統(tǒng)一的、相互依賴性低的、規(guī)模較大的數(shù)逡逑據(jù),W及沒有分支、中斷的單一計(jì)算環(huán)境。這就導(dǎo)致CPU和GPU在硬件架構(gòu)上逡逑呈現(xiàn)出很大的不同。如圖2.2所示。圖中綠包的部分是計(jì)算單元,黃的是控制單逡逑元,撞龜?shù)氖谴鎯?chǔ)單元。從圖中我們可W看出,在GPU中存在大量的計(jì)算單元,逡逑存儲(chǔ)和控制單元被大大簡(jiǎn)化。而CPU中,大量的空間被存儲(chǔ)單元,而且還有復(fù)逡逑雜邀輯控制單元和圖中沒有展示的諸多優(yōu)化電路,相比之下計(jì)算單元在CPU中逡逑1之逡逑
樣串行執(zhí)行,下面我們來介紹核函數(shù)是如何在GPU硬件上并行執(zhí)行的t66l逡逑核函數(shù)中的計(jì)算任務(wù)在執(zhí)行時(shí)被映射為大量可W并行執(zhí)行的線程,并由硬件逡逑動(dòng)態(tài)巧度并執(zhí)行這些線程。這些線程的組織形式如圖2.6所示,所有的線程被映逡逑射成若干個(gè)Grid,每個(gè)Grid由若干個(gè)B1ck±構(gòu)成,k胃觶攏歟錚悖脛杏職舾篩鰣義希裕瑁潁澹幔洹J導(dǎo)實(shí)募撲闃噶鈑桑裕瑁潁澹幔渫瓿,同一赣z攏耄唬脛械乃校裕瑁潁澹幔洌笫遣⑿繡義現(xiàn)蔥械,灾q飧觶攏歟錚悖脛興怯形ㄒ壞模簦瑁潁澹幔洌歟洌曄,哉C絳蟶杓頻氖焙蚩桑族義細(xì)菡廡┍曄肚植煌南叱蹋刂撇煌南叱潭圓煌氖萁脅僮鰨詞迪皺義系ブ噶疃嗍薟僮鰨櫻桑停膩澹ǎ櫻椋睿紓歟澹歟睿螅簦恚悖簦椋錚睿停酰歟簦椋穡歟澹模幔簦幔。此外,壤_跡玻鄧懼義蟢胃觶攏歟悖耍輳脛卸加幸豢榭桑贅咚俜夢(mèng)實(shí)墓蠶砬紗媯誨澹攏歟錚悖脛械乃校裕瑁潁澹幔洌簀義峽桑桌謎飪楣蠶砟詿嫦嗷ネㄐ擰T儐蟶峽匆桓霾忝媯琸胃觶攏歟錚悖朐謨布弦彩清義喜⑿兄蔥械
本文編號(hào):2738779
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:R-05
【圖文】:
GHJ則面對(duì)的是類翌較為統(tǒng)一的、相互依賴性低的、規(guī)模較大的數(shù)逡逑據(jù),W及沒有分支、中斷的單一計(jì)算環(huán)境。這就導(dǎo)致CPU和GPU在硬件架構(gòu)上逡逑呈現(xiàn)出很大的不同。如圖2.2所示。圖中綠包的部分是計(jì)算單元,黃的是控制單逡逑元,撞龜?shù)氖谴鎯?chǔ)單元。從圖中我們可W看出,在GPU中存在大量的計(jì)算單元,逡逑存儲(chǔ)和控制單元被大大簡(jiǎn)化。而CPU中,大量的空間被存儲(chǔ)單元,而且還有復(fù)逡逑雜邀輯控制單元和圖中沒有展示的諸多優(yōu)化電路,相比之下計(jì)算單元在CPU中逡逑1之逡逑
樣串行執(zhí)行,下面我們來介紹核函數(shù)是如何在GPU硬件上并行執(zhí)行的t66l逡逑核函數(shù)中的計(jì)算任務(wù)在執(zhí)行時(shí)被映射為大量可W并行執(zhí)行的線程,并由硬件逡逑動(dòng)態(tài)巧度并執(zhí)行這些線程。這些線程的組織形式如圖2.6所示,所有的線程被映逡逑射成若干個(gè)Grid,每個(gè)Grid由若干個(gè)B1ck±構(gòu)成,k胃觶攏歟錚悖脛杏職舾篩鰣義希裕瑁潁澹幔洹J導(dǎo)實(shí)募撲闃噶鈑桑裕瑁潁澹幔渫瓿,同一赣z攏耄唬脛械乃校裕瑁潁澹幔洌笫遣⑿繡義現(xiàn)蔥械,灾q飧觶攏歟錚悖脛興怯形ㄒ壞模簦瑁潁澹幔洌歟洌曄,哉C絳蟶杓頻氖焙蚩桑族義細(xì)菡廡┍曄肚植煌南叱蹋刂撇煌南叱潭圓煌氖萁脅僮鰨詞迪皺義系ブ噶疃嗍薟僮鰨櫻桑停膩澹ǎ櫻椋睿紓歟澹歟睿螅簦恚悖簦椋錚睿停酰歟簦椋穡歟澹模幔簦幔。此外,壤_跡玻鄧懼義蟢胃觶攏歟悖耍輳脛卸加幸豢榭桑贅咚俜夢(mèng)實(shí)墓蠶砬紗媯誨澹攏歟錚悖脛械乃校裕瑁潁澹幔洌簀義峽桑桌謎飪楣蠶砟詿嫦嗷ネㄐ擰T儐蟶峽匆桓霾忝媯琸胃觶攏歟錚悖朐謨布弦彩清義喜⑿兄蔥械
本文編號(hào):2738779
本文鏈接:http://www.sikaile.net/yixuelunwen/yiyuanguanlilunwen/2738779.html
最近更新
教材專著