基于關(guān)聯(lián)算法的人體檢測數(shù)據(jù)的處理與分析
發(fā)布時(shí)間:2021-12-23 03:06
關(guān)聯(lián)分析技術(shù)作為數(shù)據(jù)挖掘領(lǐng)域的熱門研究分支之一,其研究內(nèi)容是從大量潛在隱含未知關(guān)系的數(shù)據(jù)項(xiàng)中發(fā)現(xiàn)有用的關(guān)系。高血壓作為一種常見的嚴(yán)重危害人類健康的慢性病,近年來,其患病率和死亡率在全球范圍內(nèi)持續(xù)攀升。伴隨著醫(yī)療信息產(chǎn)業(yè)的發(fā)展,醫(yī)療數(shù)據(jù)庫中儲存的高血壓等慢性病的臨床數(shù)據(jù)越來越多。如何從這些歷史醫(yī)療數(shù)據(jù)中發(fā)現(xiàn)有用的信息為今后的疾病診斷和病理研究提供科學(xué)準(zhǔn)確的依據(jù)成了目前亟待解決的問題之一。相較于傳統(tǒng)數(shù)據(jù)分析方法,數(shù)據(jù)挖掘技術(shù)可以有效地解決這一難題。本課題使用關(guān)聯(lián)分析技術(shù)從大規(guī)模的高血壓患者診治數(shù)據(jù)中探究高血壓患者生理體征參數(shù)與高血壓患病風(fēng)險(xiǎn)水平之間的潛在關(guān)系。重點(diǎn)完成了以下工作:(1)對數(shù)據(jù)挖掘技術(shù)和關(guān)聯(lián)分析技術(shù)的相關(guān)理論進(jìn)行了闡述,研究了關(guān)聯(lián)分析技術(shù)在醫(yī)學(xué)領(lǐng)域的應(yīng)用情況,對關(guān)聯(lián)分析中的Apriori算法做了重點(diǎn)研究,分析了Apriori算法的不足之處,引入了目前通用的一些優(yōu)化方法,為后面的優(yōu)化提供了思路。(2)改進(jìn)的Apriori算法結(jié)合課題研究內(nèi)容引入項(xiàng)約束條件對事務(wù)數(shù)據(jù)庫D進(jìn)行篩選排除得到事務(wù)數(shù)據(jù)庫D1,然后在事務(wù)數(shù)據(jù)庫D1中求得頻繁項(xiàng)集。為了避免Apriori算法反復(fù)掃描數(shù)據(jù)庫、耗...
【文章來源】:西安科技大學(xué)陜西省
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
實(shí)例執(zhí)行過程圖
j++; end if end if end if end for if (i >= j && n == k-1) //滿足連接條件 insert p 并集{ext} to Ck+1; end ifend forriori 算法的性能分析后的算法進(jìn)行實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)在 12GB 內(nèi)存,Intel(R) Core(TMdows7 系統(tǒng)的 PC 機(jī)上進(jìn)行。首先選取 UCI標(biāo)準(zhǔn)測試數(shù)據(jù)庫中的驗(yàn)驗(yàn)證數(shù)據(jù),該數(shù)據(jù)包含了 8124 條記錄,每條記錄有 23 個(gè)屬性圖 3.3 所示。
圖 3.4 accidents 數(shù)據(jù)集部分原始數(shù)據(jù)表 3.10 同一最小支持度閾值不同數(shù)據(jù)集下算法所需執(zhí)行的時(shí)間測試數(shù)據(jù)集算法所需執(zhí)行的時(shí)間(ms)Apriori 算法 改進(jìn)算法mushroom 1644 574accidents 145618 38801從運(yùn)行結(jié)果可以得出結(jié)論:在最小支持度閾值都為 40%的情況下,兩個(gè)算dents 數(shù)據(jù)集中執(zhí)行的時(shí)間都要比在 mushroom 數(shù)據(jù)集中執(zhí)行的時(shí)間要多,這說挖掘所需要的時(shí)間與數(shù)據(jù)集本身的數(shù)據(jù)特點(diǎn)有很大的關(guān)系;但是可以得出的結(jié)算法在兩個(gè)實(shí)驗(yàn)數(shù)據(jù)集上執(zhí)行耗時(shí)要明顯優(yōu)于原始 Apriori 算法。 本章小結(jié)本章首先引入了關(guān)聯(lián)規(guī)則中的項(xiàng)目約束的概念,指出了用戶參與挖掘過程的從課題的研究內(nèi)容出發(fā)提出了改進(jìn)算法選取的約束條件。之后針對原始 Apri繁掃描事務(wù)數(shù)據(jù)庫的缺點(diǎn)給出了映射的優(yōu)化方式,并借鑒 Separate 算法對頻繁
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)挖掘中并行離散化數(shù)據(jù)準(zhǔn)備優(yōu)化[J]. 劉云,袁浩恒. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(05)
[2]淺析數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理技術(shù)[J]. 張治斌,劉威. 數(shù)字技術(shù)與應(yīng)用. 2017(10)
[3]基于上三角矩陣構(gòu)造多叉樹的多維關(guān)聯(lián)規(guī)則挖掘算法[J]. 葉濤,于利霞,張亞平. 軟件工程. 2017(06)
[4]慢性病大數(shù)據(jù)分析平臺設(shè)計(jì)[J]. 邱航,龍虎,潘驚萍,王利亞,余海燕. 中國衛(wèi)生信息管理雜志. 2017(02)
[5]基于數(shù)據(jù)挖掘的曹克光教授治療慢性胃炎用藥規(guī)律分析[J]. 吳清秀,韓德軍,楊錫燕. 河北中醫(yī). 2017(02)
[6]遺傳算法的數(shù)據(jù)挖掘技術(shù)在醫(yī)療大數(shù)據(jù)中的應(yīng)用[J]. 呂峰,楊宏,普奕,賈婧鎣. 電子技術(shù)與軟件工程. 2017(05)
[7]四大類主要慢性病流行現(xiàn)狀與應(yīng)對策略[J]. 劉國棟,王樺,汪琦,李晨芳,曾爾亢,吳曉玲. 中國社會醫(yī)學(xué)雜志. 2017(01)
[8]數(shù)據(jù)挖掘技術(shù)綜述[J]. 鄒祎. 信息通信. 2016(12)
[9]基于病案首頁的醫(yī)療大數(shù)據(jù)挖掘研究[J]. 熊志剛,姚剛. 中國數(shù)字醫(yī)學(xué). 2016(09)
[10]一種基于Apriori算法的優(yōu)化挖掘算法[J]. 陳志飛,馮鈞. 計(jì)算機(jī)與現(xiàn)代化. 2016(09)
碩士論文
[1]改進(jìn)的關(guān)聯(lián)規(guī)則算法在慢性病數(shù)據(jù)挖掘中的研究[D]. 楊余壘.浙江理工大學(xué) 2017
[2]基于數(shù)據(jù)挖掘的郭立中教授辨治常見慢性病的病案研究[D]. 季飛.南京中醫(yī)藥大學(xué) 2015
[3]基于C4.5算法的高血壓分類規(guī)則提取的研究[D]. 林玲玲.太原理工大學(xué) 2012
本文編號:3547653
【文章來源】:西安科技大學(xué)陜西省
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
實(shí)例執(zhí)行過程圖
j++; end if end if end if end for if (i >= j && n == k-1) //滿足連接條件 insert p 并集{ext} to Ck+1; end ifend forriori 算法的性能分析后的算法進(jìn)行實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)在 12GB 內(nèi)存,Intel(R) Core(TMdows7 系統(tǒng)的 PC 機(jī)上進(jìn)行。首先選取 UCI標(biāo)準(zhǔn)測試數(shù)據(jù)庫中的驗(yàn)驗(yàn)證數(shù)據(jù),該數(shù)據(jù)包含了 8124 條記錄,每條記錄有 23 個(gè)屬性圖 3.3 所示。
圖 3.4 accidents 數(shù)據(jù)集部分原始數(shù)據(jù)表 3.10 同一最小支持度閾值不同數(shù)據(jù)集下算法所需執(zhí)行的時(shí)間測試數(shù)據(jù)集算法所需執(zhí)行的時(shí)間(ms)Apriori 算法 改進(jìn)算法mushroom 1644 574accidents 145618 38801從運(yùn)行結(jié)果可以得出結(jié)論:在最小支持度閾值都為 40%的情況下,兩個(gè)算dents 數(shù)據(jù)集中執(zhí)行的時(shí)間都要比在 mushroom 數(shù)據(jù)集中執(zhí)行的時(shí)間要多,這說挖掘所需要的時(shí)間與數(shù)據(jù)集本身的數(shù)據(jù)特點(diǎn)有很大的關(guān)系;但是可以得出的結(jié)算法在兩個(gè)實(shí)驗(yàn)數(shù)據(jù)集上執(zhí)行耗時(shí)要明顯優(yōu)于原始 Apriori 算法。 本章小結(jié)本章首先引入了關(guān)聯(lián)規(guī)則中的項(xiàng)目約束的概念,指出了用戶參與挖掘過程的從課題的研究內(nèi)容出發(fā)提出了改進(jìn)算法選取的約束條件。之后針對原始 Apri繁掃描事務(wù)數(shù)據(jù)庫的缺點(diǎn)給出了映射的優(yōu)化方式,并借鑒 Separate 算法對頻繁
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)挖掘中并行離散化數(shù)據(jù)準(zhǔn)備優(yōu)化[J]. 劉云,袁浩恒. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(05)
[2]淺析數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理技術(shù)[J]. 張治斌,劉威. 數(shù)字技術(shù)與應(yīng)用. 2017(10)
[3]基于上三角矩陣構(gòu)造多叉樹的多維關(guān)聯(lián)規(guī)則挖掘算法[J]. 葉濤,于利霞,張亞平. 軟件工程. 2017(06)
[4]慢性病大數(shù)據(jù)分析平臺設(shè)計(jì)[J]. 邱航,龍虎,潘驚萍,王利亞,余海燕. 中國衛(wèi)生信息管理雜志. 2017(02)
[5]基于數(shù)據(jù)挖掘的曹克光教授治療慢性胃炎用藥規(guī)律分析[J]. 吳清秀,韓德軍,楊錫燕. 河北中醫(yī). 2017(02)
[6]遺傳算法的數(shù)據(jù)挖掘技術(shù)在醫(yī)療大數(shù)據(jù)中的應(yīng)用[J]. 呂峰,楊宏,普奕,賈婧鎣. 電子技術(shù)與軟件工程. 2017(05)
[7]四大類主要慢性病流行現(xiàn)狀與應(yīng)對策略[J]. 劉國棟,王樺,汪琦,李晨芳,曾爾亢,吳曉玲. 中國社會醫(yī)學(xué)雜志. 2017(01)
[8]數(shù)據(jù)挖掘技術(shù)綜述[J]. 鄒祎. 信息通信. 2016(12)
[9]基于病案首頁的醫(yī)療大數(shù)據(jù)挖掘研究[J]. 熊志剛,姚剛. 中國數(shù)字醫(yī)學(xué). 2016(09)
[10]一種基于Apriori算法的優(yōu)化挖掘算法[J]. 陳志飛,馮鈞. 計(jì)算機(jī)與現(xiàn)代化. 2016(09)
碩士論文
[1]改進(jìn)的關(guān)聯(lián)規(guī)則算法在慢性病數(shù)據(jù)挖掘中的研究[D]. 楊余壘.浙江理工大學(xué) 2017
[2]基于數(shù)據(jù)挖掘的郭立中教授辨治常見慢性病的病案研究[D]. 季飛.南京中醫(yī)藥大學(xué) 2015
[3]基于C4.5算法的高血壓分類規(guī)則提取的研究[D]. 林玲玲.太原理工大學(xué) 2012
本文編號:3547653
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3547653.html
最近更新
教材專著