乳腺癌數(shù)據(jù)分析與計(jì)算建模
發(fā)布時(shí)間:2021-01-17 19:51
在女性癌癥中,乳腺癌的發(fā)病率最高。早期診斷和治療對(duì)于降低乳腺癌的發(fā)病率和死亡率非常重要。計(jì)算機(jī)輔助診斷系統(tǒng)可以有效提高乳腺癌的診斷準(zhǔn)確性和診斷效率。但是,目前缺少對(duì)乳腺腫瘤不同檢測(cè)特征之間的關(guān)系以及不同特征診斷價(jià)值的研究。此外,大部分機(jī)器學(xué)習(xí)算法需要人為設(shè)置參數(shù),然而選擇合適的參數(shù)是比較困難的。為了解決上述問(wèn)題,本論文主要研究了如下問(wèn)題:(1)利用貝葉斯網(wǎng)絡(luò)定量分析乳腺癌超聲檢查與細(xì)針穿刺細(xì)胞學(xué)(FNAC)檢查中不同特征的診斷價(jià)值,以及不同乳腺癌特征之間的關(guān)系。該研究結(jié)果表明:不同特征之間存在不同程度的影響;不同特征的診斷價(jià)值不同,在超聲檢查中,形態(tài)的診斷價(jià)值最高;在FNAC中裸核的診斷價(jià)值最高。(2)利用異常檢測(cè)算法診斷乳腺癌,并研究基于水平集方法的異常檢測(cè)技術(shù),提出利用水平集方法診斷乳腺癌的方案。實(shí)驗(yàn)結(jié)果表明:K-means算法診斷超聲檢查的性能最好;K近鄰算法診斷FNAC的性能最好。水平集方法描述數(shù)據(jù)的性能很好。(3)利用不同缺失數(shù)據(jù)處理方法處理兩組乳腺癌數(shù)據(jù)中的缺失值。實(shí)驗(yàn)結(jié)果表明:當(dāng)超聲特征中存在缺失數(shù)據(jù)時(shí),不同特征應(yīng)該選擇不同的方法處理;對(duì)于FNAC特征中的缺失數(shù)據(jù),隨機(jī)森...
【文章來(lái)源】:福建師范大學(xué)福建省
【文章頁(yè)數(shù)】:85 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1.兩個(gè)相連節(jié)點(diǎn)之間的四種不同的影響關(guān)系??
個(gè)惡性腫瘤病例)。將FNAC數(shù)據(jù)隨機(jī)分為包括355個(gè)樣本的訓(xùn)練數(shù)據(jù)集(230個(gè)良??性腫瘤病例和125個(gè)惡性腫瘤病例)和包括328?jìng)(gè)樣本的測(cè)試數(shù)據(jù)集(214個(gè)良性??腫瘤病例和114個(gè)惡性腫瘤病例)。利用十折交叉檢驗(yàn)方法測(cè)試,得到如圖2-2所示??的貝葉斯網(wǎng)絡(luò)模型。在圖2-2中,一個(gè)長(zhǎng)方形表示一個(gè)變量(特征),在每個(gè)長(zhǎng)方形??中包括變量的名稱(chēng),每個(gè)變量的所有狀態(tài)以及在訓(xùn)練數(shù)據(jù)集中,每個(gè)變量中不同狀??態(tài)的比例,并用條形圖表示出來(lái)。連接兩個(gè)變量的有向線(xiàn)段表明兩個(gè)變量之間存在??一定的關(guān)系,有向線(xiàn)段的寬度表示程度,線(xiàn)段越寬表明兩者的關(guān)系越強(qiáng)。在圖2-2??中,將“Diagnosis”節(jié)點(diǎn)設(shè)置為目標(biāo)節(jié)點(diǎn),其他節(jié)點(diǎn)均為非目標(biāo)節(jié)點(diǎn),根據(jù)圖2-2??所示的節(jié)點(diǎn)之間的影響關(guān)系,該網(wǎng)絡(luò)可以分析其他節(jié)點(diǎn)對(duì)“Diagnosis”的影響;同??時(shí)可以分析其他相連節(jié)的非目標(biāo)節(jié)點(diǎn)之間的相互影響。??圖2-2?(a)為基于超聲檢查數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)模型,該網(wǎng)絡(luò)結(jié)構(gòu)說(shuō)明SH、RI、??CA和BS都對(duì)Diagnosis節(jié)點(diǎn)有影響;SH與RI、BS之間存在影響關(guān)系
福建師范大學(xué)軟件工程碩士學(xué)位論文??圖2-3?(a)和(b)分別為乳腺腫瘤超聲檢查特征和FNAC檢查特征對(duì)乳腺腫??瘤診斷的影響強(qiáng)度。例如在圖2-3?(a)中可以看出,SH對(duì)乳腺腫瘤診斷的影響最??大,SI=0.3201;其次依次為RI、CA和BS。這意味著在超聲檢查的四個(gè)特征中“SH”??的診斷價(jià)值最高。在圖2-3?(b)中可以看出,BANU對(duì)診斷的影響強(qiáng)度為0.379,??是FNAC診斷中診斷價(jià)值最高的特征。圖2-4對(duì)不同非目標(biāo)特征之間相互依賴(lài)強(qiáng)度??進(jìn)行定量分析。其中,我們用*1?(*代替特征的名稱(chēng),例如SH1)表示產(chǎn)生影響者,??圖中的橫坐標(biāo)表示被影響者。圖2-4?(a)表示,SH對(duì)RI和BS的影響強(qiáng)度分別為??0.1452和0.1465?(菱形標(biāo)記),RI對(duì)SH的影響強(qiáng)度為0.2269?(正方形標(biāo)記),BS??對(duì)SH的影響強(qiáng)度為0.1415?(三角形標(biāo)記),RI和BS之間影響強(qiáng)度比較大,分別為??0.4398和0.4246。在圖2-4?(b)中可以看出UCSI和UCSH之間的影響強(qiáng)度最大。??"?參?參籲??OJ???.?參擊????#??02¥?^???0J?*??%??g?0.2?■?0
【參考文獻(xiàn)】:
期刊論文
[1]基于R語(yǔ)言的缺失數(shù)據(jù)及刪失數(shù)據(jù)處理[J]. 張靈婕,尤添革. 福建電腦. 2017(12)
[2]中國(guó)女性乳腺癌發(fā)病死亡和生存狀況[J]. 陳萬(wàn)青,鄭榮壽. 中國(guó)腫瘤臨床. 2015(13)
[3]追蹤研究中缺失數(shù)據(jù)處理方法及應(yīng)用現(xiàn)狀分析[J]. 葉素靜,唐文清,張敏強(qiáng),曹魏聰. 心理科學(xué)進(jìn)展. 2014(12)
本文編號(hào):2983492
【文章來(lái)源】:福建師范大學(xué)福建省
【文章頁(yè)數(shù)】:85 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1.兩個(gè)相連節(jié)點(diǎn)之間的四種不同的影響關(guān)系??
個(gè)惡性腫瘤病例)。將FNAC數(shù)據(jù)隨機(jī)分為包括355個(gè)樣本的訓(xùn)練數(shù)據(jù)集(230個(gè)良??性腫瘤病例和125個(gè)惡性腫瘤病例)和包括328?jìng)(gè)樣本的測(cè)試數(shù)據(jù)集(214個(gè)良性??腫瘤病例和114個(gè)惡性腫瘤病例)。利用十折交叉檢驗(yàn)方法測(cè)試,得到如圖2-2所示??的貝葉斯網(wǎng)絡(luò)模型。在圖2-2中,一個(gè)長(zhǎng)方形表示一個(gè)變量(特征),在每個(gè)長(zhǎng)方形??中包括變量的名稱(chēng),每個(gè)變量的所有狀態(tài)以及在訓(xùn)練數(shù)據(jù)集中,每個(gè)變量中不同狀??態(tài)的比例,并用條形圖表示出來(lái)。連接兩個(gè)變量的有向線(xiàn)段表明兩個(gè)變量之間存在??一定的關(guān)系,有向線(xiàn)段的寬度表示程度,線(xiàn)段越寬表明兩者的關(guān)系越強(qiáng)。在圖2-2??中,將“Diagnosis”節(jié)點(diǎn)設(shè)置為目標(biāo)節(jié)點(diǎn),其他節(jié)點(diǎn)均為非目標(biāo)節(jié)點(diǎn),根據(jù)圖2-2??所示的節(jié)點(diǎn)之間的影響關(guān)系,該網(wǎng)絡(luò)可以分析其他節(jié)點(diǎn)對(duì)“Diagnosis”的影響;同??時(shí)可以分析其他相連節(jié)的非目標(biāo)節(jié)點(diǎn)之間的相互影響。??圖2-2?(a)為基于超聲檢查數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)模型,該網(wǎng)絡(luò)結(jié)構(gòu)說(shuō)明SH、RI、??CA和BS都對(duì)Diagnosis節(jié)點(diǎn)有影響;SH與RI、BS之間存在影響關(guān)系
福建師范大學(xué)軟件工程碩士學(xué)位論文??圖2-3?(a)和(b)分別為乳腺腫瘤超聲檢查特征和FNAC檢查特征對(duì)乳腺腫??瘤診斷的影響強(qiáng)度。例如在圖2-3?(a)中可以看出,SH對(duì)乳腺腫瘤診斷的影響最??大,SI=0.3201;其次依次為RI、CA和BS。這意味著在超聲檢查的四個(gè)特征中“SH”??的診斷價(jià)值最高。在圖2-3?(b)中可以看出,BANU對(duì)診斷的影響強(qiáng)度為0.379,??是FNAC診斷中診斷價(jià)值最高的特征。圖2-4對(duì)不同非目標(biāo)特征之間相互依賴(lài)強(qiáng)度??進(jìn)行定量分析。其中,我們用*1?(*代替特征的名稱(chēng),例如SH1)表示產(chǎn)生影響者,??圖中的橫坐標(biāo)表示被影響者。圖2-4?(a)表示,SH對(duì)RI和BS的影響強(qiáng)度分別為??0.1452和0.1465?(菱形標(biāo)記),RI對(duì)SH的影響強(qiáng)度為0.2269?(正方形標(biāo)記),BS??對(duì)SH的影響強(qiáng)度為0.1415?(三角形標(biāo)記),RI和BS之間影響強(qiáng)度比較大,分別為??0.4398和0.4246。在圖2-4?(b)中可以看出UCSI和UCSH之間的影響強(qiáng)度最大。??"?參?參籲??OJ???.?參擊????#??02¥?^???0J?*??%??g?0.2?■?0
【參考文獻(xiàn)】:
期刊論文
[1]基于R語(yǔ)言的缺失數(shù)據(jù)及刪失數(shù)據(jù)處理[J]. 張靈婕,尤添革. 福建電腦. 2017(12)
[2]中國(guó)女性乳腺癌發(fā)病死亡和生存狀況[J]. 陳萬(wàn)青,鄭榮壽. 中國(guó)腫瘤臨床. 2015(13)
[3]追蹤研究中缺失數(shù)據(jù)處理方法及應(yīng)用現(xiàn)狀分析[J]. 葉素靜,唐文清,張敏強(qiáng),曹魏聰. 心理科學(xué)進(jìn)展. 2014(12)
本文編號(hào):2983492
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2983492.html
最近更新
教材專(zhuān)著