天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于類不平衡處理的乳腺癌預(yù)后預(yù)測模型研究

發(fā)布時間:2020-06-11 22:27
【摘要】:目的:本文探討不平衡分類的乳腺癌數(shù)據(jù)集基于機器學(xué)習(xí)方法預(yù)測預(yù)后的生存狀態(tài)。本研究旨在根據(jù)1845名乳腺癌患者的隨訪數(shù)據(jù),建立出穩(wěn)定、可靠的預(yù)測模型,以此為基礎(chǔ)選擇預(yù)測效果相對較好的預(yù)后預(yù)測模型。對影響乳腺癌預(yù)后生存或死亡狀態(tài)的因素進行探討,選擇解釋性不同的模型對影響因素解釋。方法:乳腺腫瘤預(yù)后的生存狀態(tài)數(shù)據(jù)為不平衡數(shù)據(jù),本文使用SMOTE、Borderline-SMOTE、AD ASYN、One-sided select處理乳腺腫瘤生存狀態(tài)的不平衡數(shù)據(jù)。對預(yù)后狀態(tài)分類選用經(jīng)典決策樹、條件推斷樹、隨機森林和支持向量機。評價指標(biāo)采用準(zhǔn)確率、敏感度、特異性、正例命中率、負(fù)例命中率來評價分類器的效果;對收集的乳腺癌數(shù)據(jù)集進行初步的探索性分析,針對Logistic回歸模型,解釋回歸系數(shù)和一元優(yōu)勢比的估計值,給出決策樹每個分支所對應(yīng)的因素及對應(yīng)結(jié)局發(fā)生的概率、使用隨機森林方法對影響乳腺癌患者預(yù)后生存狀態(tài)的影響因素進行排序。結(jié)果:(1)針對乳腺癌患者預(yù)后數(shù)據(jù)集生存狀態(tài)不平衡這一問題,欠采樣方法One-Sided select技術(shù),結(jié)合條件決策樹預(yù)測,在不平衡的乳腺癌數(shù)據(jù)集中預(yù)后預(yù)測效果最好,將敏感度由2%提高到58%,提高了56%。(2)使用Cox分析中的逐步向前法后,從因變量中篩選出:T分期、N分期、孕激素、HER2、是否采用內(nèi)分泌治療和是否進行化療。(3)Logistic回歸篩選出年齡、N分期、乳腺癌內(nèi)分泌治療、化療手段、多灶性病灶、化療。通過隨機森林的特征變量的重要性來看,年齡、激素受體表達(dá)、腫塊大小、N分期、臨床分期、T分期變量的重要性更靠前。結(jié)論:本文所針對類不平衡乳腺癌數(shù)據(jù)集所使用的數(shù)據(jù)挖掘方法,同樣可以用于其他類不平衡疾病數(shù)據(jù)集,也可用于疾病的發(fā)生、發(fā)展、治療方法的療效及最終預(yù)后的影響因素等更多的醫(yī)學(xué)研究。
【圖文】:

技術(shù)路線圖,全文,挖掘分析,關(guān)聯(lián)規(guī)則


9圖 1 全文技術(shù)路線圖Fig. 1 Technology Road Map of Thesis3 研究方法為了對收集到的數(shù)據(jù)集進行挖掘分析,常使用的方法包括分類、回歸、聚類、關(guān)聯(lián)規(guī)則分析等。數(shù)據(jù)挖掘的一個流程圖如下:

流程圖,數(shù)據(jù)挖掘,流程圖


圖 2 數(shù)據(jù)挖掘流程圖Fig. 2 Data mining flow chart一個數(shù)據(jù)挖掘分析的基本流程,主要有三塊:對要分析選擇合適的數(shù)據(jù)挖掘方法及挖掘軟件和結(jié)合實際分析的目標(biāo)是根據(jù)需求明確要做什么,然后就是根據(jù)目標(biāo)獲取的挖掘技術(shù),最后就是對挖掘的結(jié)果進行分析,不斷的結(jié)果,從而獲得一個穩(wěn)定有效、準(zhǔn)確而有意義的模型,合實際的解決方案。及預(yù)處理機構(gòu)工作人員收集數(shù)據(jù)的方式不同,醫(yī)學(xué)數(shù)據(jù)通常包含衡、缺失和無關(guān)變量[17]。此外,醫(yī)療數(shù)據(jù)還存在數(shù)據(jù)量平衡的[18,19]。以上羅列的原始數(shù)據(jù)集存在問題會造成后數(shù)據(jù)挖掘的性能也會被降低。因此,數(shù)據(jù)預(yù)處理應(yīng)作為,,并且數(shù)據(jù)預(yù)處理在數(shù)據(jù)挖掘中耗費 70%-80%的時間[20學(xué)數(shù)據(jù)集可以提高臨床可解釋性[21]、降低計算成本[22]、
【學(xué)位授予單位】:新疆醫(yī)科大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R737.9;R181.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳莉莉;石菊芳;劉玉琴;岳馨培;王樂;馬恒敏;黃慧瑤;王仲照;代敏;;基于人群的乳腺癌預(yù)后參數(shù)研究現(xiàn)狀[J];中華乳腺病雜志(電子版);2018年06期

2 公彥棟;黃焰;;乳腺癌預(yù)后預(yù)測評估模型的研究進展[J];癌癥進展;2016年09期

3 魏美琴;;中藥在乳腺癌預(yù)后復(fù)發(fā)中的應(yīng)用進展[J];中國繼續(xù)醫(yī)學(xué)教育;2016年09期

4 雷蕾;吳斌;何濤;湯艷;;2001至2012年乳腺癌預(yù)后因素研究的中文文獻(xiàn)計量分析[J];瀘州醫(yī)學(xué)院學(xué)報;2014年02期

5 郭雅明;吳萬敏;李艷杰;;乳腺癌預(yù)后的相關(guān)因素研究進展[J];內(nèi)蒙古醫(yī)學(xué)雜志;2008年01期

6 白杰;吳萬敏;呂時來;;乳腺癌預(yù)后因素研究新進展[J];臨床外科雜志;2007年06期

7 胡曉清;陳理達(dá);趙挺;;BMI與乳腺癌預(yù)后關(guān)系的臨床分析[J];臨床醫(yī)學(xué);2006年02期

8 白杰;吳萬敏;;乳腺癌預(yù)后因素研究新進展[J];內(nèi)蒙古醫(yī)學(xué)院學(xué)報;2006年S1期

9 劉秀芹;122例乳腺癌預(yù)后指標(biāo)的表達(dá)情況回顧及總結(jié)[J];中原醫(yī)刊;2004年05期

10 朱濤,鄭巧敏,董敏;腫瘤標(biāo)志物對乳腺癌預(yù)后的評估[J];井岡山醫(yī)專學(xué)報;2004年03期

相關(guān)會議論文 前10條

1 王新遠(yuǎn);;關(guān)于年齡與乳腺癌預(yù)后因素的分析[A];第四屆中國腫瘤學(xué)術(shù)大會暨第五屆海峽兩岸腫瘤學(xué)術(shù)會議論文集[C];2006年

2 關(guān)晏星;雷秋模;王莉;張蕓;段紅華;吳根秀;;泌乳素受體與乳腺癌預(yù)后的相關(guān)性研究[A];2000全國腫瘤學(xué)術(shù)大會論文集[C];2000年

3 呂明麗;張小平;蔡海東;;乳腺癌預(yù)后相關(guān)細(xì)胞因子的分析[A];中華醫(yī)學(xué)會第九次全國核醫(yī)學(xué)學(xué)術(shù)會議論文摘要匯編[C];2011年

4 劉鵬;王穎;寧連勝;孟潔;狄根紅;孫慧;戰(zhàn)忠利;王慶生;張利華;;PCNA對Ⅰ期乳腺癌預(yù)后意義的評估[A];2000全國腫瘤學(xué)術(shù)大會論文集[C];2000年

5 許丹寧;川允波;;雌激素受體及其在乳腺癌中的作用研究進展[A];中國畜牧獸醫(yī)學(xué)會獸醫(yī)產(chǎn)科學(xué)分會第五屆全體會議第十次學(xué)術(shù)研討會論文集[C];2009年

6 陳雅青;;DCE-MRI與乳腺癌預(yù)后相關(guān)性研究[A];中華醫(yī)學(xué)會第16次全國放射學(xué)學(xué)術(shù)大會論文匯編[C];2009年

7 李紅霞;范欽和;李吉友;解云濤;;p73 G4C14-to-A4T14(GC/AT)基因多態(tài)性與乳腺癌預(yù)后的關(guān)系[A];中華醫(yī)學(xué)會病理學(xué)分會2007年學(xué)術(shù)年會暨第九屆全國病理大會論文匯編[C];2007年

8 袁們;王雯邈;常江;于典科;徐兵河;;乳腺癌差異表達(dá)基因3`UTR遺傳變異與三陰性乳腺癌預(yù)后的關(guān)聯(lián)研究[A];第八屆中國腫瘤學(xué)術(shù)大會暨第十三屆海峽兩岸腫瘤學(xué)術(shù)會議論文匯編[C];2014年

9 陳益定;吳金民;鄭備義;陳麗榮;鄧甬川;王海軍;彭佳萍;鄭樹;;Ki-67核抗原與SPF值的相關(guān)性及其與乳腺癌預(yù)后的關(guān)系[A];2000全國腫瘤學(xué)術(shù)大會論文集[C];2000年

10 張志剛;黃建;;CXCR4的表達(dá)與乳腺癌預(yù)后及病理特征的Meta分析[A];國家級“乳腺癌診治新進展”學(xué)習(xí)班暨學(xué)術(shù)年會論文匯編[C];2013年

相關(guān)重要報紙文章 前4條

1 記者 張夢然;三種罕見基因突變影響乳腺癌預(yù)后[N];科技日報;2018年

2 余志平;甲狀腺激素影響乳腺癌預(yù)后[N];中國醫(yī)藥報;2005年

3 余科;乳腺癌預(yù)后判斷[N];醫(yī)藥經(jīng)濟報;2009年

4 記者 馮衛(wèi)東;乳腺癌預(yù)后有了新生物標(biāo)記[N];科技日報;2014年

相關(guān)博士學(xué)位論文 前10條

1 李晶;彩色多普勒超聲對乳腺癌診斷和灰階超聲對乳腺癌預(yù)后的研究[D];中國醫(yī)科大學(xué);2007年

2 王妍妍;生物標(biāo)志物與乳腺癌預(yù)后關(guān)系的相關(guān)研究[D];浙江大學(xué);2015年

3 畢曉峰;乳腺癌相關(guān)蛋白表達(dá)分析及與臨床預(yù)后關(guān)系的研究[D];中國協(xié)和醫(yī)科大學(xué);2008年

4 張靈小;多基因單核苷酸多態(tài)與三陰性乳腺癌預(yù)后及療效的關(guān)聯(lián)研究[D];北京協(xié)和醫(yī)學(xué)院;2012年

5 杜躍耀;腎上腺素受體表達(dá)及相關(guān)的基因多態(tài)性與乳腺癌預(yù)后及易感性的研究[D];復(fù)旦大學(xué);2012年

6 譚茹;動態(tài)增強磁共振血管成像與乳腺癌預(yù)后因素的相關(guān)性分析[D];山東大學(xué);2015年

7 孟祥穎;Bcl-2及相關(guān)miR-16、miR-15b、miR-195對乳腺癌預(yù)后影響的研究[D];中國人民解放軍軍事醫(yī)學(xué)科學(xué)院;2010年

8 周幸春;腫瘤/睪丸抗原在乳腺癌組織中的表達(dá)與乳腺癌預(yù)后相關(guān)性的研究[D];第四軍醫(yī)大學(xué);2012年

9 傅佩芬;胰島素樣生長因子1受體在乳腺癌中的表達(dá)及臨床意義[D];浙江大學(xué);2013年

10 劉芳芳;腫瘤浸潤Treg細(xì)胞的化療敏感性及其與乳腺癌預(yù)后關(guān)系的研究[D];天津醫(yī)科大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 王哲;基于類不平衡處理的乳腺癌預(yù)后預(yù)測模型研究[D];新疆醫(yī)科大學(xué);2019年

2 魏選東;基于芯片分析的乳腺癌預(yù)后核心基因篩選及其預(yù)測效果分析[D];湖南師范大學(xué);2018年

3 黃鵬;基于基因共表達(dá)網(wǎng)絡(luò)分析的三陰性乳腺癌預(yù)后相關(guān)基因與鉑應(yīng)答靶點關(guān)系的研究[D];中國醫(yī)科大學(xué);2018年

4 王夢;原發(fā)病灶病理緩解狀態(tài)對ypN0期乳腺癌預(yù)后的影響[D];天津醫(yī)科大學(xué);2018年

5 邸世愷;血清催乳素水平與乳腺癌預(yù)后有關(guān)臨床及病理因素的相關(guān)性研究[D];青海大學(xué);2018年

6 賴雨程;雌激素受體β(ERβ)對乳腺癌預(yù)后預(yù)測的Meta分析和文獻(xiàn)綜述[D];浙江大學(xué);2017年

7 覃宇周;復(fù)發(fā)轉(zhuǎn)移相關(guān)基因聯(lián)合表達(dá)判斷早期乳腺癌預(yù)后的研究[D];廣西醫(yī)科大學(xué);2007年

8 王超;基于細(xì)胞信號通路互作的乳腺癌預(yù)后計算模型研究[D];西南大學(xué);2016年

9 喬向彬;探討超聲彈性成像評估乳腺癌預(yù)后的價值[D];遵義醫(yī)學(xué)院;2013年

10 譚浩翔;內(nèi)皮素-1與乳腺癌預(yù)后的關(guān)系[D];福建醫(yī)科大學(xué);2004年



本文編號:2708563

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/yufangyixuelunwen/2708563.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bbd91***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com