天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 醫(yī)學(xué)論文 > 腫瘤論文 >

四種機(jī)器學(xué)習(xí)分類方法在乙肝相關(guān)肝癌診斷中的應(yīng)用和比較

發(fā)布時(shí)間:2021-03-05 02:09
  目的醫(yī)療診斷是醫(yī)生綜合患者的癥狀體征和多種檢查信息進(jìn)行決策和判斷的過程,其本質(zhì)為分類。肝癌是我國最常見的惡性腫瘤之一,早期肝癌患者臨床癥狀和各類檢查的特征均不明顯,因此難以篩查和診斷。本研究嘗試使用機(jī)器學(xué)習(xí)中Logistic回歸、加權(quán)k近鄰、決策樹、BP人工神經(jīng)網(wǎng)絡(luò)四種分類方法分別構(gòu)建基于血清學(xué)指標(biāo)的早期肝癌的診斷模型,比較模型的診斷效能,評(píng)估四種診斷模型的肝癌篩查價(jià)值和輔助臨床醫(yī)生進(jìn)行早期診斷的可行性。比較四種分類方法的算法特點(diǎn),探索每種方法在臨床數(shù)據(jù)分析中合適的應(yīng)用場(chǎng)景。方法選擇2010年1月至2018年12月解放軍總醫(yī)院第五醫(yī)學(xué)中心收治的5642例慢性乙型肝炎病毒感染者為研究對(duì)象,其中慢性乙型肝炎患者1425例,代償期肝硬化患者567例,失代償期肝硬化患者731例,肝癌患者2919例。2919例肝癌患者中符合米蘭標(biāo)準(zhǔn)的有808例,定義為早期肝癌患者。本研究只關(guān)注早期肝癌,因此研究總樣本為3531例。使用分層抽樣的方法按照7:3的比例將總樣本分為訓(xùn)練集和測(cè)試集。訓(xùn)練集中使用Logistic回歸、加權(quán)k近鄰、決策樹、BP人工神經(jīng)網(wǎng)絡(luò)分別構(gòu)建早期肝癌的診斷模型,并得到相應(yīng)模型的最佳參數(shù)... 

【文章來源】:鄭州大學(xué)河南省 211工程院校

【文章頁數(shù)】:75 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

四種機(jī)器學(xué)習(xí)分類方法在乙肝相關(guān)肝癌診斷中的應(yīng)用和比較


圖2.1研宄流程圖??6??

原理圖,算法模式,近鄰,函數(shù)圖像


?對(duì)象與方法???通過梯度下降的方法多次迭代計(jì)算即可估算出自變量的回歸系數(shù)。見圖2.2。???_?5.?■?r?[.....|?.'丨'??I-?/?:|?I??〇?.,??〇?^ ̄ ̄|?1?1?1?1 ̄?!??-4?-2?0?2?4??圖2.2?Sigmoid函數(shù)圖像(左)和梯度下降算法模式圖(右)??2.3.2加權(quán)k近鄰算法原理??k近鄰算法思想非常樸素。首先將訓(xùn)練集的觀察對(duì)象依據(jù)其變量值投射到高??維空間,每個(gè)觀察對(duì)象就是高維空間中的一個(gè)點(diǎn)。觀察對(duì)象之間的變量屬性越相??似,這些點(diǎn)的空間距離就會(huì)越近。因此相似的觀察對(duì)象在高維空間中表現(xiàn)出一定??的空間聚集性。在本次研究中,當(dāng)將模型應(yīng)用于測(cè)試集時(shí),實(shí)際上是將測(cè)試集中??的每一個(gè)觀察對(duì)象依據(jù)其變量信息(向量)投射到由訓(xùn)練集構(gòu)成的高維空間圖上。??選取距離每一個(gè)測(cè)試集觀察對(duì)象最近的k個(gè)點(diǎn),k個(gè)點(diǎn)中如果肝癌患者多則該對(duì)??象被判定為肝癌,如果非肝癌患者較多則該對(duì)象被判定為非肝癌。見圖2.3。??k近鄰法有兩個(gè)非常重要的問題需要解決。一是不同的k取值會(huì)影響診斷效??能;二是對(duì)于需要判定的測(cè)試集點(diǎn),不同距離的訓(xùn)練集點(diǎn)對(duì)判定的影響力有所不??同,距離越近,判定的權(quán)重應(yīng)該越大。針對(duì)第一個(gè)問題可以借助計(jì)算機(jī)強(qiáng)大的計(jì)??算能力,通過窮舉的方式進(jìn)行解決。針對(duì)第二個(gè)問題,可以通過核函數(shù)賦予距離??更近的點(diǎn)更大的權(quán)重進(jìn)行解決,該方法就是加權(quán)k近鄰算法。見圖2.3。??e?Hn??\?①?令)屮???——.L、 ̄???;g\.?y?^?矩形核函數(shù)?=??????%*?yv?/\??仿數(shù)核嘁數(shù)?A期搞成數(shù)??圖2.3?k近鄰算法判定原理(左)

原理圖,近鄰,核函數(shù),算法


?對(duì)象與方法???通過梯度下降的方法多次迭代計(jì)算即可估算出自變量的回歸系數(shù)。見圖2.2。???_?5.?■?r?[.....|?.'丨'??I-?/?:|?I??〇?.,??〇?^ ̄ ̄|?1?1?1?1 ̄?!??-4?-2?0?2?4??圖2.2?Sigmoid函數(shù)圖像(左)和梯度下降算法模式圖(右)??2.3.2加權(quán)k近鄰算法原理??k近鄰算法思想非常樸素。首先將訓(xùn)練集的觀察對(duì)象依據(jù)其變量值投射到高??維空間,每個(gè)觀察對(duì)象就是高維空間中的一個(gè)點(diǎn)。觀察對(duì)象之間的變量屬性越相??似,這些點(diǎn)的空間距離就會(huì)越近。因此相似的觀察對(duì)象在高維空間中表現(xiàn)出一定??的空間聚集性。在本次研究中,當(dāng)將模型應(yīng)用于測(cè)試集時(shí),實(shí)際上是將測(cè)試集中??的每一個(gè)觀察對(duì)象依據(jù)其變量信息(向量)投射到由訓(xùn)練集構(gòu)成的高維空間圖上。??選取距離每一個(gè)測(cè)試集觀察對(duì)象最近的k個(gè)點(diǎn),k個(gè)點(diǎn)中如果肝癌患者多則該對(duì)??象被判定為肝癌,如果非肝癌患者較多則該對(duì)象被判定為非肝癌。見圖2.3。??k近鄰法有兩個(gè)非常重要的問題需要解決。一是不同的k取值會(huì)影響診斷效??能;二是對(duì)于需要判定的測(cè)試集點(diǎn),不同距離的訓(xùn)練集點(diǎn)對(duì)判定的影響力有所不??同,距離越近,判定的權(quán)重應(yīng)該越大。針對(duì)第一個(gè)問題可以借助計(jì)算機(jī)強(qiáng)大的計(jì)??算能力,通過窮舉的方式進(jìn)行解決。針對(duì)第二個(gè)問題,可以通過核函數(shù)賦予距離??更近的點(diǎn)更大的權(quán)重進(jìn)行解決,該方法就是加權(quán)k近鄰算法。見圖2.3。??e?Hn??\?①?令)屮???——.L、 ̄???;g\.?y?^?矩形核函數(shù)?=??????%*?yv?/\??仿數(shù)核嘁數(shù)?A期搞成數(shù)??圖2.3?k近鄰算法判定原理(左)


本文編號(hào):3064382

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/zlx/3064382.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b1d2f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com