基于隨機(jī)森林算法的關(guān)鍵蛋白識(shí)別方法研究
發(fā)布時(shí)間:2021-06-05 04:39
識(shí)別出生物體內(nèi)有用的蛋白質(zhì)對(duì)生物體進(jìn)化以及醫(yī)學(xué)領(lǐng)域都要極其重要的作用。當(dāng)前辨別蛋白質(zhì)重要性的方式有兩種。一是基于生物化學(xué)方法,但利用生物實(shí)驗(yàn)的方法來識(shí)別具有一定的缺陷,具體表現(xiàn)為:時(shí)間較長、費(fèi)用較高、以及不能處理數(shù)據(jù)量較大的問題等等。二是利用計(jì)算機(jī)為工具對(duì)生物進(jìn)行分析并以生物學(xué)的相關(guān)知識(shí)進(jìn)行解釋的一種方式。利用計(jì)算機(jī)識(shí)別蛋白重要性的方法大多是利用蛋白質(zhì)交互網(wǎng)絡(luò)(Protein Interaction Network)提取拓?fù)渲行男远攘刻卣鱽碜R(shí)別?墒怯捎谝恍┫嚓P(guān)生物實(shí)驗(yàn)數(shù)據(jù)的殘缺和蛋白質(zhì)網(wǎng)絡(luò)自身的復(fù)雜性,一直沒有發(fā)現(xiàn)可以準(zhǔn)確區(qū)別關(guān)鍵蛋白質(zhì)和非關(guān)鍵蛋白質(zhì)的單一中心性度量特征,并且從目前的相關(guān)研究來看,關(guān)鍵蛋白質(zhì)和非關(guān)鍵蛋白質(zhì)間的區(qū)別不能由單一特征決定,應(yīng)該是由多種因素共同決定的。單一中心性度量往往不能有效識(shí)別關(guān)鍵蛋白質(zhì),需要融合多個(gè)拓?fù)渲行男远攘糠椒?突破傳統(tǒng)的利用排序進(jìn)行精細(xì)選擇的方式,建立機(jī)器學(xué)習(xí)模型進(jìn)行蛋白的分類和識(shí)別。隨機(jī)森林算法屬于集成類型的算法,可以集成多個(gè)單分類器即集成多棵決策樹的分類效果從而組成一個(gè)整體意義上的分類器。鑒于之前研究均是利用單一特征進(jìn)行分類識(shí)別,且由于隨機(jī)森...
【文章來源】:吉林農(nóng)業(yè)大學(xué)吉林省
【文章頁數(shù)】:36 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
隨機(jī)森林原理圖
度中心性示意圖
:( )= ∑ ∑( , , )( . ), ≠ ≠ 點(diǎn) k 與 j 之間的最短路徑條數(shù), ( 路徑條數(shù)。在計(jì)算節(jié)點(diǎn)之間的路徑點(diǎn),介數(shù)中心性就是反應(yīng)某一節(jié)點(diǎn)的相關(guān)示例。節(jié)點(diǎn) 1 的 BC 值,+(2,1,4)(2,4)+(2,1,5)(2,5)+(3,1,2)(3,2)+(3,1,4(3,4(4,1,3)(4,3)+(4,1,5)(4,5)+(5,1,2)(5,2)+(5,1,3)(5,3) + + + + + + + + = 8 = 0, = 6, =0。比較結(jié)果1 在該網(wǎng)絡(luò)中最重要,如果去點(diǎn)節(jié)點(diǎn)
本文編號(hào):3211454
【文章來源】:吉林農(nóng)業(yè)大學(xué)吉林省
【文章頁數(shù)】:36 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
隨機(jī)森林原理圖
度中心性示意圖
:( )= ∑ ∑( , , )( . ), ≠ ≠ 點(diǎn) k 與 j 之間的最短路徑條數(shù), ( 路徑條數(shù)。在計(jì)算節(jié)點(diǎn)之間的路徑點(diǎn),介數(shù)中心性就是反應(yīng)某一節(jié)點(diǎn)的相關(guān)示例。節(jié)點(diǎn) 1 的 BC 值,+(2,1,4)(2,4)+(2,1,5)(2,5)+(3,1,2)(3,2)+(3,1,4(3,4(4,1,3)(4,3)+(4,1,5)(4,5)+(5,1,2)(5,2)+(5,1,3)(5,3) + + + + + + + + = 8 = 0, = 6, =0。比較結(jié)果1 在該網(wǎng)絡(luò)中最重要,如果去點(diǎn)節(jié)點(diǎn)
本文編號(hào):3211454
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3211454.html
最近更新
教材專著