天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 數(shù)學(xué)論文 >

魯棒矩陣分解方法的研究及在疾病關(guān)聯(lián)數(shù)據(jù)上的應(yīng)用

發(fā)布時間:2021-08-04 19:18
  近年來,越來越多的復(fù)雜疾病,如癌癥、糖尿病、心腦血管疾病等,正成為死亡率極高的疾病。而且,生物學(xué)家和醫(yī)學(xué)家的研究表明,這些復(fù)雜的疾病往往與多種生物分子有關(guān)聯(lián),如藥物-靶標(biāo)相互作用(Drug-Target Interaction,DTI)、藥物-疾病相互作用(Drug-Disease Interaction,DDI)、miRNA-疾病關(guān)聯(lián)(miRNA-Disease Association,MDA)和lncRNA-疾病關(guān)聯(lián)(lncRNA-Disease Association,LDA)。雖然這些疾病關(guān)聯(lián)數(shù)據(jù)中,蘊(yùn)含著解決復(fù)雜疾病的關(guān)鍵的生物信息規(guī)律,但是,這些數(shù)據(jù)中包含著大量的噪聲,這些噪聲會干擾挖掘潛在的疾病關(guān)聯(lián)信息。在生物信息學(xué)中,矩陣分解模型是一種被廣泛應(yīng)用的預(yù)測模型,如圖正則矩陣分解模型(Graph Regularized Matrix Factorization,GRMF)和協(xié)同矩陣分解模型(Collaborative Matrix Factorization,CMF)。但是,傳統(tǒng)的矩陣分解模型在疾病關(guān)聯(lián)預(yù)測中存在著一些弊端:疾病關(guān)聯(lián)數(shù)據(jù)集中的噪聲值會干擾算法的準(zhǔn)確度;誤差值的... 

【文章來源】:曲阜師范大學(xué)山東省

【文章頁數(shù)】:64 頁

【學(xué)位級別】:碩士

【部分圖文】:

魯棒矩陣分解方法的研究及在疾病關(guān)聯(lián)數(shù)據(jù)上的應(yīng)用


預(yù)測流程圖

流程圖,數(shù)據(jù)集,收斂性,方法


第2章稀疏圖正則矩陣分解方法11數(shù)據(jù)集的大小和類型,對錯誤的容忍度有所不同。一般來說,只要誤差在合理范圍內(nèi),就可以接受。圖2.2和圖2.3分別示出的對NR和GPCR的數(shù)據(jù)集的不同方法的收斂。圖2.1預(yù)測流程圖圖2.2三個方法在NR數(shù)據(jù)集上的收斂性比較

曲線,數(shù)據(jù)集,收斂性,方法


第2章稀疏圖正則矩陣分解方法12圖2.3三個方法在GPCR數(shù)據(jù)集上的收斂性比較2.5.1CVd下的相互作用預(yù)測表2.2列出了CVd下的實(shí)驗(yàn)結(jié)果,最高的AUPR值以粗體顯示,括號中給出標(biāo)準(zhǔn)偏差。在NR數(shù)據(jù)集下,所提的方法優(yōu)于GRMF方法,并且在添加WKNKN之后與GRMF方法幾乎相同。重要的是,使用了預(yù)處理后,所提方法的性能獲得了較大的提高。此外,將權(quán)重矩陣添加到所提的方法,并使用WKNKN后,預(yù)測的準(zhǔn)確性也得到了提高。而且在將權(quán)重矩陣添加到L2,1-GRMF并使用WKNKN后,預(yù)測準(zhǔn)確性也得到了提高。圖2.4顯示了NR數(shù)據(jù)集上每種方法的CVd側(cè)的PR曲線。表2.2CVd下各個方法的AUPR值MethodsNRGPCRICECMF0.482(0.034)0.406(0.008)0.350(0.008)0.375(0.007)GRMF0.517(0.025)0.369(0.011)0.341(0.016)0.349(0.012)WGRMF0.520(0.025)0.408(0.010)0.364(0.018)0.404(0.014)L2,1-GRMF0.543(0.034)0.373(0.011)0.345(0.012)0.346(0.013)L2,1-WGRMF0.542(0.024)0.400(0.010)0.370(0.016)0.408(0.013)WKNKN+CMF0.515(0.032)0.409(0.010)0.350(0.014)0.385(0.004)WKNKN+GRMF0.542(0.028)0.404(0.011)0.356(0.014)0.390(0.010)WKNKN+WGRMF0.528(0.033)0.410(0.012)0.369(0.017)0.401(0.013)WKNKN+L2,1-GRMF0.573(0.011)0.394(0.007)0.356(0.012)0.386(0.013)WKNKN+L2,1-WGRMF0.544(0.026)0.394(0.012)0.374(0.016)0.385(0.007)但是,在GPCR數(shù)據(jù)集上運(yùn)行所提的方法,發(fā)現(xiàn)它沒有優(yōu)于以前的方法,初步估計(jì)是數(shù)據(jù)集本身的問題。圖2.5顯示了GPCR數(shù)據(jù)集上每種方法在CVd側(cè)的PR曲線。我們觀察到,執(zhí)行CVd實(shí)驗(yàn)時使用權(quán)重矩陣比不使用權(quán)重矩陣獲得的AUPR值高。此外,在IC數(shù)據(jù)集上,使用了WKNKN的L2,1-WGRMF方法優(yōu)于其他任何方法,略優(yōu)于使用了WKNKN

【參考文獻(xiàn)】:
期刊論文
[1]基于HeteSim的疾病關(guān)聯(lián)長非編碼RNA預(yù)測[J]. 馬毅,郭杏莉,孫宇彤,苑倩倩,任陽,段然,高琳.  計(jì)算機(jī)研究與發(fā)展. 2019(09)
[2]一種預(yù)測miRNA與疾病關(guān)聯(lián)關(guān)系的矩陣分解算法[J]. 劉曉燕,陳希,郭茂祖,車凱,王春宇.  智能系統(tǒng)學(xué)報(bào). 2018(06)
[3]miRNA與疾病關(guān)聯(lián)關(guān)系預(yù)測算法[J]. 郭茂祖,王詩鳴,劉曉燕,田偵.  軟件學(xué)報(bào). 2017(11)
[4]藥物-疾病關(guān)系預(yù)測:一種推薦系統(tǒng)模型[J]. 汪浩,王海平,吳信東,劉琦.  中國藥理學(xué)通報(bào). 2015(12)
[5]中國女性乳腺癌發(fā)病死亡和生存狀況[J]. 陳萬青,鄭榮壽.  中國腫瘤臨床. 2015(13)
[6]結(jié)直腸癌流行病學(xué)與預(yù)防[J]. 萬德森.  中國中西醫(yī)結(jié)合外科雜志. 2011(01)
[7]基于流形學(xué)習(xí)的聚類方法在基因芯片表達(dá)譜分析中的應(yīng)用[J]. 黃偉,劉戰(zhàn)民,薛丹,尹京苑.  中國生物醫(yī)學(xué)工程學(xué)報(bào). 2010(01)



本文編號:3322261

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/yysx/3322261.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5a768***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com