基于模塊歸一化及自適應跳轉(zhuǎn)隨機游走的疾病基因預測
發(fā)布時間:2017-11-19 01:14
本文關鍵詞:基于模塊歸一化及自適應跳轉(zhuǎn)隨機游走的疾病基因預測
更多相關文章: 生物相互作用網(wǎng)絡 疾病基因 異構網(wǎng)絡 自適應跳轉(zhuǎn) 隨機游走
【摘要】:隨著生物學技術的迅猛發(fā)展,生物數(shù)據(jù)正在以幾何數(shù)量級的速度增長。利用已知的生物網(wǎng)絡和多源生物數(shù)據(jù)找到致病基因,對于了解疾病的發(fā)病機制、研發(fā)新型藥物、制定精準醫(yī)療方案等都起到重要的促進作用。本文基于生物相互作用網(wǎng)絡通過模塊歸一化及自適應跳轉(zhuǎn)隨機游走方法對致病基因進行預測,主要的研究工作和貢獻如下:第一,當前大部分基于模塊的疾病基因預測方法都是根據(jù)已知的模塊或guilt-by-association假設進行預測,但這些方法往往忽略了致病基因在具體網(wǎng)絡中的拓撲特性,并且沒有考慮對網(wǎng)絡中孤立節(jié)點的處理。針對以上問題,本文提出了一種基于模塊歸一化和表型本體的疾病基因預測方法(NMP)。首先,本文根據(jù)最新的疾病、基因表型本體數(shù)據(jù)對疾病和基因之間的相似度進行定義。然后,基于致病基因的模塊聚集特性,本文將候選基因所處模塊進行表型歸一化處理作為候選基因的權重。最后,通過留一交叉驗證和文獻查找對NMP方法的有效性進行驗證。實驗結果表明,NMP方法優(yōu)于傳統(tǒng)的NetRank、NetScore、NetZcore、Flow、RWR和最新的NDRC方法。第二,當前尚不存在完整的蛋白質(zhì)相互作用網(wǎng)絡并且存在許多假陰性和假陽性數(shù)據(jù),僅通過單個網(wǎng)絡已很難提高預測致病基因的精度。研究表明,功能相關的多個基因發(fā)生突變往往會產(chǎn)生相似的表現(xiàn)型,因此將表型和蛋白質(zhì)數(shù)據(jù)進行融合能夠彌補已有數(shù)據(jù)的不足,提高預測的準確度。已有的基于異構網(wǎng)絡的隨機游走算法雖然取得了不錯的預測效果,但是需要對跳轉(zhuǎn)概率進行多次調(diào)整,不具有普適性。本文提出一種基于異構網(wǎng)絡拉普拉斯正則化的自適應跳轉(zhuǎn)隨機游走方法(LSAR),對1428個已知的疾病基因相互關系進行留一和留二交叉驗證。實驗結果表明,LSAR方法不但減少了參數(shù)設置,并且預測效果優(yōu)于傳統(tǒng)的RWRH、CIPHER-SP、 CIPHER-DN方法和最新的RWRH-RE、RWRHN、LapRWRH方法。并且根據(jù)預測結果,我們對乳腺癌、糖尿病、肺癌、肥胖癥四種疾病的致病基因做出預測。
【學位授予單位】:華中師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:R440
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 沈巖;致病基因的定位候選克隆[J];生命科學;1999年05期
2 方福德;醫(yī)學分子生物學的發(fā)展歷程和展望[J];醫(yī)學與哲學;1999年01期
,本文編號:1201804
本文鏈接:http://www.sikaile.net/linchuangyixuelunwen/1201804.html
最近更新
教材專著