天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于基因網絡的致病基因預測算法研究

發(fā)布時間:2017-07-05 02:08

  本文關鍵詞:基于基因網絡的致病基因預測算法研究


  更多相關文章: 致病基因預測 信息散度 相關系數 隨機游走算法 邏輯回歸模型


【摘要】:致病基因的研究是對遺傳疾病的治療具有重要的意義。近年來,高通量測序技術的高速發(fā)展為致病基因的研究帶來了新的機遇,并涌向出大量的致病基因研究方法。這些方法基于已有的疾病或表型與基因之間的因果關系,使用網絡構建方法對致病基因進行排序,從而達到致病基因篩選的目的。它們大多基于一個前提,即致使相同或相似疾病發(fā)病的基因在基因生物網絡中鄰近,存在著模塊特性。但現有的方法對生物實體網絡的鄰接矩陣的構建較為粗糙,即存在關聯關系的為1,否則為0,無法對基因之間的關聯關系進行更合理的量化。此外,高通量測序技術產生了大量生物數據,使得集成數據分析方法成為目前致病基因研究的主要手段,但大多數方法都是基于生物實體的局部信息進行特征的構建,沒有更好的擴展利用生物實體網絡的拓撲特性。本課題研究的工作主要包括:第一,從另一種角度引入了研究生物實體間關系的方法,通過考察生物數據分布規(guī)律,來量化生物實體間的相對重要程度;诖吮菊n題引入兩種統計特征量化數據間的關系。一種是計算基因表達數據的相關系數,用于分析基因間在功能上或者調控上對整個基因網絡的重要程度;另一種是計算基因表達數據的信息散度,將基因的表達值作為基因表達的概率來量化基因間的表達分布,以此得到基因間的相互重要關系;與蛋白質交互網絡數據的比對實驗表明這兩種統計特征的AUC、Top1和Top50在致病基因預測問題上優(yōu)于后者,驗證了所引入的兩種統計特征對致病相關基因篩選的有效性。第二,提出一種隨機游走算法的二元邏輯回歸模型用于致病相關基因的預測。利用隨機游走模型,對每一個基因進行關聯基因的篩選,從得到與這個基因關聯性強的基因中,分別從個數和權重這兩個方面統計這些基因的全局信息,并用來構建基因的特征向量,得到了特征F1、特征F2和特征F3。第三,在特征F1下,三個不同的生物數據網絡:蛋白質交互網絡、基因共表達網絡和基因通路網絡中本章方法得到的AUC明顯優(yōu)于B Chen等人提出的特征“PCF1”、MRF算法和RWR算法得到的結果。在F2特征下,三個不同的生物數據網絡中,本課題提出的算法的AUC結果高于B Chen等人提出的特征“PCF2”得到的結果。在特征F3下集成三種網絡,本章提出的方法的AUC結果顯著優(yōu)于MRF算法、RWR算法、DIR算法和B Chen等人提出的特征“PCF3”的結果。此外還從時間效率上對這幾種不同算法進行了比對,驗證了本章算法更具有競爭力。
【關鍵詞】:致病基因預測 信息散度 相關系數 隨機游走算法 邏輯回歸模型
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:R440
【目錄】:
  • 摘要4-5
  • ABSTRACT5-9
  • 第1章 緒論9-16
  • 1.1 課題研究的背景和意義9-10
  • 1.2 國內外研究現狀10-13
  • 1.3 主要研究內容和論文組織結構13-16
  • 1.3.1 主要研究內容13-14
  • 1.3.2 本文組織結構14-16
  • 第2章 基于基因表達數據的致病基因排序16-29
  • 2.1 引言16-17
  • 2.2 基于基因表達數據的統計特征17-19
  • 2.2.1 構建相關系數特征向量17
  • 2.2.2 構建信息散度特征向量17-18
  • 2.2.3 評價指標18-19
  • 2.3 基于統計特征的致病基因排序算法19-20
  • 2.4 實驗驗證及分析20-28
  • 2.4.1 開發(fā)環(huán)境20-21
  • 2.4.2 實驗數據21-22
  • 2.4.3 統計特征的有效性驗證及分析22-28
  • 2.5 本章小結28-29
  • 第3章 基于邏輯回歸的致病基因預測算法29-38
  • 3.1 引言29
  • 3.2 二元邏輯回歸模型概述29-30
  • 3.3 基于邏輯回歸的致病基因預測算法30-33
  • 3.3.1 基于二元邏輯回歸預測模型30-32
  • 3.3.2 基于兩步二元邏輯回歸預測模型32-33
  • 3.4 隨機游走的二元邏輯回歸預測模型33-36
  • 3.4.1 基本原理33-35
  • 3.4.2 算法步驟35-36
  • 3.5 本章小結36-38
  • 第4章 實驗仿真及結果分析38-51
  • 4.1 實驗環(huán)境38
  • 4.2 實驗數據38-39
  • 4.3 實驗結果及分析39-50
  • 4.3.1 留一交叉驗證39
  • 4.3.2 算法性能分析39-48
  • 4.3.3 算法效率分析48-50
  • 4.4 本章小結50-51
  • 結論51-53
  • 參考文獻53-60
  • 攻讀碩士期間發(fā)表的論文及其它成果60-62
  • 致謝62
,

本文編號:520129

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/linchuangyixuelunwen/520129.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶53fd2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com