基于生物分子網(wǎng)絡(luò)分析的疾病基因預(yù)測(cè)算法
本文關(guān)鍵詞:基于生物分子網(wǎng)絡(luò)分析的疾病基因預(yù)測(cè)算法,由筆耕文化傳播整理發(fā)布。
【摘要】:疾病影響著人類的正常工作及生活,復(fù)雜疾病,以癌癥為代表,更是嚴(yán)重威脅著人類的生命安全。對(duì)疾病生物標(biāo)記的研究有助于揭開潛在疾病的發(fā)病機(jī)制,并引導(dǎo)個(gè)性化的治療。因此,疾病生物標(biāo)記的研究受到越來越多的關(guān)注,成為了生物信息學(xué)研究中一個(gè)極其重要的分支。近些年來,隨著高通量測(cè)序技術(shù)的發(fā)展,各種不同的生物數(shù)據(jù)大量涌現(xiàn),疾病生物標(biāo)記的研究進(jìn)入了一個(gè)新階段。已知疾病基因,作為已經(jīng)在臨床上被證實(shí)跟疾病相關(guān)的基因,可以作為一種先驗(yàn)知識(shí)來指導(dǎo)研究。然而目前的大多數(shù)研究方法,只是把已知疾病基因作為對(duì)研究結(jié)果的驗(yàn)證數(shù)據(jù),而沒有作為先驗(yàn)知識(shí)去引導(dǎo)疾病生物標(biāo)記的識(shí)別,本文研究中引入了這一數(shù)據(jù)作為先驗(yàn)知識(shí)。另外,大量生物數(shù)據(jù)的積累也推動(dòng)了對(duì)各種計(jì)算方法的研究。在生物假說“同一疾病的蛋白質(zhì)互相之間交互多”的基礎(chǔ)上,研究者們通過在網(wǎng)絡(luò)模型中計(jì)算各基因與已知疾病基因的距離,來預(yù)測(cè)疾病生物標(biāo)記。這些距離度量方法包括基于最短路徑、基于隨機(jī)游走、擴(kuò)散核等。擴(kuò)散核能根據(jù)疾病網(wǎng)絡(luò)的全局拓?fù)涮匦远攘抗?jié)點(diǎn)之間的距離,具有比較好的效果。本文研究中采用了擴(kuò)散核(diffusion kernel)思想。本文提出了一種以已知疾病基因集合引導(dǎo)的疾病網(wǎng)絡(luò)的構(gòu)建方法,并從構(gòu)建的疾病網(wǎng)絡(luò)中預(yù)測(cè)疾病相關(guān)基因。本文具體的研究思路如下:首先,從三個(gè)公共數(shù)據(jù)庫中收集針對(duì)某種癌癥的已知疾病基因,對(duì)每種癌癥得到一個(gè)疾病基因集合。針對(duì)本文研究的六種癌癥(肺癌,前列腺癌,乳腺癌,膀胱癌,大腸直腸癌,子宮內(nèi)膜癌),共獲得了六個(gè)基因集合。然后,采用擴(kuò)散核思想在每一個(gè)疾病基因集合基礎(chǔ)上構(gòu)建一個(gè)疾病分子網(wǎng)絡(luò)。擴(kuò)散核在本文中被用來度量基因之間的相似性,旨在找出與已知疾病基因相似性高的基因,用于構(gòu)建網(wǎng)絡(luò)。最后,采用馬爾科夫聚類算法(MCL)在疾病網(wǎng)絡(luò)上進(jìn)行聚類,并設(shè)計(jì)了一種按聚類模塊為單位的新穎的得分算法對(duì)疾病網(wǎng)絡(luò)中除已知疾病基因以外的基因打分,從中篩選癌癥相關(guān)基因并進(jìn)行了一系列驗(yàn)證。另外,為了說明以疾病基因集合為疾病網(wǎng)絡(luò)的初始節(jié)點(diǎn)集合的合理性,我們?cè)赑PI的最大連通圖上比較了疾病基因與非疾病基因的拓?fù)涮匦圆町。?shí)驗(yàn)結(jié)果表明,本文的研究方法能比較有效地構(gòu)建疾病分子網(wǎng)絡(luò),預(yù)測(cè)與特定癌癥相關(guān)程度高的基因。從與經(jīng)典的帶重啟的隨機(jī)游走的預(yù)測(cè)方法的結(jié)果對(duì)比來看,本文方法預(yù)測(cè)的致病基因在已知疾病基因數(shù)據(jù)庫中展現(xiàn)了更顯著的富集性,對(duì)癌癥樣本和正常樣本的分類效果也更好。本文的算法將從某種程度上揭示癌癥的發(fā)病機(jī)理,并為深入了解癌癥的機(jī)制提供支持。
【關(guān)鍵詞】:PPI網(wǎng)絡(luò) 疾病網(wǎng)絡(luò) 拓?fù)涮匦?/strong> 擴(kuò)散核 生物標(biāo)記
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:R3416
【目錄】:
- 摘要5-7
- ABSTRACT7-14
- 第一章 緒論14-20
- 1.1 研究背景及意義14-15
- 1.2 研究現(xiàn)狀15-17
- 1.3 本文工作及組織結(jié)構(gòu)17-20
- 第二章 疾病基因預(yù)測(cè)研究概述20-30
- 2.1 相關(guān)生物數(shù)據(jù)20-25
- 2.1.1 蛋白質(zhì)相互作用網(wǎng)絡(luò)20-21
- 2.1.2 疾病基因數(shù)據(jù)21-23
- 2.1.3 基因表達(dá)數(shù)據(jù)23-24
- 2.1.4 GO本體論和注釋數(shù)據(jù)24-25
- 2.2 疾病基因預(yù)測(cè)方法25-30
- 2.2.1 基于模型的預(yù)測(cè)方法25-26
- 2.2.2 基于距離的預(yù)測(cè)方法26-27
- 2.2.3 基于模塊的預(yù)測(cè)方法27-28
- 2.2.4 基于數(shù)據(jù)集成的預(yù)測(cè)方法28-30
- 第三章 基于網(wǎng)絡(luò)分析的疾病基因預(yù)測(cè)算法30-40
- 3.1 方法概述30-31
- 3.2 疾病網(wǎng)絡(luò)構(gòu)建方法31-35
- 3.2.1 疾病基因收集32
- 3.2.2 網(wǎng)絡(luò)構(gòu)建算法32-35
- 3.3 致病基因的預(yù)測(cè)方法35-38
- 3.3.1 聚類算法36-37
- 3.3.2 模塊得分算法37
- 3.3.3 基因得分算法37-38
- 3.4 本章小結(jié)38-40
- 第四章 實(shí)驗(yàn)結(jié)果與分析40-58
- 4.1 實(shí)驗(yàn)數(shù)據(jù)40-43
- 4.1.1 PPI的處理40
- 4.1.2 疾病基因的篩選40-41
- 4.1.3 基因表達(dá)數(shù)據(jù)預(yù)處理41-43
- 4.2 疾病網(wǎng)絡(luò)合理性分析43-48
- 4.2.1 疾病基因拓?fù)涮匦苑治?/span>43-46
- 4.2.2 疾病網(wǎng)絡(luò)拓?fù)涮匦苑治?/span>46
- 4.2.3 聚類模塊結(jié)構(gòu)分析46-48
- 4.3 預(yù)測(cè)的致病基因的驗(yàn)證與分析48-57
- 4.3.1 留一交叉驗(yàn)證48-51
- 4.3.2 分類性能分析51-52
- 4.3.3 富集分析52-57
- 4.4 本章小結(jié)57-58
- 第五章 總結(jié)與展望58-60
- 參考文獻(xiàn)60-66
- 致謝66-68
- 作者簡介68-69
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉二林;;預(yù)測(cè)疾病基因[J];家庭醫(yī)學(xué);1988年05期
2 劉建,賀紅焰;疾病基因多態(tài)性研究是發(fā)展個(gè)體化臨床醫(yī)學(xué)的新途徑[J];醫(yī)學(xué)與哲學(xué);2000年05期
3 ;基因組醫(yī)學(xué)、染色體組和人類疾病基因(1)[J];現(xiàn)代臨床醫(yī)學(xué)生物工程學(xué)雜志;2004年01期
4 陳曉紅,陳智;尋找疾病基因的策略進(jìn)展[J];國外醫(yī)學(xué).流行病學(xué)傳染病學(xué)分冊(cè);2004年01期
5 ;基因組醫(yī)學(xué)、染色體組和人類疾病基因(10)[J];現(xiàn)代臨床醫(yī)學(xué)生物工程學(xué)雜志;2005年04期
6 袁芳;王瑞春;管明祥;周艷紅;;基于功能的疾病基因預(yù)測(cè)系統(tǒng)設(shè)計(jì)與應(yīng)用[J];計(jì)算機(jī)工程;2010年12期
7 袁芳;李靖;;基于功能相似性預(yù)測(cè)疾病基因[J];計(jì)算機(jī)應(yīng)用研究;2012年11期
8 ;基因組醫(yī)學(xué)、染色體組和人類疾病基因(1)[J];現(xiàn)代臨床醫(yī)學(xué)生物工程學(xué)雜志;2004年01期
9 ;基因組醫(yī)學(xué)、染色體組和人類疾病基因(3)[J];現(xiàn)代臨床醫(yī)學(xué)生物工程學(xué)雜志;2004年03期
10 周艷紅,周權(quán)雄,劉懷蘭,萬宏輝;基于密碼子使用特征預(yù)測(cè)家族性擴(kuò)張型心肌病的疾病基因[J];科學(xué)通報(bào);2005年20期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前4條
1 劉維湘;袁克虹;黃勛;唐愛發(fā);賈少微;;疾病基因預(yù)選方法綜述[A];中國生物醫(yī)學(xué)工程進(jìn)展——2007中國生物醫(yī)學(xué)工程聯(lián)合學(xué)術(shù)年會(huì)論文集(下冊(cè))[C];2007年
2 孔令雯;葛正行;;綜述COPD疾病基因多態(tài)性研究進(jìn)展[A];2011年貴州省中西醫(yī)結(jié)合學(xué)會(huì)呼吸專業(yè)學(xué)術(shù)會(huì)議論文匯編[C];2011年
3 夏詔杰;王忠;郭力;;構(gòu)建中風(fēng)疾病基因關(guān)系網(wǎng)絡(luò)的方法研究[A];中國化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第14分會(huì)場(chǎng)摘要集[C];2012年
4 程義林;楊森;張學(xué)軍;;常見復(fù)雜疾病表型基因型全基因組關(guān)聯(lián)分析的問題和對(duì)策[A];中華醫(yī)學(xué)會(huì)第14次全國皮膚性病學(xué)術(shù)年會(huì)論文匯編[C];2008年
中國重要報(bào)紙全文數(shù)據(jù)庫 前8條
1 李斌;成都學(xué)者研究疾病基因榜上有名[N];成都日?qǐng)?bào);2007年
2 許鐵男;歐洲掀起探索疾病基因熱潮[N];醫(yī)藥經(jīng)濟(jì)報(bào);2001年
3 記者 尹寧靜;易感疾病基因檢測(cè)進(jìn)入泰州[N];泰州日?qǐng)?bào);2006年
4 記者 李天舒;我國將開展五類重大疾病基因研究[N];健康報(bào);2008年
5 霍冬;現(xiàn)代疾病基因新療法[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2000年
6 本報(bào)記者 楊子巖;一匹海外駿馬馳騁在喻家山[N];人民日?qǐng)?bào)海外版;2011年
7 劉燕玲;中藥與基因功能調(diào)控[N];健康報(bào);2003年
8 薛祖玲 王春;上海市自然科學(xué)牡丹獎(jiǎng)揭曉[N];科技日?qǐng)?bào);2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 袁芳;基于基因功能信息預(yù)測(cè)疾病相關(guān)基因[D];華中科技大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 虞佳;基于生物分子網(wǎng)絡(luò)分析的疾病基因預(yù)測(cè)算法[D];西安電子科技大學(xué);2014年
2 陳穎;基于復(fù)雜網(wǎng)絡(luò)的疾病基因預(yù)測(cè)的研究[D];東北大學(xué);2009年
3 滕明祥;基于蛋白質(zhì)互作網(wǎng)絡(luò)的疾病相關(guān)miRNA挖掘方法的研究[D];哈爾濱工業(yè)大學(xué);2008年
4 李論;基于氨基酸使用偏好及基因功能信息預(yù)測(cè)疾病相關(guān)基因[D];華中科技大學(xué);2008年
5 周權(quán)雄;疾病基因密碼子使用特征分析及致病基因預(yù)測(cè)[D];華中科技大學(xué);2006年
6 李倩;與疾病相關(guān)的差異表達(dá)基因檢測(cè)[D];西安電子科技大學(xué);2010年
7 王卉;蛋白質(zhì)編碼基因及遺傳疾病相關(guān)基因的預(yù)測(cè)[D];華中科技大學(xué);2006年
本文關(guān)鍵詞:基于生物分子網(wǎng)絡(luò)分析的疾病基因預(yù)測(cè)算法,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):364935
本文鏈接:http://www.sikaile.net/yixuelunwen/shiyanyixue/364935.html