基于GO的基因功能及疾病相關通路分析
發(fā)布時間:2019-09-13 01:10
【摘要】:Gene Ontology(GO)作為對基因及其蛋白質產(chǎn)物的功能進行系統(tǒng)描述的數(shù)據(jù)庫,已經(jīng)被廣泛應用于分析基因(及其產(chǎn)物)間的功能相似性以及基于高通量生物學數(shù)據(jù)分析疾病相關的生物學功能通路。但是,,基于GO的應用方法還存在很大的問題。 本文主要包括以下三部分內容: 1.揭示并去除基于GO的蛋白質間功能(語義)相似性得分的偏倚。蛋白質間的語義相似性得分已被廣泛地應用于功能基因組的各種研究。但是,由于一些與疾病相關的蛋白質傾向于被廣泛研究,它們傾向有較多的功能注釋,而這種注釋偏倚將影響基于語義相似性得分的各種應用。在本文中,我們首先分析了14種常用的基于GO的蛋白質間功能相似性得分與蛋白質注釋的功能類個數(shù)之間的關系。結果顯示,它們顯著正相關,證明目前基于蛋白質間語義相似性得分的應用結果存在偏倚。因此,我們提出了使用冪轉換對蛋白質間的相似性得分進行標準化處理的方法,并證實利用該方法可以使一些應用的結果得到改善。 2.從疾病的統(tǒng)計相關功能中發(fā)現(xiàn)生物學相關功能。在研究高通量的疾病相關數(shù)據(jù)時,一種通常的做法是基于GO數(shù)據(jù)庫發(fā)現(xiàn)富集疾病相關基因的疾病相關功能。但是,目前大部分算法找到的顯著GO功能類都存在由于GO功能類間的依賴性導致的冗余問題。由于目前去除冗余的算法僅基于一些數(shù)值考慮,利用這些算法無法準確定義生物學相關的功能類。在本論文中,我們設計了GO-function算法,用于從統(tǒng)計相關的GO功能類中尋找生物學相關功能類。利用一套結腸癌的基因表達譜數(shù)據(jù),我們比較了GO-function和其他四種處理冗余問題的算法。然后,利用另一套獨立的結腸癌表達譜數(shù)據(jù),我們對利用第一套結腸癌數(shù)據(jù)得到的結果進行證實。結果顯示,相比其它四種算法,基于GO-function算法所找到的疾病相關功能類具有更明確的統(tǒng)計與生物學意義。 3.識別顯著富集功能類間共突變基因對的共突變功能對。癌基因組突變的復雜多樣性使得我們需要利用生物學通路來對癌基因組突變譜進行研究。由于GO從寬泛到細致在不同層面上定義生物學功能,因此,基于GO功能類研究癌癥過程中生物學功能的共擾動是一種合理的選擇。本文提出了一種算法,尋找GO功能類間顯著富集共突變基因對的非冗余功能對;趦商装┗蚪M體細胞突變數(shù)據(jù),我們分別找到了78對共突變功能對。這些功能對包含寬泛和細致的生物學功能,更精確地定義了被共同擾動的生物學功能的范圍,為研究癌癥的發(fā)生機制提供了新的線索。 綜上所述,我們提出的方法對正確利用GO分析基因間的功能相似性及疾病相關生物學通路具有基礎性的重要意義。
【圖文】:
如果子功能類是父功能類的一個實例,那么它們是 Is-a 關系。如果子功能類是父功能類的一部分,那么它們是 Part-of 關系。例如,“高分子生物合成過程”與“生物合成過程”是 Is-a 關系,而“翻譯”與“基因表達”是 Part-of 關系(見圖 1-1)。而且,與一般的樹狀結構不同,在有向無環(huán)圖中的每個功能類都可以有多個父功能類。
圖 2-1 致病基因與非致病基因注釋長度的改變。致病基因來源于 OMIM 數(shù)據(jù)庫。除致病基因外的其他基因定義為非致病基因; GO 的不同版本,柱狀圖代表致病基因與非致病基因在不同注釋長度下的比例,實線方框線圖代表致病基因與非致病基因的平均注釋長度。
【學位授予單位】:電子科技大學
【學位級別】:博士
【學位授予年份】:2012
【分類號】:R346
本文編號:2535469
【圖文】:
如果子功能類是父功能類的一個實例,那么它們是 Is-a 關系。如果子功能類是父功能類的一部分,那么它們是 Part-of 關系。例如,“高分子生物合成過程”與“生物合成過程”是 Is-a 關系,而“翻譯”與“基因表達”是 Part-of 關系(見圖 1-1)。而且,與一般的樹狀結構不同,在有向無環(huán)圖中的每個功能類都可以有多個父功能類。
圖 2-1 致病基因與非致病基因注釋長度的改變。致病基因來源于 OMIM 數(shù)據(jù)庫。除致病基因外的其他基因定義為非致病基因; GO 的不同版本,柱狀圖代表致病基因與非致病基因在不同注釋長度下的比例,實線方框線圖代表致病基因與非致病基因的平均注釋長度。
【學位授予單位】:電子科技大學
【學位級別】:博士
【學位授予年份】:2012
【分類號】:R346
【引證文獻】
相關博士學位論文 前1條
1 賈建磊;不同產(chǎn)羔性狀綿羊卵巢組織差異表達蛋白質的篩選與分析[D];甘肅農業(yè)大學;2015年
相關碩士學位論文 前1條
1 彭金娥;希望Ⅱ號對煙草煙霧暴露誘導小鼠肺損傷的作用及其機理研究[D];北京中醫(yī)藥大學;2016年
本文編號:2535469
本文鏈接:http://www.sikaile.net/xiyixuelunwen/2535469.html
最近更新
教材專著