基于網(wǎng)絡拓撲的蛋白質互作預測及相關內(nèi)容的研究
發(fā)布時間:2020-07-23 21:34
【摘要】:蛋白質作為生命的物質基礎,很少以單獨個體進行活動,而是以一種非常明確的方式相互作用(互作)來協(xié)調(diào)幾乎所有的細胞過程。因此,蛋白質互作分析是理解細胞組織和分子功能的基礎。蛋白質網(wǎng)絡是由直接的物理互作構成,能夠代表一個具體的生物學系統(tǒng)。它可以揭示器官功能,了解組織結構,從而確定人類疾病的致病機理和尋找基因治療的藥物靶點。高通量的生物學實驗技術提供了大量的蛋白質互作數(shù)據(jù),為蛋白質網(wǎng)絡的研究提供了數(shù)據(jù)支持。本文利用網(wǎng)絡拓撲屬性,整合分子功能和疾病相關信息,能夠確定蛋白質網(wǎng)絡中隱藏的功能模塊和疾病信息。目前,基于蛋白質互作網(wǎng)絡預測蛋白質互作,確定功能模塊與疾病蛋白質的研究主要面臨兩方面問題:(一)基于不可靠的網(wǎng)絡數(shù)據(jù),包括噪聲(假陽性互作)和缺失(假陰性互作),會誤導或干擾相關研究;(二)基于不同特征、質量和數(shù)量的數(shù)據(jù),會產(chǎn)生互作預測波動,預測質量和覆蓋率有待提高,從而影響網(wǎng)絡中的功能模塊和疾病模塊的完整性。本文基于已知的蛋白質互作網(wǎng)絡,以團(極大完全子網(wǎng))等網(wǎng)絡拓撲側度為核心,預測蛋白質互作,挖掘網(wǎng)絡中的功能模塊,預測疾病蛋白質。首先,提出了一種可靠蛋白質互作預測的框架模型來修補蛋白質互作網(wǎng)絡,并基于該模型預測與功能模塊或蛋白質復合物相關的蛋白質互作;其次,用修補后的網(wǎng)絡挖掘相關模塊;最后,基于疾病模塊預測疾病蛋白質。本文解決了在含有假陽性和假陰性互作數(shù)據(jù)的網(wǎng)絡中,預測蛋白質互作波動的問題,并利用擴展的團更大限度的逼近實際的功能模塊和疾病模塊。研究的具體內(nèi)容主要體現(xiàn)在以下四個方面:一、提出一種基于寬進嚴出策略的預測可靠蛋白質互作的框架模型。首先,設定已有的預測蛋白質互作的計算方法的預測可靠性等級;然后,根據(jù)預測方法之間的兼容性和互補性原則,整合若干子方法;最后,通過預測和評估兩個過程獲取最終的蛋白質互作預測集。每個預測的蛋白質互作均滿足多種生物學意義,其預測可靠性更高。該框架模型為本文基于蛋白質互作網(wǎng)絡預測蛋白質互作的具體方法提供基礎。二、分別提出基于寬進嚴出框架的顯性和隱性預測蛋白質互作的方法。在顯性模式下,設計了兩種預測方法。第一種方法完全符合寬進嚴出模型標準,針對不同特征的互作數(shù)據(jù)集,包括含有大量噪聲的數(shù)據(jù)集,均能穩(wěn)定的獲取可靠的蛋白質互作預測;第二種方法提供了簡化使用寬進嚴出框架的實例,利用預測的互作參與新的預測過程,可以獲取更多的蛋白質互作;同時,通過使用不同的基因本體論修正規(guī)則,分別獲得質量和數(shù)量占優(yōu)的預測集。在隱性模式下,針對已經(jīng)發(fā)現(xiàn)復合物的不同拓撲結構特征,分別提出一種基于橋分割復合物的預測算法和一種自適應k核聚類剪枝預測算法。前者針對多子網(wǎng)結構的復合物,可獲較高準確率的互作預測;后者具有通用性,能夠較好適應各種不同結構的復合物。這兩種算法預測的蛋白質互作與功能模塊和復合物相關,有助于發(fā)現(xiàn)更準確的功能模塊和疾病模塊。三、提出一種基于候選集競爭方法來確定網(wǎng)絡中潛在團。本文在擴展團的基礎上,挖掘候選集中結點間的隱藏信息,采用貪心方法,競爭挑選最大可能的候選結點來擴展團。并且,候選集合的確定不是靜態(tài)過程,而是根據(jù)當前擴展的團,動態(tài)生成,繼續(xù)競爭挑選候選結點來擴展團。以此類推,直至確定最終的潛在團。潛在團中包含的未知蛋白質互作,絕大部分可通過相關的驗證。挖掘的潛在團接近于實際真實的團,具有較好的生物學意義,克服了網(wǎng)絡數(shù)據(jù)缺失的影響。四、提出一種在蛋白質網(wǎng)絡中基于團骨架預測疾病蛋白質的方法。首先,利用擴展團的方法挖掘潛在團;然后,根據(jù)已知疾病蛋白質在團中的顯著性確定疾病相關的團,從而預測疾病蛋白質;最后,利用基因本體論注釋為預測的蛋白質打分,決定最終的疾病蛋白質。該方法能夠克服原始數(shù)據(jù)中假陽性和假陰性數(shù)據(jù)的干擾。本文通過基因型和表型的關聯(lián),可知預測的疾病蛋白質保持較高準確率。并且,基于疾病團預測的疾病蛋白質之間,存在緊密聯(lián)系,且關聯(lián)復雜疾病,如各種癌癥等,為揭示嚴重疾病的致病機理提供線索。第一項研究內(nèi)容屬于框架模型,為本文的整體研究提供一個指導性框架;第二項研究內(nèi)容提供蛋白質互作預測的方法,屬于網(wǎng)絡數(shù)據(jù)的修補,為后續(xù)網(wǎng)絡模塊的挖掘打下基礎;第三項研究內(nèi)容利用潛在團挖掘網(wǎng)絡中的模塊;第四項研究內(nèi)容利用確定網(wǎng)絡模塊的方法尋找疾病模塊并預測疾病蛋白質。本文通過對網(wǎng)絡數(shù)據(jù)的修補,可以較好地解決網(wǎng)絡拓撲結構易受假陰性和假陽性數(shù)據(jù)干擾的問題;并且,預測的蛋白質互作同功能模塊和疾病模塊緊密關聯(lián),從而可以確定相對完整的兩種網(wǎng)絡模塊,進而更加準確的解決相關的生物學問題。
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:博士
【學位授予年份】:2014
【分類號】:Q811.4;R3411
【圖文】:
圖 1-1 本文基于蛋白質互作網(wǎng)絡的相關內(nèi)容研究脈絡Fig. 1-1 Research direction based on the protein interaction network in the pape蛋白質是生物功能的主要體現(xiàn)者。為了協(xié)調(diào)幾乎所有的細胞過程, 復制和轉錄,RNA 連接和傳導,蛋白質修改和分泌,以及細胞循凋亡,蛋白質之間以一種非常明確的方式進行相互作用[6]。蛋白質
蛋白質互作網(wǎng)絡方面的研究仍然是系統(tǒng)生物學研究領域的一大熱點。根據(jù)科學引文索引(Science Citation Index, SCI)調(diào)查[11],近 5 年蛋白質互作網(wǎng)絡研究相關主題約 9000 多,且每年呈現(xiàn)遞增趨勢(如圖 1-2)。發(fā)表的文章數(shù)量排名暫時為美國、中國、德國、英國、加拿大等國。而直接以蛋白質互作網(wǎng)絡為標題撰寫的文章,近 5 年約 750 篇。
固定目標蛋白質的互作[21];圖1-3(f)列出合成致死(Synthetic Lethality)方法發(fā)現(xiàn)兩個非致死突變的個體當作用在一起時導致致死的遺傳互作[22]。它們發(fā)現(xiàn)的互作類型有所區(qū)別。酵母雙雜交方法發(fā)現(xiàn)的為二元的物理互作(兩兩蛋白質互作對);質譜分析和串聯(lián)親和純化方法發(fā)現(xiàn)的是復合物相關的物理互作(在一個復合物中的互作);基因共表達、蛋白質微陣列和合成致死方法發(fā)現(xiàn)的是功能相關的互作[16]。不同類型的互作,在蛋白質互作網(wǎng)絡中具有不同的網(wǎng)絡特征。圖 1-3 確定互作的六種高通量實驗方法[16]Fig. 1-3 Six methods of interaction identification with high throughput experiments[16]1.2.2 蛋白質互作數(shù)據(jù)庫目前,與蛋白質互作相關的數(shù)據(jù)庫已超過兩百多個,且還處于增長中,
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:博士
【學位授予年份】:2014
【分類號】:Q811.4;R3411
【圖文】:
圖 1-1 本文基于蛋白質互作網(wǎng)絡的相關內(nèi)容研究脈絡Fig. 1-1 Research direction based on the protein interaction network in the pape蛋白質是生物功能的主要體現(xiàn)者。為了協(xié)調(diào)幾乎所有的細胞過程, 復制和轉錄,RNA 連接和傳導,蛋白質修改和分泌,以及細胞循凋亡,蛋白質之間以一種非常明確的方式進行相互作用[6]。蛋白質
蛋白質互作網(wǎng)絡方面的研究仍然是系統(tǒng)生物學研究領域的一大熱點。根據(jù)科學引文索引(Science Citation Index, SCI)調(diào)查[11],近 5 年蛋白質互作網(wǎng)絡研究相關主題約 9000 多,且每年呈現(xiàn)遞增趨勢(如圖 1-2)。發(fā)表的文章數(shù)量排名暫時為美國、中國、德國、英國、加拿大等國。而直接以蛋白質互作網(wǎng)絡為標題撰寫的文章,近 5 年約 750 篇。
固定目標蛋白質的互作[21];圖1-3(f)列出合成致死(Synthetic Lethality)方法發(fā)現(xiàn)兩個非致死突變的個體當作用在一起時導致致死的遺傳互作[22]。它們發(fā)現(xiàn)的互作類型有所區(qū)別。酵母雙雜交方法發(fā)現(xiàn)的為二元的物理互作(兩兩蛋白質互作對);質譜分析和串聯(lián)親和純化方法發(fā)現(xiàn)的是復合物相關的物理互作(在一個復合物中的互作);基因共表達、蛋白質微陣列和合成致死方法發(fā)現(xiàn)的是功能相關的互作[16]。不同類型的互作,在蛋白質互作網(wǎng)絡中具有不同的網(wǎng)絡特征。圖 1-3 確定互作的六種高通量實驗方法[16]Fig. 1-3 Six methods of interaction identification with high throughput experiments[16]1.2.2 蛋白質互作數(shù)據(jù)庫目前,與蛋白質互作相關的數(shù)據(jù)庫已超過兩百多個,且還處于增長中,
【共引文獻】
相關期刊論文 前9條
1 張媛;賈克斌;ZHANG Aidong;;基于多視圖融合的蛋白質功能模塊檢測方法[J];電子學報;2014年12期
2 邵淑娟;;基于蛋白質組學策略的腫瘤標記物篩選及作用機制[J];大連醫(yī)科大學學報;2015年05期
3 Wen-yin NI;Hui-jun XIONG;Bi-hai ZHAO;Sai HU;;Predicting overlapping protein complexes in weighted interactome networks[J];Journal of Zhejiang University-Science C(Computers and Electronics);2013年10期
4 冀俊忠;劉志軍;劉紅欣;劉椿年;;蛋白質相互作用網(wǎng)絡功能模塊檢測的研究綜述[J];自動化學報;2014年04期
5 趙碧海;熊慧軍;倪問尹;劉志兵;胡賽;;一種改進的基于加權網(wǎng)絡的蛋白質復合物識別算法[J];計算機科學;2014年06期
6 于靜;劉燕兵;張宇;劉夢雅;譚建龍;郭莉;;大規(guī)模圖數(shù)據(jù)匹配技術綜述[J];計算機研究與發(fā)展;2015年02期
7 趙靜;方海洋;張衛(wèi)東;;中藥網(wǎng)絡藥理學研究中的生物信息學方法[J];藥學進展;2014年02期
8 郭雨辰;雷秉坤;鄧小龍;余W
本文編號:2767870
本文鏈接:http://www.sikaile.net/xiyixuelunwen/2767870.html
最近更新
教材專著