天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

蛋白質(zhì)—蛋白質(zhì)相互作用的簡易預(yù)測工具開發(fā)與實例研究

發(fā)布時間:2020-08-21 16:08
【摘要】:理解蛋白質(zhì)-蛋白質(zhì)相互作用(蛋白互作)是當代生物學的重要挑戰(zhàn)任務(wù),蛋白互作的計算預(yù)測與分析也已成為近期生物信息學領(lǐng)域的熱門研究課題之一。在本研究中,作者首先建立了一個一般性的蛋白互作預(yù)測器,這一預(yù)測器利用了互作蛋白對間非隨機的密碼子對使用信息。此后,作者進一步針對兩個重要實例——泛素化位點與微管結(jié)合蛋白開展了更為具體的研究。泛素化位點是底物被泛素化修飾的位點,它與泛素化酶直接互作。由于泛素化系統(tǒng)的復(fù)雜性,目前仍不清楚泛素化位點的哪些特征使其能特異地與泛素化酶結(jié)合并被修飾。因此,在第一項實例研究中,作者試圖通過統(tǒng)計分析,挖掘人類泛素化位點的結(jié)構(gòu)特征。微管結(jié)合蛋白,顧名思義,是微管的互作伙伴。微管作為一種高度動態(tài)的蛋白復(fù)合體,它與伙伴的互作關(guān)系往往不能被一般的二元蛋白互作組所完全覆蓋。在第二項實例研究中,作者通過人工文獻搜集得到了一個高可信度的微管結(jié)合蛋白的數(shù)據(jù)集,并據(jù)此提取特征,構(gòu)建了全新的微管結(jié)合蛋白在線分析工具。 最近,借由機器學習技術(shù),不依賴同源性的簡單序列編碼被越來越多地應(yīng)用于蛋白互作的預(yù)測問題上。初步分析顯示,酵母中互作蛋白對間的密碼子對使用與隨機蛋白對顯著不同。受這一現(xiàn)象啟發(fā),作者開發(fā)了一種基于密碼子對頻率差異編碼與支持向量機分類模型的蛋白互作預(yù)測器CCPPI.在正負樣本平衡的酵母數(shù)據(jù)集上進行的十折交叉檢驗結(jié)果表明,提出的編碼優(yōu)于其它簡單序列編碼。而在更嚴格的、非平衡的大規(guī)模獨立測試集上,CCPPI展示出與同類方法可比或更優(yōu)的精度,其整體預(yù)測性能也排名前列。通過對CCPPI真陽性預(yù)測結(jié)果的統(tǒng)計分析,作者發(fā)現(xiàn)它傾向于反映互作蛋白對間蛋白質(zhì)組水平共表達、功能相似的關(guān)系,這一特點或許有利于其對蛋白互作的預(yù)測。另一方面,和同類蛋白互作預(yù)測器一樣,CCPPI也被發(fā)現(xiàn)存在假陽性率高的問題。盡管如此,進一步與依賴同源性的蛋白互作預(yù)測方法的比較表明,CCPPI與基于保守性或系統(tǒng)發(fā)育譜相關(guān)性的預(yù)測方法能相互補充。因此,當這些依賴同源性的方法失效時,CCPPI將是一個良好的備選蛋白互作預(yù)測器。作者構(gòu)建了CCPPI在線預(yù)測服務(wù)器,免費對學術(shù)界開放使用,具體網(wǎng)址是http://protein.cau. edu.cn/ccppi。 對于絕大多數(shù)人類蛋白質(zhì)來說,其存續(xù)與功能是受泛素化過程調(diào)控的。時至今日,通過高通量蛋白質(zhì)組學實驗,數(shù)以萬計的人類泛素化位點被鑒定出來。然而,泛素化位點的選擇機制仍不明確,這要歸因于泛素化位點側(cè)翼復(fù)雜的序列模式。作者對一個包含有505個人類蛋白質(zhì)結(jié)構(gòu)的數(shù)據(jù)集開展了系統(tǒng)的分析。這一結(jié)構(gòu)數(shù)據(jù)集覆蓋了1330個高置信度的泛素化位點。定量分析結(jié)果顯示,泛素化位點具有更高的可及性。而一個意外發(fā)現(xiàn)是,泛素化位點具有更高的中心性。進一步分析表明,泛素化位點更高的中心性與其能夠影響(包括蛋白互作界面在內(nèi)的)多種蛋白質(zhì)功能位點的特性有關(guān)。作者的分析還表明,在一維序列上,泛素化位點的側(cè)翼呈現(xiàn)出非隨機的局部構(gòu)象模式;而在三維空間上,泛素化位點則被一組非隨機的氨基酸殘基所圍繞。最后,定量分析結(jié)果清楚地顯示泛素化位點的結(jié)構(gòu)特征與序列模式是能夠相互補充的,這實質(zhì)上暗示了結(jié)構(gòu)水平上的泛素化位點選擇機制存在的可能性。 微管是真核生物細胞骨架的主要成分之一。它能調(diào)控細胞形態(tài)、細胞分裂、胞內(nèi)運輸、細胞信號轉(zhuǎn)導(dǎo)等諸多生物過程,而微管的這些生物學功能正是通過一系列微管結(jié)合蛋白行使與控制的。領(lǐng)域內(nèi)專家已經(jīng)注意到已知的微管結(jié)合蛋白具有明顯的多樣性,而新種類的微管結(jié)合蛋白也不斷地被鑒定出來。與此產(chǎn)生鮮明對比的是,目前尚沒有專門收錄已知微管結(jié)合蛋白的數(shù)據(jù)庫,也沒有專門的預(yù)測器以幫助發(fā)現(xiàn)新的微管結(jié)合蛋白。作者建立了一個以微管結(jié)合蛋白為中心的在線分析工具MAPanalyzer,它包括了兩個部分:微管結(jié)合蛋白數(shù)據(jù)庫與微管結(jié)合蛋白預(yù)測器。微管結(jié)合蛋白數(shù)據(jù)庫的核心數(shù)據(jù)集是完全由作者人工文獻搜集得到的。這些信息與其它通過自動化流程得到的蛋白注釋共同組成了微管結(jié)合蛋白數(shù)據(jù)庫。人工搜集的核心數(shù)據(jù)集也使得進一步提取微管結(jié)合蛋白的代表性模體成為可能。利用這些代表性模體,設(shè)計了一個半監(jiān)督的支持向量機分類器,并將其與同源序列搜索方法BLAST整合,以構(gòu)成新的微管結(jié)合蛋白預(yù)測器。在基于高質(zhì)量獨立測試集和擬南芥全基因組數(shù)據(jù)集的預(yù)測性能評測中,整合的預(yù)測器的表現(xiàn)不僅優(yōu)于其構(gòu)成組分(即支持向量機分類器與BLAST),還優(yōu)于該領(lǐng)域內(nèi)另一個常用的同源蛋白搜索工具PSI-BLAST.和CCPPI一樣,MAPanalyzer (http://systbio.cau.edu.cn/mappred/)同樣可供學術(shù)界免費使用。
【學位授予單位】:中國農(nóng)業(yè)大學
【學位級別】:博士
【學位授予年份】:2015
【分類號】:Q51
【圖文】:

蛋白質(zhì)序列,數(shù)據(jù)庫記錄,增長情況,蛋白


UniProtKB/Swiss-Prot數(shù)據(jù)庫中。一個事實是,盡管同出一門(UniProt Consortium, 2015),兩者的蛋白條目數(shù)長期存在著數(shù)量級的差異,而且這個差異正在逐步加大。如圖1-1所示,根據(jù)UniProt定期更新的數(shù)據(jù)庫統(tǒng)計信息(http://www.uniprot.org/statistics/), 2014年1月,TrEMBL蛋白記錄數(shù)約為5000萬,而Swiss-Prot蛋白記錄數(shù)約為54萬。而僅僅一年過后,TrEMBL蛋白記錄數(shù)己迅速躍進至接近9000萬的水平,而Swiss-Prot增長平緩,僅達到接近55萬(547085)的水平。值得注意的是,考慮到序列同源性,蛋白質(zhì)序列信息總量與功能信息總量的差異并沒有如此巨大。然而

預(yù)測方法,互作,蛋白質(zhì)相互作用,蛋白


的計算預(yù)測方法成為了對實驗鑒定方法的重要補充。如圖1-2所示,蛋白互作的計算預(yù)測方法大體可以歸為依賴同源性的方法與不依賴同源性的方法。依賴同源性的方法可以進一步分為直接映射方法和共進化方法,不依賴同源性的方法又可以分為關(guān)聯(lián)法與基于序列的機器學習方法。下面首先對一些代表性方法進行簡介,然后對本論文所涉及的機器學習法的一般流程加以詳細介紹。1.1.2.1 依賴同源性的計算預(yù)測方法直系同源蛋白互作對映射法(interologmapping):直系同源蛋白互作對(interolog)這一概念最早由Vidal課題組提出,指的是不同物種間一對直系同源蛋白間保守的互作關(guān)系(Matthews et al.,2001)o他們發(fā)現(xiàn),這種保守的互作關(guān)系并不罕見,在抽選的直系同源蛋白對中,16%-31%的互作關(guān)系在物種間是保守的。這一發(fā)現(xiàn)大大鼓舞了相關(guān)方法學的發(fā)展,即將模式生物測定的蛋白互作信息轉(zhuǎn)移給其它物種的直系同源蛋白對。這一方法的優(yōu)點是不需要任何異源數(shù)據(jù)(如轉(zhuǎn)錄組)信息

蛋白質(zhì)—蛋白質(zhì)相互作用的簡易預(yù)測工具開發(fā)與實例研究


圖.妞州仁.0r門}wco甲佃娜頤訓0口taeIs"護峨下陽O腸州.f口d.月,娜喊的亡C加r腳襯抽倪協(xié)的翻e矛,p目川

【共引文獻】

相關(guān)期刊論文 前10條

1 莊振華;王年;李學俊;梁棟;王繼;;癌癥基因表達數(shù)據(jù)的熵度量分類方法[J];安徽大學學報(自然科學版);2010年02期

2 陳樂;王年;蘇亮亮;王蕊平;;基于鄰接譜主分量分析的腫瘤分類方法[J];安徽大學學報(自然科學版);2011年04期

3 葉愛霞;王年;蘇亮亮;;基于非負矩陣分解和Normal_Matrix的腫瘤基因分類[J];安徽大學學報(自然科學版);2012年03期

4 楊緒兵,韓自存;ε不敏感的核Adaline算法及其在圖像去噪中的應(yīng)用[J];安徽工程科技學院學報(自然科學版);2003年04期

5 陶秀鳳,唐詩忠,周鳴爭;基于支持向量機的軟測量模型及應(yīng)用[J];安徽工程科技學院學報(自然科學版);2004年02期

6 許高程;張文君;王衛(wèi)紅;;支持向量機技術(shù)在遙感影像滑坡體提取中的應(yīng)用[J];安徽農(nóng)業(yè)科學;2009年06期

7 郭立萍;唐家奎;米素娟;張成雯;趙理君;;基于支持向量機遙感圖像融合分類方法研究進展[J];安徽農(nóng)業(yè)科學;2010年17期

8 馮學軍;;最小二乘支持向量機的研究與應(yīng)用[J];安慶師范學院學報(自然科學版);2009年01期

9 鄒心遙;姚若河;;基于LSSVM的威布爾分布形狀參數(shù)估計(英文)[J];半導(dǎo)體技術(shù);2008年06期

10 鄒心遙;姚若河;;基于LSSVM的小子樣元器件壽命預(yù)測[J];半導(dǎo)體技術(shù);2011年09期

相關(guān)會議論文 前10條

1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中國科學院地質(zhì)與地球物理研究所第11屆(2011年度)學術(shù)年會論文集(下)[C];2012年

2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六屆中國控制會議論文集[C];2007年

3 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六屆中國控制會議論文集[C];2007年

4 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七屆中國控制會議論文集[C];2008年

5 ;State Estimation Model of Ferment Process Based on PSO[A];第二十九屆中國控制會議論文集[C];2010年

6 ?×;魏巍;梁君燕;;基于支持向量機的SURF改進算法[A];中國自動化學會控制理論專業(yè)委員會C卷[C];2011年

7 ;Research of Intelligent Control Model and System on Traffic Light Time[A];中國自動化學會控制理論專業(yè)委員會D卷[C];2011年

8 劉友強;李斌;奚寧;陳家駿;;基于雙語平行語料的中文縮略語提取方法[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

9 陳龍;吳志勇;袁春;蒙美玲;蔡蓮紅;;面向數(shù)字版權(quán)管理的聲紋輔助認證系統(tǒng)[A];第十一屆全國人機語音通訊學術(shù)會議論文集(一)[C];2011年

10 顏七笙;;基于PCA-SVM的動態(tài)聯(lián)盟候選伙伴績效評價方法[A];第十三屆中國管理科學學術(shù)年會論文集[C];2011年

相關(guān)博士學位論文 前10條

1 于化龍;基于DNA微陣列數(shù)據(jù)的癌癥分類技術(shù)研究[D];哈爾濱工程大學;2010年

2 殷志偉;基于統(tǒng)計學習理論的分類方法研究[D];哈爾濱工程大學;2009年

3 孔凡芝;引線鍵合視覺檢測關(guān)鍵技術(shù)研究[D];哈爾濱工程大學;2009年

4 鄭大騰;柔性坐標測量機空間誤差模型及最佳測量區(qū)研究[D];合肥工業(yè)大學;2010年

5 柏堅;非線性數(shù)學地質(zhì)模型研究及在滇東南金礦成礦預(yù)測中的應(yīng)用[D];中國地質(zhì)大學(北京);2010年

6 章鵬;多尺度特征檢測:方法和應(yīng)用研究[D];中國科學技術(shù)大學;2010年

7 張昌明;新疆漢族、維吾爾族及哈薩克族食管癌血清蛋白質(zhì)指紋圖譜研究[D];新疆醫(yī)科大學;2010年

8 王曉明;基于統(tǒng)計學習的模式識別幾個問題及其應(yīng)用研究[D];江南大學;2010年

9 呂寧;基于數(shù)據(jù)驅(qū)動的故障診斷模型及算法研究[D];哈爾濱理工大學;2009年

10 劉衛(wèi)紅;垃圾郵件檢測與過濾關(guān)鍵技術(shù)研究[D];華南理工大學;2010年

相關(guān)碩士學位論文 前10條

1 李金華;基于SVM的多類文本分類研究[D];山東科技大學;2010年

2 朱耿峰;支持向量機在沖擊地壓預(yù)測模型中的應(yīng)用研究[D];山東科技大學;2010年

3 李朋勇;基于全矢高階譜的故障診斷方法及其應(yīng)用研究[D];鄭州大學;2010年

4 劉磊;多泥沙河流水庫優(yōu)化調(diào)度研究[D];鄭州大學;2010年

5 辛保兵;既有預(yù)應(yīng)力混凝土梁橋剩余承載力評估方法研究[D];鄭州大學;2010年

6 王巧立;微生物發(fā)酵過程的建模與優(yōu)化控制研究[D];鄭州大學;2010年

7 林天威;基于視頻流的人臉識別系統(tǒng)研究[D];哈爾濱工程大學;2010年

8 韓艷;基于支持向量機的發(fā)酵過程建模研究[D];大連理工大學;2010年

9 馬穩(wěn);基于支持向量機的模擬電路故障診斷研究[D];大連理工大學;2010年

10 梁懷志;基于嵌入式的車型分類系統(tǒng)的設(shè)計與實現(xiàn)[D];大連理工大學;2010年



本文編號:2799587

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/jckxbs/2799587.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9ba8c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com