使用序列和網(wǎng)絡信息預測輔酶A相關蛋白的集成算法
發(fā)布時間:2024-03-09 18:43
輔酶A(Coenzyme A,Co A)在多種細胞功能和代謝通路中發(fā)揮著至關重要的作用,準確識別Co A相關蛋白(Coenzyme A-associated proteins,CAP)有利于深入理解;D(zhuǎn)移、羧酸代謝、三羧酸循環(huán)等重要生物過程。利用實驗方法鑒定這些重要蛋白耗時費力且價格昂貴,而開發(fā)計算方法則有望彌補現(xiàn)有實驗技術的不足。雖然已有少數(shù)計算研究從不同角度對CAP進行了分析,但是鮮有研究對這些蛋白從序列、進化、結(jié)構以及網(wǎng)絡等層面進行過系統(tǒng)的特征化并嘗試綜合這些信息來開發(fā)理論預測模型,因此本研究將率先在這方面進行探索。本研究提出了一種基于序列和網(wǎng)絡信息來預測CAP的集成算法。首先,該算法聯(lián)合機器學習方法和模板方法開發(fā)了用于識別Co A結(jié)合殘基的預測模型,并且利用預測的結(jié)合殘基分布特征進一步預測相關蛋白。實驗結(jié)果表明相較于其他蛋白,CAP更傾向于與Co A或其衍生物發(fā)生物理綁定。其次,在序列和網(wǎng)絡層面設計了其他六類特征并構建了相應的子分類器,這些特征包括詞嵌入向量、遠距同源物數(shù)量、進化保守性、氨基酸組成、預測的結(jié)構特征和網(wǎng)絡拓撲特征。通過比對分析,發(fā)現(xiàn)CAP具有更多的遠距同源物且更...
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3923777
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
圖1CoA在哺乳動物細胞中的生物合成和降解(Gout2018)
華中農(nóng)業(yè)大學2020屆碩士研究生學位(畢業(yè))論文2道大腸桿菌菌群對動物有部分泛酸的貢獻。日常食物中維生素B5的含量很高,并且人腸中的細菌也會產(chǎn)生維生素B5。如圖1B,細胞中CoA的總含量也受降解控制,涉及磷酸二酯酶(phosphodiesterases),磷酸酶(phosphat....
圖2數(shù)據(jù)收集流程及分類器框架
使用序列和網(wǎng)絡信息預測輔酶A相關蛋白的集成算法9圖2數(shù)據(jù)收集流程及分類器框架(A)數(shù)據(jù)集收集流程,(B)CoA綁定殘基預測流程,(C)CAP綁定蛋白2層分類器流程。關鍵詞:coa或coenzymea,數(shù)據(jù)過濾:本研究設定在UniProt三個模塊(催化活性、GO分子功能、GO生物過....
圖3模板庫序列詞劃分
華中農(nóng)業(yè)大學2020屆碩士研究生學位(畢業(yè))論文12用上述13維特征表示綁定位點信息。最后聯(lián)合使用26維特征預測CAP。2.3.2詞向量特征詞向量方法的主要思想是序列間交互信息的分布式表示,這一方法已被廣泛用于機器學習中的蛋白質(zhì)結(jié)構和功能預測。連續(xù)的向量表示已經(jīng)在自然語言處理中被....
圖4CAPBR方法所得預測概率的13種統(tǒng)計特征在3物種正負樣本間比較
華中農(nóng)業(yè)大學2020屆碩士研究生學位(畢業(yè))論文
本文編號:3923777
本文鏈接:http://www.sikaile.net/projectlw/swxlw/3923777.html
最近更新
教材專著