基于深度學(xué)習(xí)與領(lǐng)域規(guī)則建模的蛋白質(zhì)信號肽及其切割位點預(yù)測
發(fā)布時間:2021-03-30 01:27
為了提升蛋白質(zhì)信號肽及其切割位點預(yù)測精度,有效區(qū)分3種不同類型的信號肽,提出基于位置特異性打分矩陣(PSSM)和同源檢測迭代的隱馬爾科夫(HMM)文件的深度學(xué)習(xí)預(yù)測方法。設(shè)計基于自注意力機制的神經(jīng)網(wǎng)絡(luò)模型用于信號肽預(yù)測,并使用基于知識遷移的模型集成方法提升預(yù)測效果。設(shè)計基于門控循環(huán)單元(GRU)網(wǎng)絡(luò)的條件隨機場(CRF)來預(yù)測信號肽切割位點,并集成領(lǐng)域規(guī)則方法提升預(yù)測能力。實驗結(jié)果表明,該文方法對革蘭氏陰性菌和革蘭氏陽性菌的Sec/SPI、Sec/SPII與Tat/SPI信號肽預(yù)測任務(wù)的平均馬修斯相關(guān)系數(shù)(MCC)為0.962。該文方法對革蘭氏陰性菌和革蘭氏陽性菌的Sec/SPI、Sec/SPII與Tat/SPI信號肽切割位點預(yù)測任務(wù)的平均召回率和準(zhǔn)確率分別為0.698和0.662。在部分信號肽樣本上,該文方法能正確預(yù)測SignalP 5.0方法預(yù)測錯誤的樣本,2種方法在切割位點的預(yù)測上存在著一定的互補性。
【文章來源】:南京理工大學(xué)學(xué)報. 2020,44(03)北大核心CSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
基于深度模型的信號肽預(yù)測器結(jié)構(gòu)圖
本文基于深度模型的信號肽切割位點預(yù)測器Signal-3Lnew的結(jié)構(gòu)如圖2所示,它是1個殘基級別(Residue-level)的分類器,它的特征提取部分與圖1的序列級別(Sequence-level)分類器相同。網(wǎng)絡(luò)部分首先采用3層的門控循環(huán)單元網(wǎng)絡(luò)來抽取氨基酸殘基間的相關(guān)性,該層的輸出被送入2層的全連接層,將輸出的特征變換為L×3的矩陣。進一步使用條件隨機場(Conditional random field,CRF)算法[9,29,30]來標(biāo)注氨基酸殘基序列,進而識別唯一的切割位點。給定1個具有L個殘基的蛋白質(zhì),預(yù)測網(wǎng)絡(luò)輸出L×3矩陣,使用CRF從該矩陣預(yù)測蛋白質(zhì)序列類標(biāo):給定輸入h1,h2,…,hL,其中L表示輸入序列的長度,那么標(biāo)簽序列y=y1,y2,…,yL的分布為
圖3統(tǒng)計了在Sec/SPI、Sec/SPII、Tat/SPI 3種不同信號肽作為正樣本時,不同模型的效果對比,比對的指標(biāo)為MCC。采用特定類別樣本訓(xùn)練得到的模型GruAttenspe與加入其他生物類別樣本共同訓(xùn)練的模型GruAttenall對比。從圖3的實驗結(jié)果可以發(fā)現(xiàn),考慮Sec/SPI信號肽的MCC1指標(biāo),對于革蘭氏陰性菌,GruAttenspe效果優(yōu)于GruAttenall,高出了0.036。對于革蘭氏陽性菌,兩者的效果一致,都是0.949。
本文編號:3108580
【文章來源】:南京理工大學(xué)學(xué)報. 2020,44(03)北大核心CSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
基于深度模型的信號肽預(yù)測器結(jié)構(gòu)圖
本文基于深度模型的信號肽切割位點預(yù)測器Signal-3Lnew的結(jié)構(gòu)如圖2所示,它是1個殘基級別(Residue-level)的分類器,它的特征提取部分與圖1的序列級別(Sequence-level)分類器相同。網(wǎng)絡(luò)部分首先采用3層的門控循環(huán)單元網(wǎng)絡(luò)來抽取氨基酸殘基間的相關(guān)性,該層的輸出被送入2層的全連接層,將輸出的特征變換為L×3的矩陣。進一步使用條件隨機場(Conditional random field,CRF)算法[9,29,30]來標(biāo)注氨基酸殘基序列,進而識別唯一的切割位點。給定1個具有L個殘基的蛋白質(zhì),預(yù)測網(wǎng)絡(luò)輸出L×3矩陣,使用CRF從該矩陣預(yù)測蛋白質(zhì)序列類標(biāo):給定輸入h1,h2,…,hL,其中L表示輸入序列的長度,那么標(biāo)簽序列y=y1,y2,…,yL的分布為
圖3統(tǒng)計了在Sec/SPI、Sec/SPII、Tat/SPI 3種不同信號肽作為正樣本時,不同模型的效果對比,比對的指標(biāo)為MCC。采用特定類別樣本訓(xùn)練得到的模型GruAttenspe與加入其他生物類別樣本共同訓(xùn)練的模型GruAttenall對比。從圖3的實驗結(jié)果可以發(fā)現(xiàn),考慮Sec/SPI信號肽的MCC1指標(biāo),對于革蘭氏陰性菌,GruAttenspe效果優(yōu)于GruAttenall,高出了0.036。對于革蘭氏陽性菌,兩者的效果一致,都是0.949。
本文編號:3108580
本文鏈接:http://www.sikaile.net/projectlw/swxlw/3108580.html
最近更新
教材專著