基于序列模型的肽序列可信度評估
發(fā)布時間:2021-03-10 12:30
在肽序列鑒定過程中對候選肽序列與實驗串聯(lián)質(zhì)譜匹配對(肽譜匹配對)進(jìn)行評估打分是非常關(guān)鍵的一步,準(zhǔn)確有效的可信度評估算法能提高肽序列鑒定的準(zhǔn)確度。傳統(tǒng)的打分算法通常利用預(yù)測出的理論質(zhì)譜譜圖與實驗質(zhì)譜譜圖的相似度分?jǐn)?shù)進(jìn)行分?jǐn)?shù)計算,無法充分有效地利用肽碎裂規(guī)律。本文針對這一問題提出了一種結(jié)合肽序列信息表征的多分類概率和式可信度評估算法:deep Score-α。deep Score-α使用一維殘差網(wǎng)絡(luò)對序列底層信息進(jìn)行抽取,再通過多頭注意力機制融合序列不同肽鍵位點對當(dāng)前肽鍵斷裂位點產(chǎn)生的影響從而生成最終的碎片離子相對強度分布概率矩陣,結(jié)合肽序列碎片離子的實際相對強度計算出最終的肽譜匹配可信度。該算法從常用開源鑒定工具Comet以及MSGF+的鑒定結(jié)果中提取候選肽序列進(jìn)行重新打分并與原有結(jié)果進(jìn)行了比較:deep Score-α在人類蛋白組數(shù)據(jù)集中FDR=0.01時保留的肽序列數(shù)量相較于Comet和MSGF+提升了約14%,Top1命中率(正確肽序列得分最高的譜圖所占比例)最大提升約5%。使用人類蛋白組數(shù)據(jù)集訓(xùn)練的模型在Proteome Tools2數(shù)據(jù)集上進(jìn)行泛化性能測試,deep Score...
【文章來源】:山東理工大學(xué)山東省
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
氨基酸結(jié)構(gòu)通式Fig2.1Thegeneralstructuralformulaforaminoacids
山東理工大學(xué)碩士學(xué)位論文第二章深度學(xué)習(xí)與質(zhì)譜技術(shù)8圖2.2三個氨基酸通過脫水縮合作用形成肽鏈Fig2.2Threeaminoacidsformingpeptidechainsbydehydrationandcondensation2.1.2串聯(lián)質(zhì)譜技術(shù)質(zhì)譜分析是一種通過測量離子質(zhì)荷比(質(zhì)量-電荷比)進(jìn)而對試驗樣品進(jìn)行分析的方法,在試驗樣品經(jīng)過離子源時,試驗樣品中的組分發(fā)生,生成不同荷質(zhì)比的帶電荷的離子,再經(jīng)加速電場形成離子束,最后進(jìn)入分析器得出最終結(jié)果。在使用串聯(lián)質(zhì)譜(MS/MS)進(jìn)行蛋白質(zhì)鑒定的過程中,樣品蛋白質(zhì)首先被酶解,然后送入質(zhì)譜儀中進(jìn)行離子化,產(chǎn)生母離子并獲得相應(yīng)的一級質(zhì)譜,再選擇一些母離子通過一些離子解離方法進(jìn)行碎裂,再次分析,記錄下各個離子碎片的質(zhì)荷比(m/z)和強度信息,其流程如圖2.3所示。用的離子解離方法包括CID(Collision-inducedDissociation,即通過撞擊使得肽鍵斷裂從而達(dá)到多肽碎裂目的的方法)和HCD(High-energyC-trapDissociation,即在高能條件下讓肽鍵斷裂進(jìn)而碎裂多肽的方法,該方法碎裂規(guī)律與CID相似,但碎裂能量更高),還有一些如ETD(electrontransferdissociation)、ECD(electroncatchdissociation)等。圖2.3蛋白質(zhì)鑒定中串聯(lián)質(zhì)譜數(shù)據(jù)獲取流程Fig2.3Thedataacquisitionprocessoftandemmassspectrometryinproteinidentification經(jīng)過質(zhì)譜儀獲得的原始質(zhì)譜圖是碎片離子的峰形圖,為了后續(xù)存儲計算方便,通常將原始質(zhì)譜圖中的離子峰轉(zhuǎn)換為(m/z,intensity)這樣的形式來保存,其中,m/z表示離子峰的中心質(zhì)荷比,intensity表示離子峰的強度。在描述離子峰的強度時,一
山東理工大學(xué)碩士學(xué)位論文第二章深度學(xué)習(xí)與質(zhì)譜技術(shù)8圖2.2三個氨基酸通過脫水縮合作用形成肽鏈Fig2.2Threeaminoacidsformingpeptidechainsbydehydrationandcondensation2.1.2串聯(lián)質(zhì)譜技術(shù)質(zhì)譜分析是一種通過測量離子質(zhì)荷比(質(zhì)量-電荷比)進(jìn)而對試驗樣品進(jìn)行分析的方法,在試驗樣品經(jīng)過離子源時,試驗樣品中的組分發(fā)生,生成不同荷質(zhì)比的帶電荷的離子,再經(jīng)加速電場形成離子束,最后進(jìn)入分析器得出最終結(jié)果。在使用串聯(lián)質(zhì)譜(MS/MS)進(jìn)行蛋白質(zhì)鑒定的過程中,樣品蛋白質(zhì)首先被酶解,然后送入質(zhì)譜儀中進(jìn)行離子化,產(chǎn)生母離子并獲得相應(yīng)的一級質(zhì)譜,再選擇一些母離子通過一些離子解離方法進(jìn)行碎裂,再次分析,記錄下各個離子碎片的質(zhì)荷比(m/z)和強度信息,其流程如圖2.3所示。用的離子解離方法包括CID(Collision-inducedDissociation,即通過撞擊使得肽鍵斷裂從而達(dá)到多肽碎裂目的的方法)和HCD(High-energyC-trapDissociation,即在高能條件下讓肽鍵斷裂進(jìn)而碎裂多肽的方法,該方法碎裂規(guī)律與CID相似,但碎裂能量更高),還有一些如ETD(electrontransferdissociation)、ECD(electroncatchdissociation)等。圖2.3蛋白質(zhì)鑒定中串聯(lián)質(zhì)譜數(shù)據(jù)獲取流程Fig2.3Thedataacquisitionprocessoftandemmassspectrometryinproteinidentification經(jīng)過質(zhì)譜儀獲得的原始質(zhì)譜圖是碎片離子的峰形圖,為了后續(xù)存儲計算方便,通常將原始質(zhì)譜圖中的離子峰轉(zhuǎn)換為(m/z,intensity)這樣的形式來保存,其中,m/z表示離子峰的中心質(zhì)荷比,intensity表示離子峰的強度。在描述離子峰的強度時,一
【參考文獻(xiàn)】:
期刊論文
[1]肽段的理論串聯(lián)質(zhì)譜圖預(yù)測方法研究進(jìn)展[J]. 周擷璇,任睿,高婉鈴,黃運有,曾文鋒,孔德飛,郝天舒,張知非,詹劍鋒. 生物化學(xué)與生物物理進(jìn)展. 2019(02)
[2]深度學(xué)習(xí)方法在生物質(zhì)譜及蛋白質(zhì)組學(xué)中的應(yīng)用[J]. 趙新元,秦偉捷,錢小紅. 生物化學(xué)與生物物理進(jìn)展. 2018(12)
本文編號:3074665
【文章來源】:山東理工大學(xué)山東省
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
氨基酸結(jié)構(gòu)通式Fig2.1Thegeneralstructuralformulaforaminoacids
山東理工大學(xué)碩士學(xué)位論文第二章深度學(xué)習(xí)與質(zhì)譜技術(shù)8圖2.2三個氨基酸通過脫水縮合作用形成肽鏈Fig2.2Threeaminoacidsformingpeptidechainsbydehydrationandcondensation2.1.2串聯(lián)質(zhì)譜技術(shù)質(zhì)譜分析是一種通過測量離子質(zhì)荷比(質(zhì)量-電荷比)進(jìn)而對試驗樣品進(jìn)行分析的方法,在試驗樣品經(jīng)過離子源時,試驗樣品中的組分發(fā)生,生成不同荷質(zhì)比的帶電荷的離子,再經(jīng)加速電場形成離子束,最后進(jìn)入分析器得出最終結(jié)果。在使用串聯(lián)質(zhì)譜(MS/MS)進(jìn)行蛋白質(zhì)鑒定的過程中,樣品蛋白質(zhì)首先被酶解,然后送入質(zhì)譜儀中進(jìn)行離子化,產(chǎn)生母離子并獲得相應(yīng)的一級質(zhì)譜,再選擇一些母離子通過一些離子解離方法進(jìn)行碎裂,再次分析,記錄下各個離子碎片的質(zhì)荷比(m/z)和強度信息,其流程如圖2.3所示。用的離子解離方法包括CID(Collision-inducedDissociation,即通過撞擊使得肽鍵斷裂從而達(dá)到多肽碎裂目的的方法)和HCD(High-energyC-trapDissociation,即在高能條件下讓肽鍵斷裂進(jìn)而碎裂多肽的方法,該方法碎裂規(guī)律與CID相似,但碎裂能量更高),還有一些如ETD(electrontransferdissociation)、ECD(electroncatchdissociation)等。圖2.3蛋白質(zhì)鑒定中串聯(lián)質(zhì)譜數(shù)據(jù)獲取流程Fig2.3Thedataacquisitionprocessoftandemmassspectrometryinproteinidentification經(jīng)過質(zhì)譜儀獲得的原始質(zhì)譜圖是碎片離子的峰形圖,為了后續(xù)存儲計算方便,通常將原始質(zhì)譜圖中的離子峰轉(zhuǎn)換為(m/z,intensity)這樣的形式來保存,其中,m/z表示離子峰的中心質(zhì)荷比,intensity表示離子峰的強度。在描述離子峰的強度時,一
山東理工大學(xué)碩士學(xué)位論文第二章深度學(xué)習(xí)與質(zhì)譜技術(shù)8圖2.2三個氨基酸通過脫水縮合作用形成肽鏈Fig2.2Threeaminoacidsformingpeptidechainsbydehydrationandcondensation2.1.2串聯(lián)質(zhì)譜技術(shù)質(zhì)譜分析是一種通過測量離子質(zhì)荷比(質(zhì)量-電荷比)進(jìn)而對試驗樣品進(jìn)行分析的方法,在試驗樣品經(jīng)過離子源時,試驗樣品中的組分發(fā)生,生成不同荷質(zhì)比的帶電荷的離子,再經(jīng)加速電場形成離子束,最后進(jìn)入分析器得出最終結(jié)果。在使用串聯(lián)質(zhì)譜(MS/MS)進(jìn)行蛋白質(zhì)鑒定的過程中,樣品蛋白質(zhì)首先被酶解,然后送入質(zhì)譜儀中進(jìn)行離子化,產(chǎn)生母離子并獲得相應(yīng)的一級質(zhì)譜,再選擇一些母離子通過一些離子解離方法進(jìn)行碎裂,再次分析,記錄下各個離子碎片的質(zhì)荷比(m/z)和強度信息,其流程如圖2.3所示。用的離子解離方法包括CID(Collision-inducedDissociation,即通過撞擊使得肽鍵斷裂從而達(dá)到多肽碎裂目的的方法)和HCD(High-energyC-trapDissociation,即在高能條件下讓肽鍵斷裂進(jìn)而碎裂多肽的方法,該方法碎裂規(guī)律與CID相似,但碎裂能量更高),還有一些如ETD(electrontransferdissociation)、ECD(electroncatchdissociation)等。圖2.3蛋白質(zhì)鑒定中串聯(lián)質(zhì)譜數(shù)據(jù)獲取流程Fig2.3Thedataacquisitionprocessoftandemmassspectrometryinproteinidentification經(jīng)過質(zhì)譜儀獲得的原始質(zhì)譜圖是碎片離子的峰形圖,為了后續(xù)存儲計算方便,通常將原始質(zhì)譜圖中的離子峰轉(zhuǎn)換為(m/z,intensity)這樣的形式來保存,其中,m/z表示離子峰的中心質(zhì)荷比,intensity表示離子峰的強度。在描述離子峰的強度時,一
【參考文獻(xiàn)】:
期刊論文
[1]肽段的理論串聯(lián)質(zhì)譜圖預(yù)測方法研究進(jìn)展[J]. 周擷璇,任睿,高婉鈴,黃運有,曾文鋒,孔德飛,郝天舒,張知非,詹劍鋒. 生物化學(xué)與生物物理進(jìn)展. 2019(02)
[2]深度學(xué)習(xí)方法在生物質(zhì)譜及蛋白質(zhì)組學(xué)中的應(yīng)用[J]. 趙新元,秦偉捷,錢小紅. 生物化學(xué)與生物物理進(jìn)展. 2018(12)
本文編號:3074665
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3074665.html
最近更新
教材專著