基于深度學習的采樣技術(shù)在蛋白質(zhì)結(jié)構(gòu)預測中運用
本文關(guān)鍵詞:基于深度學習的采樣技術(shù)在蛋白質(zhì)結(jié)構(gòu)預測中運用,由筆耕文化傳播整理發(fā)布。
【摘要】:蛋白質(zhì)結(jié)構(gòu)預測指的是:已知氨基酸序列,通過計算的手段預測蛋白質(zhì)空間三維結(jié)構(gòu)。作為生化實驗的一種補充手段,結(jié)構(gòu)預測能夠幫助我們在實驗結(jié)構(gòu)未知的情況下了解和利用蛋白質(zhì)的生化功能。目前,蛋白質(zhì)結(jié)構(gòu)預測的一大瓶頸在于構(gòu)象的采樣。所謂的采樣是指在蛋白質(zhì)的構(gòu)象空間中生成最小自由能的構(gòu)象。本文旨在采用深度學習技術(shù)研發(fā)一種新的采樣技術(shù),幫助蛋白質(zhì)結(jié)構(gòu)預測。傳統(tǒng)的采樣方法是對自由度直接賦值。這種方法在處理較少的殘基時能取得好的效果。但是對于包含100個殘基以上的蛋白質(zhì)結(jié)構(gòu),由于構(gòu)象空間的急劇增長,難以得到理想的結(jié)構(gòu)。本文引入深度學習中的混合蒙特卡羅采樣方法,以概率分布為依據(jù)對蛋白質(zhì)的自由度進行采樣,能夠?qū)Π?00、200甚至更多個殘基的蛋白質(zhì)結(jié)構(gòu)進行采樣。并且,在采樣的過程中加入殘基間的距離約束,使得一個結(jié)構(gòu)中,最多有75%(平均40%)的殘基對得到優(yōu)化,滿足距離約束。能量函數(shù)是采樣方法的基礎(chǔ)依據(jù)。本文引入深度學習中的卷積神經(jīng)網(wǎng)絡(luò),通過改進網(wǎng)絡(luò)結(jié)構(gòu),讓其能夠?qū)W習蛋白質(zhì)結(jié)構(gòu)中原子之間的相互作用關(guān)系。然后,在多層網(wǎng)絡(luò)的學習的基礎(chǔ)上,用其做回歸運算,能夠準確的預測蛋白質(zhì)結(jié)構(gòu)的GDT-Score,在實驗中和標準GDT-Score的誤差僅在0.002左右。
【關(guān)鍵詞】:蛋白質(zhì) 結(jié)構(gòu)預測 采樣 混合蒙特卡羅 卷積神經(jīng)網(wǎng)絡(luò)
【學位授予單位】:蘇州大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:Q51;TP181
【目錄】:
- 摘要4-5
- Abstract5-12
- 第一章 引言12-19
- 1.1 研究背景12-15
- 1.1.1 蛋白質(zhì)結(jié)構(gòu)預測12-14
- 1.1.2 采樣和帶約束的采樣14
- 1.1.3 深度學習的應(yīng)用14-15
- 1.2 研究內(nèi)容15-16
- 1.3 研究意義16-17
- 1.4 本文組織結(jié)構(gòu)17-19
- 第二章 蛋白質(zhì)結(jié)構(gòu)預測中的采樣技術(shù)19-32
- 2.1 結(jié)構(gòu)預測與采樣19-25
- 2.1.1 蛋白質(zhì)結(jié)構(gòu)19-23
- 2.1.2 蛋白質(zhì)結(jié)構(gòu)的計算表達23-24
- 2.1.3 采樣和能量函數(shù)24-25
- 2.2 Rosetta采樣25-26
- 2.2.1 兩個主要階段25-26
- 2.2.2 蒙特卡羅最小化26
- 2.3 I-TASSER采樣26-28
- 2.3.1 I-TASSER中蛋白質(zhì)構(gòu)象的表達26-27
- 2.3.2 構(gòu)象的采樣27-28
- 2.3.3 副本交換蒙特卡羅(REMC)28
- 2.4 QUARK采樣28-31
- 2.4.1 QUARK對自由度的改進29-30
- 2.4.2 QUARK對構(gòu)象采樣的改進30-31
- 2.4.3 其它方面的改進31
- 2.5 本章小結(jié)31-32
- 第三章 基于CNN的蛋白質(zhì)結(jié)構(gòu)打分函數(shù)32-48
- 3.1 卷積神經(jīng)網(wǎng)絡(luò)32-35
- 3.1.1 稀疏連接32-33
- 3.1.2 權(quán)值共享33-34
- 3.1.3 CNN網(wǎng)絡(luò)結(jié)構(gòu)34-35
- 3.2 材料與方法35-41
- 3.2.1 GDT-Score35
- 3.2.2 數(shù)據(jù)集35-38
- 3.2.3 模型和訓練38-41
- 3.3 實驗結(jié)果分析41-46
- 3.3.1 超參數(shù)選擇實驗41-44
- 3.3.2 GDT-Score預測實驗44-46
- 3.4 本章小結(jié)46-48
- 第四章 基于距離約束的HMC采樣48-67
- 4.1 HMC采樣48-51
- 4.1.1 Hamiltonian動力學49
- 4.1.2 Leap-Frog算法49
- 4.1.3 Metropolis判定49-50
- 4.1.4 在蛋白質(zhì)結(jié)構(gòu)預測中的運用50-51
- 4.2 距離約束51
- 4.3 材料與方法51-58
- 4.3.1 數(shù)據(jù)準備51-53
- 4.3.2 模型構(gòu)建53-55
- 4.3.3 實驗流程55-58
- 4.4 實驗結(jié)果與分析58-65
- 4.4.1 殘基對優(yōu)化58-62
- 4.4.2 結(jié)構(gòu)優(yōu)化62-65
- 4.4.3 結(jié)果討論65
- 4.5 本章小結(jié)65-67
- 第五章 總結(jié)與展望67-69
- 5.1 工作總結(jié)67
- 5.2 研究展望67-69
- 參考文獻69-78
- 發(fā)表文章目錄及科研項目78-79
- 致謝79-80
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 林治華;蛋白質(zhì)結(jié)構(gòu)預測的方法學評述[J];免疫學雜志;2001年S1期
2 靳利霞,唐煥文;蛋白質(zhì)結(jié)構(gòu)預測方法簡述[J];自然雜志;2001年04期
3 殷志祥;蛋白質(zhì)結(jié)構(gòu)預測方法的研究進展[J];計算機工程與應(yīng)用;2004年20期
4 史曉紅,劉文斌,王燕,羅亮,許進;圖論方法研究蛋白質(zhì)結(jié)構(gòu)預測問題[J];生物技術(shù);2005年05期
5 孫俠;殷志祥;;蛋白質(zhì)結(jié)構(gòu)預測的理論方法及階段[J];生物學雜志;2007年01期
6 劉云玲;陶蘭;;蛋白質(zhì)結(jié)構(gòu)預測方法探析[J];生物信息學;2007年04期
7 王俊;邢麗麗;周鵬;;蛋白質(zhì)結(jié)構(gòu)預測方法研究[J];黑龍江科技信息;2008年19期
8 李明;蘇顯中;于敏;鄭全喜;;蛋白質(zhì)結(jié)構(gòu)預測研究進展[J];生物技術(shù);2009年03期
9 倪紅春,王翼飛,史定華;遺傳算法在蛋白質(zhì)結(jié)構(gòu)預測中的應(yīng)用[J];上海大學學報(自然科學版);2001年03期
10 靳利霞,唐煥文;模擬退火算法的一種改進及其在蛋白質(zhì)結(jié)構(gòu)預測中的應(yīng)用[J];系統(tǒng)工程理論與實踐;2002年09期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 靳利霞;唐煥文;;基于能量極小化的蛋白質(zhì)結(jié)構(gòu)預測[A];中國運籌學會第六屆學術(shù)交流會論文集(上卷)[C];2000年
2 朱永鋒;崔光照;;基于構(gòu)象空間退火算法的蛋白質(zhì)結(jié)構(gòu)預測[A];科技、工程與經(jīng)濟社會協(xié)調(diào)發(fā)展——河南省第四屆青年學術(shù)年會論文集(上冊)[C];2004年
3 張紅娟;唐煥文;;蛋白質(zhì)結(jié)構(gòu)預測中的長短程作用分析與研究[A];大連理工大學生物醫(yī)學工程學術(shù)論文集(第2卷)[C];2005年
4 桑延超;彭志紅;李謙;;PSO-GA協(xié)同優(yōu)化算法及其在蛋白質(zhì)結(jié)構(gòu)預測中的應(yīng)用[A];2007年中國智能自動化會議論文集[C];2007年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 郭雨珍;蛋白質(zhì)結(jié)構(gòu)預測和比較的優(yōu)化研究[D];大連理工大學;2007年
2 羅亮;蛋白質(zhì)結(jié)構(gòu)預測模型研究[D];華中科技大學;2010年
3 靳利霞;蛋白質(zhì)結(jié)構(gòu)預測方法研究[D];大連理工大學;2002年
4 呂志鵬;蛋白質(zhì)結(jié)構(gòu)預測的現(xiàn)實求解方法[D];華中科技大學;2007年
5 孫鵬飛;基于計算智能技術(shù)的蛋白質(zhì)結(jié)構(gòu)預測方法研究[D];哈爾濱工程大學;2010年
6 谷俊峰;蛋白質(zhì)結(jié)構(gòu)預測中幾個關(guān)鍵問題的研究[D];大連理工大學;2009年
7 王明會;基于統(tǒng)計建模方法的蛋白質(zhì)結(jié)構(gòu)預測研究[D];中國科學技術(shù)大學;2006年
8 唐鶴云;基于多肽片段中央氨基酸裝配的蛋白質(zhì)結(jié)構(gòu)預測[D];中國協(xié)和醫(yī)科大學;2007年
9 劉景發(fā);求解蛋白質(zhì)結(jié)構(gòu)預測問題及矩形packing問題的啟發(fā)式算法[D];華中科技大學;2007年
10 何潔月;面向蛋白質(zhì)結(jié)構(gòu)預測的計算生物學技術(shù)研究[D];東南大學;2006年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 李延章;基于改進蜂群算法的三維蛋白質(zhì)結(jié)構(gòu)預測研究[D];大連大學;2015年
2 蔡菁;蛋白質(zhì)結(jié)構(gòu)預測的閾值接收算法研究[D];福建農(nóng)林大學;2015年
3 李婀娜;蛋白質(zhì)結(jié)構(gòu)預測的噪聲算法研究[D];福建農(nóng)林大學;2016年
4 戴振鵬;蛋白質(zhì)結(jié)構(gòu)預測的混合智能優(yōu)化算法及并行化[D];福建農(nóng)林大學;2016年
5 羅升;基于深度學習的采樣技術(shù)在蛋白質(zhì)結(jié)構(gòu)預測中運用[D];蘇州大學;2016年
6 劉宏偉;無序蛋白質(zhì)結(jié)構(gòu)預測方法研究[D];蘇州大學;2013年
7 秦傳慶;蛋白質(zhì)結(jié)構(gòu)預測軟件設(shè)計與開發(fā)[D];浙江工業(yè)大學;2014年
8 吳進珍;并行蟻群優(yōu)化在蛋白質(zhì)結(jié)構(gòu)預測中的應(yīng)用研究[D];蘇州大學;2010年
9 岳曉輝;基于禁忌搜索算法的蛋白質(zhì)結(jié)構(gòu)預測的研究[D];大連理工大學;2006年
10 杜慶良;蛋白質(zhì)結(jié)構(gòu)預測的并行模擬退火算法研究[D];福建農(nóng)林大學;2013年
本文關(guān)鍵詞:基于深度學習的采樣技術(shù)在蛋白質(zhì)結(jié)構(gòu)預測中運用,,由筆耕文化傳播整理發(fā)布。
本文編號:478121
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/478121.html