基于全卷積神經(jīng)網(wǎng)絡的蛋白質(zhì)與RNA結(jié)合位點圖預測
發(fā)布時間:2021-02-10 08:45
蛋白質(zhì)與RNA的相互作用在各種生物過程中都起到了至關(guān)重要的作用;蛘{(diào)控、RNA剪切、RNA降解等生命調(diào)控過程均與蛋白質(zhì)與RNA的結(jié)合位點有關(guān)。因此分析蛋白質(zhì)與RNA的結(jié)合位點可以深入理解蛋白質(zhì)與RNA的作用機制,對理解這些生物過程有非常重要的意義。目前已經(jīng)有很多生物實驗的方法對結(jié)合位點進行測量,如X射線晶體衍射、核磁共振、CLIP-seq等。上述生物實驗的方法均能夠準確的獲取蛋白質(zhì)與RNA的結(jié)合位點,但是非常耗費人力、物力、財力。隨著蛋白質(zhì)與RNA復合物三維空間數(shù)據(jù)的增多,研究人員開始通過計算的方法對結(jié)合位點進行預測與分析,通常使用蛋白質(zhì)與RNA復合物的三維結(jié)構(gòu)數(shù)據(jù)對序列上的結(jié)合位點進行預測。目前存在的大部分方法都是基于序列中的氨基酸與核酸對進行分析,忽略了序列整體對結(jié)合位點的影響。同時這些方法所使用的數(shù)據(jù)集都很小,得到的預測結(jié)果可能會存在偏向性。針對上述問題,本文進行了如下的工作:(1)重新收集了實驗數(shù)據(jù),從PDB數(shù)據(jù)庫中收集蛋白質(zhì)與RNA復合物數(shù)據(jù)共計1130條。(2)使用了蛋白質(zhì)共進化信息PSSM矩陣(Position-Specific Scoring Matrix)以及RNA...
【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
FCN模型示意圖
第2章相關(guān)知識介紹8化層、上采樣層以及跳躍結(jié)構(gòu)進行介紹。卷積層全卷積神經(jīng)網(wǎng)絡中的卷積層由若干卷積核構(gòu)成,每個卷積核的參數(shù)由網(wǎng)絡的反向傳播計算得來。對于輸入數(shù)據(jù),卷積核從左至右、從上至下的移動,將卷積核覆蓋的每一個位點與卷積核相乘并求和,最終得到該層的輸出,卷積的過程如圖2.2所示。圖2.2卷積示意圖卷積層能夠提取輸入數(shù)據(jù)的特征,在全卷積神經(jīng)網(wǎng)絡中,隨著層數(shù)的深入,感受野的增大,更能提取出輸入數(shù)據(jù)的深層特征。池化層池化層(pooling)又被稱作下采樣層。由于圖片數(shù)據(jù)中相鄰的像素點有相關(guān)關(guān)系,導致卷積層提取出的特征中包含重復的數(shù)據(jù),全卷積神經(jīng)網(wǎng)絡中使用池化層去掉多余的特征,可以增大感受野,進一步減少參數(shù),防止網(wǎng)絡過擬合。池化方法主要有三種:最大池化(maxpooling)、均值池化(meanpooling)、隨機池化(stochasticpooling),其中最大池化使用了局部接域的最大值作為該接受域的輸出結(jié)果,平均池化使用了局部接域的平均值作為該接受域的輸出結(jié)果,隨機池化通過概率矩陣計算局部接受域的輸出結(jié)果,圖2.3展示了三種池化方法。
第2章相關(guān)知識介紹9圖2.3三種池化方式上采樣層全卷積神經(jīng)網(wǎng)絡中的上采樣層是卷積的逆過程,用來放大池化之后的特征圖。全卷積神經(jīng)網(wǎng)絡中上采樣層使用的方法是雙線性插值法,下面將對該方法進行簡要介紹。圖2.4雙線性插值如圖2.4所示,已知函數(shù)在11=(1,1)、12=(1,2)、21=(2,1)、22=(2,2)的值,若想獲得函數(shù)在點=(,)的值,則需要進行雙線性插值:(,1)≈221(11)+121(21)-------------------(2.1)(,2)≈221(12)+121(22)-------------------(2.2)(,)≈2y21(,1)+121(,2)------------------(2.3)在全卷積神經(jīng)網(wǎng)絡中,可以利用相鄰的四個點,完成上采樣過程。
【參考文獻】:
期刊論文
[1]蛋白質(zhì)溶液結(jié)構(gòu)及動力學的核磁共振研究[J]. 胡蘊菲,金長文. 波譜學雜志. 2009(02)
本文編號:3027106
【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【部分圖文】:
FCN模型示意圖
第2章相關(guān)知識介紹8化層、上采樣層以及跳躍結(jié)構(gòu)進行介紹。卷積層全卷積神經(jīng)網(wǎng)絡中的卷積層由若干卷積核構(gòu)成,每個卷積核的參數(shù)由網(wǎng)絡的反向傳播計算得來。對于輸入數(shù)據(jù),卷積核從左至右、從上至下的移動,將卷積核覆蓋的每一個位點與卷積核相乘并求和,最終得到該層的輸出,卷積的過程如圖2.2所示。圖2.2卷積示意圖卷積層能夠提取輸入數(shù)據(jù)的特征,在全卷積神經(jīng)網(wǎng)絡中,隨著層數(shù)的深入,感受野的增大,更能提取出輸入數(shù)據(jù)的深層特征。池化層池化層(pooling)又被稱作下采樣層。由于圖片數(shù)據(jù)中相鄰的像素點有相關(guān)關(guān)系,導致卷積層提取出的特征中包含重復的數(shù)據(jù),全卷積神經(jīng)網(wǎng)絡中使用池化層去掉多余的特征,可以增大感受野,進一步減少參數(shù),防止網(wǎng)絡過擬合。池化方法主要有三種:最大池化(maxpooling)、均值池化(meanpooling)、隨機池化(stochasticpooling),其中最大池化使用了局部接域的最大值作為該接受域的輸出結(jié)果,平均池化使用了局部接域的平均值作為該接受域的輸出結(jié)果,隨機池化通過概率矩陣計算局部接受域的輸出結(jié)果,圖2.3展示了三種池化方法。
第2章相關(guān)知識介紹9圖2.3三種池化方式上采樣層全卷積神經(jīng)網(wǎng)絡中的上采樣層是卷積的逆過程,用來放大池化之后的特征圖。全卷積神經(jīng)網(wǎng)絡中上采樣層使用的方法是雙線性插值法,下面將對該方法進行簡要介紹。圖2.4雙線性插值如圖2.4所示,已知函數(shù)在11=(1,1)、12=(1,2)、21=(2,1)、22=(2,2)的值,若想獲得函數(shù)在點=(,)的值,則需要進行雙線性插值:(,1)≈221(11)+121(21)-------------------(2.1)(,2)≈221(12)+121(22)-------------------(2.2)(,)≈2y21(,1)+121(,2)------------------(2.3)在全卷積神經(jīng)網(wǎng)絡中,可以利用相鄰的四個點,完成上采樣過程。
【參考文獻】:
期刊論文
[1]蛋白質(zhì)溶液結(jié)構(gòu)及動力學的核磁共振研究[J]. 胡蘊菲,金長文. 波譜學雜志. 2009(02)
本文編號:3027106
本文鏈接:http://www.sikaile.net/shoufeilunwen/benkebiyelunwen/3027106.html
最近更新
教材專著