天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的跨物種M6A修飾位點(diǎn)預(yù)測(cè)研究

發(fā)布時(shí)間:2020-09-05 11:41
   RNA轉(zhuǎn)錄后修飾是對(duì)轉(zhuǎn)錄后的RNA進(jìn)行加工的過(guò)程,在許多生命過(guò)程中發(fā)揮著重要作用。目前鑒定到的已有150余種轉(zhuǎn)錄后修飾,其中N6-甲基腺苷(N6-methyladenosine,m~6A)是RNA轉(zhuǎn)錄后修飾中最為常見(jiàn)的一類(lèi),其廣泛地存在于哺乳動(dòng)物,釀酒酵母和擬南芥等物種中。M~6A是一種可逆修飾,其調(diào)節(jié)著RNA的定位、轉(zhuǎn)錄、剪接和穩(wěn)定性。此外其與腫瘤、肥胖癥等疾病具有關(guān)聯(lián)。因此,從RNA序列中精準(zhǔn)地鑒定出m~6A修飾位點(diǎn),對(duì)基礎(chǔ)研究和藥物開(kāi)發(fā)有著重大意義,是一項(xiàng)非常有意義的工作。傳統(tǒng)的基于生化實(shí)驗(yàn)來(lái)識(shí)別m~6A修飾位點(diǎn)的方法不僅耗時(shí)長(zhǎng)、成本高,而且規(guī)模較小。近年來(lái),研究人員開(kāi)發(fā)出了多個(gè)基于機(jī)器學(xué)習(xí)的m~6A修飾位點(diǎn)預(yù)測(cè)器,但是其都是面向單一物種且預(yù)測(cè)精度有限。因此,設(shè)計(jì)一種高精度的跨物種m~6A修飾位點(diǎn)預(yù)測(cè)模型,是非常有必要的。本文對(duì)m~6A修飾位點(diǎn)預(yù)測(cè)問(wèn)題進(jìn)行了研究,主要工作如下:(1)對(duì)基于RNA序列的m~6A修飾位點(diǎn)預(yù)測(cè)問(wèn)題進(jìn)行研究,提出一種新型的RNA序列特征提取方法,即改進(jìn)的核苷酸組成成分(Enhanced Nucleic Acid Composition,ENAC)。該方法利用滑動(dòng)窗口的思想,分別計(jì)算滑動(dòng)窗口中每種核苷酸出現(xiàn)的頻率。此方法融合了序列的局部信息和全局信息,能夠更好地表達(dá)修飾位點(diǎn)周?chē)鶵NA序列的特征。基于此特征提取方法,構(gòu)建了隨機(jī)森林預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果表明,與常見(jiàn)的RNA序列特征提取方法相比,該方法能有效提高N6-甲基腺苷位點(diǎn)的預(yù)測(cè)性能。(2)將深度學(xué)習(xí)應(yīng)用于m~6A修飾位點(diǎn)預(yù)測(cè),提出了基于單向門(mén)控循環(huán)單元(Unidirectional GRU-based RNN predictor,UGRU)和雙向門(mén)控循環(huán)單元(Bidirectional Gated Recurrent Unit,BGRU)的m~6A修飾位點(diǎn)預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果表明,BGRU預(yù)測(cè)模型在多物種上具有更好的預(yù)測(cè)結(jié)果。(3)通過(guò)邏輯回歸的方法,融合基于深度學(xué)習(xí)的BGRU預(yù)測(cè)模型和基于ENAC方法的隨機(jī)森林預(yù)測(cè)模型,構(gòu)建了一個(gè)高精度的跨物種m~6A修飾位點(diǎn)預(yù)測(cè)模型,BERMP方法。實(shí)驗(yàn)結(jié)果表明,在多個(gè)物種上,本文提出的BERMP方法在相同獨(dú)立測(cè)試集上的預(yù)測(cè)性能都要優(yōu)于現(xiàn)有的單物種m~6A修飾位點(diǎn)預(yù)測(cè)方法。(4)對(duì)提出的BERMP方法提供了在線(xiàn)的預(yù)測(cè)服務(wù)平臺(tái),以便相關(guān)研究人員免費(fèi)地使用(http://www.bioinfogo.org/bermp/)。
【學(xué)位單位】:青島大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類(lèi)】:Q811.4;TP18
【部分圖文】:

示意圖,支持向量機(jī),示意圖,高維空間


用于分類(lèi)和回歸任務(wù),其關(guān)鍵思想是將低維空間中的線(xiàn)性不可分樣本通過(guò)核函數(shù)映射到高維空間中,使得樣本在高維空間中線(xiàn)性可分,并找到一個(gè)最優(yōu)的超平面將兩類(lèi)樣本分隔開(kāi)。對(duì)于給定訓(xùn)練樣本 ; y ∈ { },如圖2.1所示,超平面H記為g t,如果 t ,則g ,否則g 。圖2.1 支持向量機(jī)示意圖

流程圖,決策樹(shù),流程圖,信息增益


青島大學(xué)碩士學(xué)位論文10圖2.2 決策樹(shù)構(gòu)建流程圖決策樹(shù)的構(gòu)造過(guò)程一般分為3個(gè)部分,分別是特征選擇、決策樹(shù)生成和決策樹(shù)裁剪。特征選擇是從眾多的特征中選擇一個(gè)最優(yōu)特征作為當(dāng)前節(jié)點(diǎn)的分裂標(biāo)準(zhǔn),根據(jù)選擇最優(yōu)特征的不同,構(gòu)建決策樹(shù)的算法又分為ID3,C4.5,CART等方法。以ID3算法為例,其根據(jù)信息增益值選擇最優(yōu)分裂屬性。信息增益定義如下:Gain D a t t 公式 2-(6)Ent D th 公式 2-(7)其中,訓(xùn)練樣本集用D表示

流程圖,森林,流程圖,多層感知機(jī)


青島大學(xué)碩士學(xué)位論文11圖2.3 隨機(jī)森林構(gòu)建流程圖隨機(jī)森林采用了集成算法的思想,是一種高精度的分類(lèi)器。由于兩個(gè)隨機(jī)性的引入,使得隨機(jī)森林不容易陷入過(guò)擬合并具有一定的抗噪能力,能有效地處理有缺失的樣本數(shù)據(jù)。隨機(jī)森林能夠有效地處理高維數(shù)據(jù),并且不用做特征選擇,在訓(xùn)練過(guò)程中,可以檢測(cè)特征之間的互相影響,得到特征的重要性。因其良好的分類(lèi)效果,在生物信息學(xué)領(lǐng)域有著廣泛的應(yīng)用[20, 21]。2.2 常用深度學(xué)習(xí)方法2.2.1 多層感知機(jī)多層感知機(jī)[34]是由感知機(jī)推廣而來(lái),最主要的特點(diǎn)是有多個(gè)神經(jīng)元層,因此也叫深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNN)。第一層稱(chēng)為輸入層,最后一層稱(chēng)為輸出層,中間的層稱(chēng)之為隱含層。多層感知機(jī)中并沒(méi)有規(guī)定隱含層的數(shù)量,同時(shí)對(duì)每層的神經(jīng)元個(gè)數(shù)也沒(méi)有限制。因此可以根據(jù)實(shí)際需求選擇合適的隱層層數(shù)和每層神經(jīng)元個(gè)數(shù)。最簡(jiǎn)單的多層感知機(jī)是三層結(jié)構(gòu)

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉文博;梁盛楠;秦喜文;董小剛;王純杰;;基于迭代隨機(jī)森林算法的糖尿病預(yù)測(cè)[J];長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào);2019年06期

2 賈璐;李輝;陳大雷;;基于改進(jìn)隨機(jī)森林的城市河流水生態(tài)健康評(píng)價(jià)研究[J];海河水利;2019年06期

3 盛曉欣;田翔華;周毅;;基于隨機(jī)森林癲癇患者腦電數(shù)據(jù)的分析研究[J];中國(guó)數(shù)字醫(yī)學(xué);2020年01期

4 秦喜文;郭宇;董小剛;郭佳靜;袁迪;;基于局部均值分解和迭代隨機(jī)森林的腦電分類(lèi)[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2020年01期

5 沈智勇;蘇

本文編號(hào):2812977


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2812977.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)06c00***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com