基于卷積神經(jīng)網(wǎng)絡(luò)的序列特異性預(yù)測(cè)研究
發(fā)布時(shí)間:2017-12-24 16:29
本文關(guān)鍵詞:基于卷積神經(jīng)網(wǎng)絡(luò)的序列特異性預(yù)測(cè)研究 出處:《云南大學(xué)》2016年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 序列特異性 模體識(shí)別 DNA結(jié)合蛋白 卷積神經(jīng)網(wǎng)絡(luò)
【摘要】:基因序列特異性的預(yù)測(cè)無論是在基因分析領(lǐng)域還是基因調(diào)控領(lǐng)域都扮演著重要作色,DNA和RNA結(jié)合蛋白的特異性模式序列對(duì)致病基因的發(fā)現(xiàn)也具有指導(dǎo)性作用。然而隨著分子生物學(xué)的發(fā)展,生物數(shù)據(jù)量呈現(xiàn)爆炸式增長(zhǎng),通過生物實(shí)驗(yàn)和統(tǒng)計(jì)分析來尋找序列特異性的傳統(tǒng)方法已經(jīng)很難從海量數(shù)據(jù)中挖掘出有用數(shù)據(jù),且時(shí)間和人力成本也太高。卷積神經(jīng)網(wǎng)絡(luò)是近幾年新興的一種深度學(xué)習(xí)技術(shù),目前在圖像、語音識(shí)別及自然語言處理領(lǐng)域應(yīng)用較廣,發(fā)展較成熟。這種技術(shù)基于多層感知機(jī)(multi-layer perceptron),多層感知機(jī)是上個(gè)世紀(jì)八十年代由Rumelhart、Williams、Hinton和LeCun等人共同提出的,其目標(biāo)是通過模擬人腦神經(jīng)元的信息處理過程,用神經(jīng)元網(wǎng)絡(luò)來描述現(xiàn)實(shí)世界中的復(fù)雜規(guī)則(一般是函數(shù)形式)。但多層感知機(jī)結(jié)構(gòu)過于簡(jiǎn)單,導(dǎo)致描述事物或者規(guī)則的能力有限。針對(duì)這一問題,人工智能專家們經(jīng)過不懈努力,不斷增加神經(jīng)網(wǎng)絡(luò)的深度,同時(shí)將不同層劃分為不同功能,從而催生出了卷積神經(jīng)網(wǎng)絡(luò)。本文主要關(guān)注點(diǎn)是模體識(shí)別問題中模體的序列特異性,針對(duì)這個(gè)問題,使用卷積神經(jīng)網(wǎng)絡(luò)建立了相應(yīng)的序列預(yù)測(cè)模型。該模型主要涉及幾個(gè)階段:首先將字符串序列轉(zhuǎn)化為數(shù)值編碼矩陣,再用預(yù)測(cè)模式的數(shù)值矩陣對(duì)序列編碼矩陣進(jìn)行卷積運(yùn)算,從而自動(dòng)從序列中提取預(yù)測(cè)模式的特征,卷積輸出的矩陣中每一個(gè)元素需要與給定的閾值相減,只保留結(jié)果大于0的元素傳入下一層;再將經(jīng)過閾值矯正過的輸出矩陣輸入池化(pooling)層,池化層的作用是對(duì)輸入數(shù)據(jù)進(jìn)行壓縮,只保留主要特征;經(jīng)過池化壓縮的矩陣輸入一個(gè)全連接的神經(jīng)網(wǎng)絡(luò)層,這一層通過計(jì)算加權(quán)和得到一個(gè)實(shí)數(shù)輸出分?jǐn)?shù),將該分?jǐn)?shù)與目標(biāo)分?jǐn)?shù)相比較,計(jì)算出誤差,反向傳播給前面各層,通過誤差調(diào)整各層參數(shù),最終擬合得到一個(gè)模型,就是序列特異性預(yù)測(cè)模型。
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:Q811.4;TP183
,
本文編號(hào):1329116
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/1329116.html
最近更新
教材專著