基于深度學習對化合物與蛋白質相互作用分類的研究
發(fā)布時間:2020-08-04 16:17
【摘要】:化合物和蛋白質相互作用的識別在網(wǎng)絡藥理學和藥物發(fā)現(xiàn)中有著非常重要的作用,但是傳統(tǒng)的生化實驗方法既耗時又昂貴。隨著計算機軟件技術的迅猛發(fā)展,利用計算機軟件模擬生化實驗的方法成為可能,這種方法比傳統(tǒng)的生化實驗方法速度更快并且也更加便宜,因此計算方法開始流行起來。然而,計算方法要求研究者有濃厚的化學方面的背景知識并且準確率并不高,例如分子對接技術,一種研究化合物和蛋白質間結合模式和親和力的理論模擬方法,就需要對化合物和蛋白質的結構有深刻的認識。近年來,機器學習技術在日常生活中的應用越來越廣泛,如人臉識別、機器翻譯、無人駕駛。這些應用中都使用了一種被稱為深度學習的技術。由于深度學習可以自動提取特征,不需要研究者有相關的背景知識,入門門檻低,并且其學習能力強大,在許多任務上都取得了比傳統(tǒng)機器學習技術更高的準確率,因此深度學習已經在計算機視覺、語音識別和自然語言處理方面取得了巨大的成功。同時,深度學習在醫(yī)學、化學和生物學中的應用也逐漸發(fā)展起來。本文以BindingDB中化合物與蛋白質相互作用的數(shù)據(jù)作為依據(jù),并使用SDF(Structure Data File)和蛋白質序列表示化合物和蛋白質的結構。然后利用隨機生成算法生成與正樣本數(shù)量相同的負樣本,并使用深度學習中的深度神經網(wǎng)絡學習訓練數(shù)據(jù)。深度神經網(wǎng)絡的輸入為化合物和蛋白質的結構數(shù)據(jù),輸出為化合物與蛋白質相互作用為綁定的概率。經過大量的實驗調整超參數(shù),最終的深度神經網(wǎng)絡的結構為多路網(wǎng)絡。多路網(wǎng)絡分為特征提取網(wǎng)絡和分類網(wǎng)絡。其中特征提取網(wǎng)絡分別提取化合物和蛋白質的特征,其隱藏層有3層,每層2000個神經元;分類網(wǎng)絡基于特征提取網(wǎng)絡提取到的特征對化合物和蛋白質的相互作用進行分類,其隱藏層為1層,有1000個神經元。多路網(wǎng)絡的參數(shù)數(shù)量達到了2720萬,最終可以達到96.73%的測試準確率。本文將深度學習技術引入化合物與蛋白質相互作用分類的研究中。雖然本文所做工作并不能直接應用于實際中,但是對今后深度學習在化合物與蛋白質相互作用分類研究中的應用起到了啟示性的作用。
【學位授予單位】:蘭州大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:R91;TP181
【圖文】:
大大降低了機器學習的門檻,為如今機器學習的熱潮奠定了基礎。深度學習是表示學習算法的一種,可以通過多個非線性模塊的疊加得到原始數(shù)據(jù)的多層次的抽象特征。圖2-1展示了深度學習、表示學習和機器學習的關系。2.2.3 深度學習的歷史神經網(wǎng)絡已經經歷了幾十年的發(fā)展,其中不乏高潮與低谷,最近才因為“深度學習”這個新名稱重新被人們認識。神經網(wǎng)絡的初衷是模擬生物大腦,但是由于對生物大腦的理解還遠遠不夠,所以那時神經網(wǎng)絡還十分簡單,只是在簡單的線性模型上增加了些功能。神經網(wǎng)絡的第一次興起主要是因為生物學習理論的發(fā)展[28-29]以及感知機[30]的出現(xiàn)。感知機是那時最為著名的模型,感知機通過在線性模型之上增加一個符號函數(shù)將其變?yōu)榉诸惸P,通常線性模型的輸出大于 0 則將其預測為正類,小于0 則將其預測為負類,等于 0 則隨機選擇一個類別。感知機算法影響了許多后來的機器學習算法
生物神經元與人造神經元結構示意圖
人工神經網(wǎng)絡學習流程圖
【學位授予單位】:蘭州大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:R91;TP181
【圖文】:
大大降低了機器學習的門檻,為如今機器學習的熱潮奠定了基礎。深度學習是表示學習算法的一種,可以通過多個非線性模塊的疊加得到原始數(shù)據(jù)的多層次的抽象特征。圖2-1展示了深度學習、表示學習和機器學習的關系。2.2.3 深度學習的歷史神經網(wǎng)絡已經經歷了幾十年的發(fā)展,其中不乏高潮與低谷,最近才因為“深度學習”這個新名稱重新被人們認識。神經網(wǎng)絡的初衷是模擬生物大腦,但是由于對生物大腦的理解還遠遠不夠,所以那時神經網(wǎng)絡還十分簡單,只是在簡單的線性模型上增加了些功能。神經網(wǎng)絡的第一次興起主要是因為生物學習理論的發(fā)展[28-29]以及感知機[30]的出現(xiàn)。感知機是那時最為著名的模型,感知機通過在線性模型之上增加一個符號函數(shù)將其變?yōu)榉诸惸P,通常線性模型的輸出大于 0 則將其預測為正類,小于0 則將其預測為負類,等于 0 則隨機選擇一個類別。感知機算法影響了許多后來的機器學習算法
生物神經元與人造神經元結構示意圖
人工神經網(wǎng)絡學習流程圖
【相似文獻】
相關期刊論文 前10條
1 王建;;蛋白質相互作用數(shù)據(jù)庫[J];中國生物化學與分子生物學報;2017年08期
2 陳心浩;胡儉;;基于多特征融合預測蛋白質相互作用界面[J];中南民族大學學報(自然科學版);2017年03期
3 譚從娥;黃祥云;;基于蛋白質相互作用網(wǎng)絡分析右歸丸治療腎陽虛證的療效機制[J];中國中醫(yī)藥信息雜志;2016年02期
4 楊曉敏;李英倫;;基于蛋白質相互作用“熱點”區(qū)域的小分子藥物設計研究進展[J];生物物理學報;2015年02期
5 馮舒s
本文編號:2780788
本文鏈接:http://www.sikaile.net/yixuelunwen/yiyaoxuelunwen/2780788.html
最近更新
教材專著