天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多源數(shù)據(jù)的計算藥物重定位技術(shù)研究與實現(xiàn)

發(fā)布時間:2020-06-05 21:29
【摘要】:計算藥物重定位旨在利用計算方法為已有藥物尋找新的用途。與傳統(tǒng)創(chuàng)新藥物的設(shè)計研究相比,計算藥物重定位有著投入低和周期短的特點。此外,已經(jīng)批準(zhǔn)上市的藥物經(jīng)過嚴(yán)格的臨床實驗,其毒副作用通過了嚴(yán)格的評估,安全性有保證。因而根據(jù)這些藥物新用途制備的藥物更容易通過監(jiān)管部門的審核。計算藥物重定位對于新藥的研發(fā)有著重要的意義。研究人員針對計算藥物重定位問題提出了多種模型。但這些模型在兩個方面有待改進:一方面是模型采用的數(shù)據(jù)不夠充分,沒有借助生物信息領(lǐng)域豐富的數(shù)據(jù)信息;另一方面是采用的模型在學(xué)習(xí)能力上存在不足,無法從數(shù)據(jù)中學(xué)習(xí)到更高層次的藥物-疾病關(guān)系。因而本文針對這兩個方面的問題,對計算藥物重定位進行了如下研究工作:(1)多源數(shù)據(jù)的利用。為了使得學(xué)習(xí)到的藥物-疾病關(guān)系更加可靠,本文不僅考慮已有的藥物和疾病間的治療關(guān)系,還考慮到藥物、疾病、基因的自身屬性信息,采用多種數(shù)據(jù)信息,豐富藥物-疾病關(guān)系。(2)基于異質(zhì)網(wǎng)絡(luò)多源游走的藥物重定位模型。本文采用多源數(shù)據(jù)信息,利用圖模型對藥物、疾病和基因關(guān)系進行建模,提出了異質(zhì)網(wǎng)絡(luò)多源隨機游走模型(Multi-Random Walk on Heterogeneous network,HMRW)。HMRW模型首先構(gòu)造一個包含藥物、疾病和基因三種不同類型節(jié)點的三層異質(zhì)網(wǎng)絡(luò),并利用分別從藥物節(jié)點和疾病節(jié)點出發(fā)的隨機游走,計算藥物和疾病節(jié)點間的關(guān)聯(lián)程度。實驗結(jié)果表明,與未引入基因信息的模型相比,HMRW有更好的模型表現(xiàn)。(3)基于混合泛化矩陣分解的藥物重定位模型。本文受推薦系統(tǒng)啟發(fā),嘗試?yán)脜f(xié)同過濾技術(shù)解決重定位問題。在泛化矩陣分解模型的基礎(chǔ)上,本文提出了混合泛化矩陣分解模型(Hybrid Generalized Matrix Factorization,HGMF)。HGMF模型從藥物和疾病兩個方面添加側(cè)面信息,利用自動編碼器對藥物和疾病屬性進行特征提取,將提取的藥物和疾病特征作為藥物隱向量和疾病隱向量參與協(xié)同過濾。實驗結(jié)果表明,HGMF模型的預(yù)測效果優(yōu)于僅依賴藥物-疾病關(guān)系的泛化矩陣分解模型,也優(yōu)于上述的異質(zhì)網(wǎng)絡(luò)多源隨機游走模型。
【圖文】:

權(quán)重矩陣,隱藏層,激活函數(shù),維度


圖 2-1 自動編碼器基本 構(gòu) ,其中包含 m 個訓(xùn)練樣編碼器中間隱藏層維度為 K。首本進行編碼,W N×K。圖 2- ( ) = ( ) 示非線性激活函數(shù)。類似的,自對編碼的數(shù)據(jù)進行解碼: ( ) = ( ( ) ) 的算法對網(wǎng)絡(luò)的權(quán)重矩陣進行更 ( )

示意圖,示意圖,藥物,子結(jié)構(gòu)


圖 3-1 三 異質(zhì)網(wǎng)絡(luò)示意圖構(gòu)造藥物間相似度網(wǎng)絡(luò)物的屬性信息包括藥物的化學(xué)結(jié)構(gòu)信息、副作用信息、靶標(biāo)的序列信息等等物的結(jié)構(gòu)信息作為描述藥物特征的屬性。在 DrugBank 數(shù)據(jù)庫中,藥物的結(jié)化分子線性輸入規(guī)范(simplified molecular input line entry specification,SM存儲為 ASCII 字符串。CDK(chemical development kit)[47]提供將藥物的 S列轉(zhuǎn)化為化學(xué)子結(jié)構(gòu)向量的函數(shù)。對于藥物的SMILES序列,,先使用CDK得藥物子結(jié)構(gòu)向量。如果藥物包含某一子結(jié)構(gòu),則對應(yīng)向量位置值為 1,否則為藥物的子結(jié)構(gòu)向量 和 ,可以利用 Tanimoto score 計算兩個藥物子結(jié)構(gòu)向 ( ) = ( ) ( ) 表示序列的第 k 個元素, 和 分別表示向量元素的與、或操作。往的藥物重定位工作發(fā)現(xiàn),相似度低的關(guān)系對于藥物-疾病關(guān)系預(yù)測的貢獻
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:R91;TP301.6

【參考文獻】

相關(guān)期刊論文 前2條

1 黃宏斌;梁芳;熊煒;李小玲;曾朝陽;李桂源;;生物信息技術(shù)加速開發(fā)舊藥新用途[J];生物化學(xué)與生物物理進展;2012年01期

2 郭宗儒;;藥物的雜泛性[J];藥學(xué)學(xué)報;2011年04期



本文編號:2698641

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/yiyaoxuelunwen/2698641.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b7287***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com