天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于集成學習的化合物肝毒性分類預測系統(tǒng)的設計與實現(xiàn)

發(fā)布時間:2020-11-03 09:53
   在藥物的研發(fā)過程中,通常要考慮藥物的吸收、分布、代謝、排泄和毒性五個特征,其中毒性主要包括致癌性、致畸性、致突變性和肝毒性等重要特性。肝臟作為人體的重要器官,對有害物質特別敏感,在新陳代謝中起著關鍵作用。同時,藥物誘導的肝損傷則是藥物研發(fā)失敗和被市場撤回的主要原因之一。因此,對化合物肝毒性的研究有著十分深刻的意義。研究肝毒性的傳統(tǒng)方法包括體內和體外方法,但這些方法通常伴隨著過程復雜、耗時長、成本高昂并且成功率低的缺點。隨著傳統(tǒng)方法弊端愈發(fā)顯著和計算機技術的飛速發(fā)展,越來越多的毒理學研究者開始利用計算機模擬方法對肝毒性進行評估。通過計算機對肝毒性進行評估,即在一定量的數據集的基礎上利用機器學習的方法對化合物的分子結構進行建模評估,具有快速、經濟和易于實現(xiàn)的特點,被認為是肝毒性篩查的重要替代技術。本系統(tǒng)建模過程主要依托R語言進行計算,以從各文獻和各藥物組織搜集的大量化合物及其肝毒性作為數據支撐,將支持向量機(SVM)、隨機森林(RF)和極限梯度提升(XGB)三種機器學習算法為基算法,對化合物的12種分子指紋分別建模共形成36個基模型,而后通過對這36個模型進行混合集成選出表現(xiàn)最佳的模型。最后得到的表現(xiàn)最好的模型的五折交叉驗證結果的準確率為71.1±2.6%,AUC值為76.4±2.6%,在外部測試集中準確率為84.3%,AUC值為90.4%,達到肝毒性測試領域很高的水平。本系統(tǒng)的搭建在Linux操作系統(tǒng)下進行,前端由Html+Css+JavaScript建立,后臺使用Apache+PHP+MYSQL環(huán)境,利用集成的最佳模型對輸入化合物的肝毒性進行預測,并實現(xiàn)了注冊登錄模塊、數據準備模塊、分類預測模塊、結果分析模塊和系統(tǒng)管理模塊。不僅能將分析結果清晰地展示在系統(tǒng)中,并能為用戶包括提供結果查詢、結果下載和用戶管理等功能,極大地方便了肝毒性研究者。無論在功能方面還是在性能方面均達到預期的水平。
【學位單位】:遼寧大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP311.52
【部分圖文】:

過程圖,藥物開發(fā),過程圖


毒性)五個特征,其目的在于指導化合物在藥物臨床研究中的利用并降低藥物的副作用[1-2]。而在這五個特性中的毒性作用往往會對患者造成極大的身體傷害,嚴重時甚至造成一定的社會恐慌,它主要包括致癌性、致畸性、致突變性和肝毒性等。而肝臟作為人體的一個關鍵器官,對有害化學物質非常敏感,因此在外源物質的代謝中起重要作用。與此同時,藥物誘導的肝損傷(Drug-induced liveinjury, DILI)也是藥物開發(fā)失敗和從市場被撤回的主要原因之一,并造成相當的經濟損失。近年來,致力于毒理學研究的從業(yè)者對于化合物毒性的評估愈發(fā)關注在過去幾十年中,已經開發(fā)了多種方法來評估 DILI 風險,其中包括體內研究和體外研究的傳統(tǒng)實驗方法。然而,這些傳統(tǒng)的實驗方法在具體的實現(xiàn)過程中非常昂貴并且耗時,此外實驗結果與臨床觀察之間的相關性也不高,發(fā)現(xiàn)具有相當穩(wěn)定性和良好活性的化合物幾率不大,甚至由于部分實驗數據需取自人體相關實驗,涉及到道德問題,極大地限制了毒性的大規(guī)模檢測,只能針對很少一部分的化合物進行檢測,有很大的局限性。一般的,據有關部門統(tǒng)計,一個藥物從研發(fā)到上市平均需要 13 年,花費約 18 億美元,其過程中浪費了大量的時間和精力。藥物開發(fā)過程如圖 1-1 所示。

過程圖,模型應用,過程,生物活性


程中計算更加高效,本研究使用了 R 語言。在系統(tǒng)的搭建過程中,采用了軟件工程的思想,按照軟件開發(fā)周期的流程進行系統(tǒng)設計和開發(fā),本系統(tǒng)基于 Linux 系統(tǒng)和 Apache 服務器,前端使用Html+Css+JavaScript 常用組合,并采用了 Bootstrap 前端框架使得頁面更加友好簡潔,后臺使用 PHP 語言進行開發(fā),結合 MySQL 數據庫對數據進行存儲,使得系統(tǒng)盡可能完整完善。2.1 定量構效關系(QSAR)定量構效關系是使用數學或者計算機模型來描述化合物的分子結構與生物活性之間的關系[9]。其基于的原理是化合物的分子結構包含了決定其生物、化學和物理等方面的性質信息,而這些與化合物的生物活性緊密相關,結構相似的化合物往往在生物活性上體現(xiàn)出相似性。QSAR 模型將一組預測變量(X)和相應變量(Y)的值相關聯(lián),在建模過程中,預測變量可以是化合物的分子描述符(moleculardescriptors)、分子指紋(molecularfingerprints)或者其他理化性質,而響應變量則指化學物質對某一靶點的生物活性情況。QSAR 的過程如圖 2-1。

相關過程,線性,超平面


圖 2-2 線性 SVM 相關過程過使用一個核函數,將輸入數據的特征映間中構造一個超平面或一組超平面,以分離征向量x,使用f(x) = sign(∑ αin0i=1yiK(x,xi最大化拉格朗日表達式∑ ai12ni=1∑ ∑ nj=ni=1= 0的條件下確定。f(x)結果的正負反映了函數來將特征映射到高維[14]。此外,SVM參數 C 和核寬度參數 gamma 通常通過隨機F)統(tǒng)計學習理論,利用了集成的思想,使用
【參考文獻】

相關期刊論文 前10條

1 羅丹;羅海勇;;基于隨機森林的跌倒檢測算法[J];計算機應用;2015年11期

2 李金亮;李春青;;基于BootStrap的WEB開發(fā)設計研究[J];中小企業(yè)管理與科技(中旬刊);2014年05期

3 張哲;張豪;;淺談R語言在生物統(tǒng)計學教學中的應用[J];教育教學論壇;2013年27期

4 王云;;Web網站功能及性能測試探析[J];電子設計工程;2012年20期

5 孫星;;淺談PHP技術[J];中國新技術新產品;2011年10期

6 張宏升;;軟件架構的非功能性需求指標和區(qū)域化支持[J];電腦知識與技術;2011年09期

7 方匡南;吳見彬;朱建平;謝邦昌;;隨機森林方法研究綜述[J];統(tǒng)計與信息論壇;2011年03期

8 王凱;閻愛俠;;基于因特網的常用化合物活性數據庫簡介[J];計算機與應用化學;2010年12期

9 廖明陽;吳純啟;;藥物毒理學研究的發(fā)展現(xiàn)狀與趨勢[J];毒理學雜志;2007年05期

10 侯金彪;胡凱;王文博;;PHP中session變量的應用研究[J];科技信息(學術研究);2007年27期


相關博士學位論文 前2條

1 黃劍平;藥物毒性預測方法研究[D];浙江大學;2014年

2 李加忠;QSAR研究中提高模型預測能力的新方法探討及其在藥物化學中的應用[D];蘭州大學;2009年


相關碩士學位論文 前4條

1 方超;基于Web的動漫素材共享平臺的設計與實現(xiàn)[D];廈門大學;2014年

2 黃浪;企業(yè)級的B/S模式應用軟件非功能性需求分析與研究[D];廈門大學;2008年

3 張立坤;科技文檔中化學結構的描述與搜索[D];華中科技大學;2007年

4 孫濤;UI的設計與測試[D];天津大學;2006年



本文編號:2868426

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2868426.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶e3411***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com