天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于數(shù)據(jù)挖掘的基因和疾病的關(guān)系研究

發(fā)布時間:2022-12-11 04:16
  利用先進的數(shù)據(jù)挖掘方法分析研究基因和疾病之間的關(guān)系有助于發(fā)現(xiàn)疾病的發(fā)生機制,從而為疾病的診斷和個性化治療提供科學依據(jù)。但是,基因相關(guān)信息的數(shù)據(jù)通常具有高維小樣本、高噪聲、高冗余的特點,這使得很多優(yōu)秀的數(shù)據(jù)挖掘和機器學習方法在處理分析基因與疾病相關(guān)數(shù)據(jù)時效果較差。因此,需要針對具體基因和疾病的相關(guān)數(shù)據(jù)的特點,設(shè)計合適的算法模型來進行數(shù)據(jù)分析。在本論文中,針對不同基因與疾病相關(guān)數(shù)據(jù)的特點,從基因功能預測,特征基因選擇和miRNA和疾病的關(guān)系三個方面對基因與疾病的關(guān)系進行了分析研究。提出了一系列相應的數(shù)據(jù)挖掘方法對其進行處理。本文的主要研究內(nèi)容和創(chuàng)新點如下:1)基因功能預測問題事實上是一個多示例多標簽問題,在本文中使用機器學習的方法對基于多示例多標簽對象進行探討,旨在對未知的基因功能進行注釋。本文將層次聚類與多標簽學習框架相結(jié)合,并提出一個基于基因本體層次結(jié)構(gòu)的多標簽層次聚類算法框架。本文將多示例多標簽的問題轉(zhuǎn)化為相對簡單的單示例多標簽問題。這個算法依據(jù)的是基因表達之間的相關(guān)性,并依據(jù)基因之間的功能類的最大化相關(guān)性對相應的聚類方法進行補充,并構(gòu)建有相似基因功能的基因為多示例數(shù)據(jù)集。最后,對提... 

【文章頁數(shù)】:120 頁

【學位級別】:博士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景與意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 基因功能預測研究現(xiàn)狀
        1.2.2 特征基因選擇研究現(xiàn)狀
        1.2.3 miRNA與疾病的關(guān)系研究現(xiàn)狀
    1.3 本文研究目的及主要工作
    1.4 論文的組織結(jié)構(gòu)
第2章 相關(guān)工作
    2.1 基因功能注釋數(shù)據(jù)庫介紹
        2.1.1 KEGG數(shù)據(jù)庫
        2.1.2 GO數(shù)據(jù)庫
    2.2 基因表達譜數(shù)據(jù)
        2.2.1 基因表達譜的獲取及數(shù)據(jù)表示
        2.2.2 基因表達譜相關(guān)數(shù)據(jù)特點
        2.2.3 常用基因表達譜相關(guān)數(shù)據(jù)庫
    2.3 miRNAs與疾病相關(guān)數(shù)據(jù)
    2.4 特征選擇方法
        2.4.1 包裝方法
        2.4.2 過濾方法
        2.4.3 嵌入式方法
        2.4.4 集成方法
        2.4.5 混合方法
        2.4.6 特征選擇方法之間的比較
    2.5 矩陣完成方法
    2.6 小結(jié)
第3章 基于本體層次結(jié)構(gòu)的基因功能預測
    3.1 引言
        3.1.1 基因功能預測任務
    3.2 多示例多標簽學習
        3.2.1 MLL算法
    3.3 基于本體層次的多示例方法
        3.3.1 基因本體論層次結(jié)構(gòu)
        3.3.2 GOMIHC算法
    3.4實驗
        3.4.1 數(shù)據(jù)集
        3.4.2 性能評價指標
    3.5 實驗結(jié)果和分析
        3.5.1 實驗設(shè)計
        3.5.2 實驗結(jié)果
        3.5.3 實驗結(jié)果分析
    3.6 小結(jié)
第4章 基于最大局部判別邊緣的半監(jiān)督的基因選擇
    4.1 引言
    4.2 特征選擇的半監(jiān)督最大判別信息
        4.2.1 SMLM
        4.2.2 SMLM的算法流程
    4.3 實驗及結(jié)果分析
        4.3.1 實驗數(shù)據(jù)
        4.3.2 對比算法介紹
        4.3.3 參數(shù)設(shè)置及評價指標
        4.3.4 實驗結(jié)果與分析
    4.4 小結(jié)
第5章 基于誘導矩陣完成預測MIRNA-疾病關(guān)聯(lián)
    5.1 引言
    5.2 數(shù)據(jù)預處理
    5.3 相似性度量方法
        5.3.1 疾病語義相似性
        5.3.2 計算miRNA功能相似性
        5.3.3 計算疾病和miRNA的高斯核相似性
        5.3.4 整合疾病和miRNA的相似性
    5.4 基于誘導矩陣完成預測miRNA-疾病關(guān)聯(lián)
        5.4.1 方法概述
        5.4.2 構(gòu)建miRNA疾病雙層網(wǎng)絡
        5.4.3 誘導矩陣完成算法
    5.5 結(jié)果與討論
        5.5.1 性能評估指標
        5.5.2 結(jié)果分析
        5.5.3 對新疾病的性能研究
        5.5.4 評估不同數(shù)據(jù)源的貢獻
        5.5.5 案例研究
    5.6 小結(jié)
結(jié)論
參考文獻
致謝
附錄A 攻讀學位期間所發(fā)表的學術(shù)論文
附錄B 攻讀博士學位期間主要參與的課題


【參考文獻】:
期刊論文
[1]機器學習方法在基因功能注釋中的應用[J]. 李金城,廖奇,沈其君.  中國生物化學與分子生物學報. 2016(05)
[2]基因表達譜數(shù)據(jù)分析技術(shù)[J]. 劉玲.  電腦與信息技術(shù). 2010(06)
[3]基因 在疾病中扮演的角色[J]. 孫衛(wèi)華.  醫(yī)藥保健雜志. 2009(20)
[4]無監(jiān)督環(huán)境下基于聚類集成的特征選擇[J]. 羅毅輝,熊曙初,王四春,范強.  微計算機信息. 2008(09)
[5]基因功能注釋——后基因組時代面臨的挑戰(zhàn)[J]. 王行國.  世界科技研究與發(fā)展. 2007(01)
[6]基因功能注釋的計算方法[J]. 朱新宇.  生物技術(shù). 2003(06)

博士論文
[1]疾病相關(guān)的miRNAs與lncRNAs預測方法研究[D]. 谷長龍.湖南大學 2017

碩士論文
[1]基于半監(jiān)督和無監(jiān)督學習的特征選擇算法研究[D]. 鄭欣.西北大學 2017
[2]半監(jiān)督特征選擇和特征選擇的穩(wěn)定性研究[D]. 陳東.上海交通大學 2013
[3]基于改進K-means聚類的系統(tǒng)發(fā)育譜方法在基因功能注釋中的應用[D]. 孫平平.東北師范大學 2008



本文編號:3718123

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3718123.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a50d1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com