面向癌癥基因表達數(shù)據(jù)挖掘的低秩表示方法研究
發(fā)布時間:2023-05-14 07:41
當今,癌癥是威脅人類生命的一大殺手。隨著第二代測序技術的發(fā)展,產(chǎn)生了海量可用的基因表達數(shù)據(jù)。雖然,這類癌癥數(shù)據(jù)包含豐富的基因表達信息,為科研工作者從分子水平揭露癌癥的發(fā)病機制提供了數(shù)據(jù)支撐。但是,癌癥測序數(shù)據(jù)通常具有“高維、小樣本和強噪聲”的特點,這無疑是癌癥數(shù)據(jù)挖掘工作中的一個極大的挑戰(zhàn)。低秩表示(Low-rank Representation,LRR)是一種實現(xiàn)數(shù)據(jù)降維、減小噪聲影響的矩陣分解方法,在癌癥數(shù)據(jù)挖掘方面已取得了很多的成功。在查閱歸納了大量國內(nèi)外相關文獻的基礎上,本論文針對現(xiàn)有LRR方法存在的部分不足,提出三種新的LRR方法,并將之應用到癌癥基因表達數(shù)據(jù)挖據(jù)中,旨在研究癌癥病變的內(nèi)部機理,更精確地分析癌癥亞型。具體研究內(nèi)容如下:(1)提出聯(lián)合截斷核范數(shù)和圖正則的低秩表示方法:LRR方法從觀測數(shù)據(jù)矩陣分解出的低秩矩陣的奇異值是快速減小的數(shù)據(jù)序列,因此,最小化所有奇異值的核范數(shù)不是近似矩陣秩函數(shù)的最佳選擇。該方法采用截斷核范數(shù)代替核范數(shù)處理低秩矩陣的凸松弛問題,保留了與矩陣相關的主要成分的信息,有效降低了奇異值收縮造成的損害,更準確地近似了矩陣的秩。并且新方法引入了圖正則項...
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.3.1 論文主要研究工作
1.3.2 論文創(chuàng)新點
1.3.3 論文組織結(jié)構(gòu)
1.4 論文研究方法
第2章 相關研究工作、數(shù)據(jù)集及相關平臺簡介
2.1 相關研究工作
2.1.1 低秩表示(LRR)方法概述
2.1.2 潛在低秩表示(Lat LRR)方法概述
2.1.3 系統(tǒng)實現(xiàn)框架
2.2 數(shù)據(jù)集簡介
2.2.1 基因表達數(shù)據(jù)簡介
2.2.2 數(shù)據(jù)庫簡介
2.2.3 實驗數(shù)據(jù)簡介
2.3 結(jié)果分析平臺簡介
2.3.1 Gene Cards平臺簡介
2.3.2 Topp Gene Suite平臺簡介
第3章 聯(lián)合截斷核范數(shù)和圖正則的低秩表示方法的研究及應用
3.1 引言
3.2 截斷核范數(shù)和圖正則化簡介
3.2.1 截斷核范數(shù)簡介
3.2.2 圖正則簡介
3.3 聯(lián)合截斷核范數(shù)和圖正則的低秩表示(TLLRR)方法
3.3.1 TLLRR模型構(gòu)建
3.3.2 TLLRR模型求解
3.3.3 TLLRR算法的收斂性和時間復雜度分析
3.4 參數(shù)設置
3.4.1 實驗數(shù)據(jù)
3.4.2 選參結(jié)果
3.5 實驗結(jié)果與討論
3.5.1 評價指標
3.5.2 差異表達基因識別
3.5.3 癌癥樣本聚類
3.6 本章小結(jié)
第4章 雙超圖正則化的低秩表示方法的研究及應用
4.1 引言
4.2 超圖正則簡介
4.3 雙超圖正則化的低秩表示(DHLRR)方法
4.3.1 DHLRR模型構(gòu)建
4.3.2 DHLRR模型求解
4.3.3 DHLRR算法的收斂性和時間復雜度分析
4.4 參數(shù)設置
4.4.1 實驗數(shù)據(jù)
4.4.2 選參結(jié)果
4.5 實驗結(jié)果與討論
4.5.1 評價指標
4.5.2 差異表達基因識別
4.5.3 癌癥樣本聚類
4.6 本章小結(jié)
第5章 聯(lián)合截斷核范數(shù)和圖正則的潛在低秩表示方法的研究及應用
5.1 引言
5.2 聯(lián)合截斷核范數(shù)和圖正則的潛在低秩表示(Lat-TGLRR)方法
5.2.1 Lat-TGLRR模型構(gòu)建
5.2.2 Lat-TGLRR模型求解
5.2.3 Lat-TGLRR算法的收斂性和時間復雜度分析
5.3 參數(shù)設置
5.3.1 實驗數(shù)據(jù)
5.3.2 選參結(jié)果
5.4 實驗結(jié)果與討論
5.4.1 評價指標
5.4.2 共差異表達基因識別
5.4.3 癌癥樣本聚類
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
在讀期間發(fā)表的學術論文及研究成果
致謝
本文編號:3817477
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.3.1 論文主要研究工作
1.3.2 論文創(chuàng)新點
1.3.3 論文組織結(jié)構(gòu)
1.4 論文研究方法
第2章 相關研究工作、數(shù)據(jù)集及相關平臺簡介
2.1 相關研究工作
2.1.1 低秩表示(LRR)方法概述
2.1.2 潛在低秩表示(Lat LRR)方法概述
2.1.3 系統(tǒng)實現(xiàn)框架
2.2 數(shù)據(jù)集簡介
2.2.1 基因表達數(shù)據(jù)簡介
2.2.2 數(shù)據(jù)庫簡介
2.2.3 實驗數(shù)據(jù)簡介
2.3 結(jié)果分析平臺簡介
2.3.1 Gene Cards平臺簡介
2.3.2 Topp Gene Suite平臺簡介
第3章 聯(lián)合截斷核范數(shù)和圖正則的低秩表示方法的研究及應用
3.1 引言
3.2 截斷核范數(shù)和圖正則化簡介
3.2.1 截斷核范數(shù)簡介
3.2.2 圖正則簡介
3.3 聯(lián)合截斷核范數(shù)和圖正則的低秩表示(TLLRR)方法
3.3.1 TLLRR模型構(gòu)建
3.3.2 TLLRR模型求解
3.3.3 TLLRR算法的收斂性和時間復雜度分析
3.4 參數(shù)設置
3.4.1 實驗數(shù)據(jù)
3.4.2 選參結(jié)果
3.5 實驗結(jié)果與討論
3.5.1 評價指標
3.5.2 差異表達基因識別
3.5.3 癌癥樣本聚類
3.6 本章小結(jié)
第4章 雙超圖正則化的低秩表示方法的研究及應用
4.1 引言
4.2 超圖正則簡介
4.3 雙超圖正則化的低秩表示(DHLRR)方法
4.3.1 DHLRR模型構(gòu)建
4.3.2 DHLRR模型求解
4.3.3 DHLRR算法的收斂性和時間復雜度分析
4.4 參數(shù)設置
4.4.1 實驗數(shù)據(jù)
4.4.2 選參結(jié)果
4.5 實驗結(jié)果與討論
4.5.1 評價指標
4.5.2 差異表達基因識別
4.5.3 癌癥樣本聚類
4.6 本章小結(jié)
第5章 聯(lián)合截斷核范數(shù)和圖正則的潛在低秩表示方法的研究及應用
5.1 引言
5.2 聯(lián)合截斷核范數(shù)和圖正則的潛在低秩表示(Lat-TGLRR)方法
5.2.1 Lat-TGLRR模型構(gòu)建
5.2.2 Lat-TGLRR模型求解
5.2.3 Lat-TGLRR算法的收斂性和時間復雜度分析
5.3 參數(shù)設置
5.3.1 實驗數(shù)據(jù)
5.3.2 選參結(jié)果
5.4 實驗結(jié)果與討論
5.4.1 評價指標
5.4.2 共差異表達基因識別
5.4.3 癌癥樣本聚類
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
在讀期間發(fā)表的學術論文及研究成果
致謝
本文編號:3817477
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3817477.html
最近更新
教材專著