癌癥基因表達數(shù)據(jù)屬性偏序表示與知識發(fā)現(xiàn)
發(fā)布時間:2017-09-18 02:24
本文關鍵詞:癌癥基因表達數(shù)據(jù)屬性偏序表示與知識發(fā)現(xiàn)
更多相關文章: 屬性偏序結構圖 肺腺癌基因表達數(shù)據(jù) 特征選擇 數(shù)據(jù)離散化 知識發(fā)現(xiàn)
【摘要】:基因芯片技術可以在一次實驗中大規(guī)模并行檢測成千上萬個基因的表達量,對癌癥等疾病的分類、診斷研究有非常重要的實際意義。近幾年來基因表達數(shù)據(jù)量呈指數(shù)式的增長,如何有效的組織分析、處理這些海量的基因表達數(shù)據(jù),從中提取出有效的生物、醫(yī)學信息已成為人們關注和研究的熱點。針對這一問題,本文將特征選擇方法與以形式概念分析為基礎的屬性偏序結構圖相結合來處理肺腺癌基因表達數(shù)據(jù),探索研究一種新的知識發(fā)現(xiàn)方法。本文研究了形式概念分析和屬性偏序結構圖的基礎概念與相關定義,分析了屬性偏序結構圖用于知識發(fā)現(xiàn)和可視化數(shù)據(jù)關系方面所具有的優(yōu)勢,并提出了一個將特征選擇與屬性偏序圖相結合應用于癌癥基因表達數(shù)據(jù)方面的知識發(fā)現(xiàn)方案;之后介紹了基因表達數(shù)據(jù)方面相關內容和所要處理的肺腺癌基因表達數(shù)據(jù)來源及對其所做的預處理過程;接著結合使用T-test方法和Elastic net方法對肺腺癌基因表達數(shù)據(jù)進行了特征基因選擇,共選出35個特征基因,該過程大大降低了數(shù)據(jù)的維度。最后,運用c#編程對數(shù)據(jù)進行離散化處理生成二值的形式背景,進而生成屬性偏序結構圖,根據(jù)圖中的簇集分布及層次關系進行知識發(fā)現(xiàn)。最終發(fā)現(xiàn),選擇出的特征基因在肺腺癌腫瘤樣本和正常樣本中均差異表達,識別出了與腫瘤發(fā)生和轉移密切相關的靶基因,而且在對比分析過程中發(fā)現(xiàn)吸煙影響部分基因在腫瘤樣本中的表達;另外,大部分的特征基因在腫瘤樣本中表達值一般,只有少數(shù)基因是高表達和低表達的。
【關鍵詞】:屬性偏序結構圖 肺腺癌基因表達數(shù)據(jù) 特征選擇 數(shù)據(jù)離散化 知識發(fā)現(xiàn)
【學位授予單位】:燕山大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP311.13;R730
【目錄】:
- 摘要5-6
- Abstract6-8
- 目錄8-10
- 第1章 緒論10-15
- 1.1 研究背景與意義10-12
- 1.2 國內外研究現(xiàn)狀12-13
- 1.3 本文主要內容13-15
- 第2章 形式概念分析理論15-30
- 2.1 序與格15-17
- 2.2 形式背景與形式概念17-19
- 2.3 形式背景的生成19-21
- 2.4 屬性偏序結構圖21-29
- 2.4.1 基本的屬性定義22-28
- 2.4.2 生成屬性偏序圖的規(guī)則28-29
- 2.5 本章小結29-30
- 第3章 基因表達數(shù)據(jù)及預處理30-41
- 3.1 生物信息學30-31
- 3.2 基因芯片技術原理及應用31-32
- 3.3 微陣列基因表達數(shù)據(jù)32-36
- 3.4 本文研究所用數(shù)據(jù)集及預處理36-40
- 3.5 本章小結40-41
- 第4章 特征基因的選擇41-51
- 4.1 特征選擇簡述41-42
- 4.2 Lasso算法介紹42-44
- 4.2.1 Lasso算法43
- 4.2.2 Lars算法43-44
- 4.3 Lasso相關方法44-46
- 4.3.1 Elastic Net44-45
- 4.3.2 Adaptive Lasso45-46
- 4.4 肺癌基因表達數(shù)據(jù)特征基因選擇46-50
- 4.4.1 T-test對特征基因的初步選擇46-48
- 4.4.2 Elastic net對特征基因的選擇48-50
- 4.5 本章小結50-51
- 第5章 肺癌基因數(shù)據(jù)的知識發(fā)現(xiàn)51-66
- 5.1 生成形式背景51-52
- 5.2 樣本為對象特征基因為屬性的偏序結構知識發(fā)現(xiàn)52-58
- 5.3 特征基因作為屬性的對比知識發(fā)現(xiàn)58-63
- 5.3.1 不吸煙患者的組織樣本為對象58-60
- 5.3.2 吸煙患者的組織樣本為對象60-62
- 5.3.3 對比分析62-63
- 5.4 特征基因作為對象的知識發(fā)現(xiàn)63-65
- 5.5 本章小結65-66
- 結論66-68
- 參考文獻68-72
- 攻讀碩士學位期間承擔的科研任務與主要成果72-73
- 致謝73-74
- 作者簡介74
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 張靖;胡學鋼;張玉紅;施萬鋒;;K-split Lasso:有效的腫瘤特征基因選擇方法[J];計算機科學與探索;2012年12期
2 孫中吉;李櫻;;生物信息學在醫(yī)學基礎研究中的應用[J];醫(yī)學信息學雜志;2013年11期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 桑雨;連續(xù)數(shù)據(jù)離散化方法研究[D];大連理工大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 孫良剛;基于屬性偏序原理的屬性偏序結構圖表示算法研究[D];燕山大學;2012年
,本文編號:872842
本文鏈接:http://www.sikaile.net/yixuelunwen/zlx/872842.html
最近更新
教材專著