腫瘤基因表達(dá)譜的數(shù)據(jù)挖掘與識(shí)別分類
發(fā)布時(shí)間:2019-09-06 08:28
【摘要】:腫瘤種類繁多,其致病機(jī)理復(fù)雜,是危及人類身體健康的主要惡性疾病之一,盡早確診對(duì)患者的治療至關(guān)重要;蛐酒夹g(shù)是功能基因組學(xué)的一個(gè)突破,它所產(chǎn)生的基因表達(dá)譜數(shù)據(jù)極大的推進(jìn)了功能基因組學(xué)的發(fā)展;诨虮磉_(dá)譜的數(shù)據(jù)挖掘,可以讓我們更好地認(rèn)識(shí)腫瘤,從分子生物學(xué)角度去探索其發(fā)生機(jī)理,對(duì)腫瘤診斷、治療以及新藥物的研制都具有積極的意義。由于基因表達(dá)譜數(shù)據(jù)具有維度高、樣本小、高冗余以及高噪聲等特點(diǎn),本課題采用時(shí)頻分析工具從三個(gè)角度研究了腫瘤基因表達(dá)譜數(shù)據(jù)的特征提取。本課題提出了利用小波包變換對(duì)基因表達(dá)譜進(jìn)行分解,進(jìn)而提取相應(yīng)各頻帶的樣本熵值構(gòu)成特征向量。然后本課題針對(duì)基因表達(dá)譜數(shù)據(jù)的高噪聲特性,提出對(duì)腫瘤基因表達(dá)譜數(shù)據(jù)進(jìn)行EMD分解,計(jì)算出相應(yīng)各IMF與原始數(shù)據(jù)的相關(guān)系數(shù),保留相關(guān)系數(shù)較大的IMF分量并重構(gòu)數(shù)據(jù),進(jìn)而篩選獲得特征向量。此外,利用基因表達(dá)譜數(shù)據(jù)在分?jǐn)?shù)階傅里葉變換最優(yōu)階次上的全局特性,篩選分?jǐn)?shù)階傅里葉系數(shù)幅值的熵權(quán)較大的位置的分?jǐn)?shù)階傅里葉系數(shù)作為特征向量。最后針對(duì)分別來自美國(guó)MIT大學(xué)和普林斯頓大學(xué)數(shù)據(jù)庫(kù)的急性白血病、結(jié)腸癌等基因表達(dá)譜數(shù)據(jù)集進(jìn)行了仿真驗(yàn)證,分類結(jié)果正確率都達(dá)到了90%以上。
【圖文】:
北京理工大學(xué)碩士學(xué)位論文的基因表情況。所謂基因表達(dá)就是 DNA 到 mRNA 再到蛋白的過程,其中基因表達(dá)水平常常通過該基因所轉(zhuǎn)錄的 mRNA 的數(shù)量來衡量。在基因芯片實(shí)驗(yàn)中,,先選擇不同狀態(tài)的樣本,并將其分為實(shí)驗(yàn)樣本和參考樣本。在其 mRNA 轉(zhuǎn)錄過程分別用紅、綠熒光基團(tuán)進(jìn)行標(biāo)記并混合,再與微陣列的探針序列進(jìn)行雜交等步驟獲得微陣列上每個(gè)點(diǎn)的紅光強(qiáng)度和綠光強(qiáng)度(Cy5 和 Cy3),那么基因在實(shí)驗(yàn)樣本中的表達(dá)水平就是其比值。圖 1.1展示了基因芯片從制備到實(shí)驗(yàn)獲取基因表達(dá)譜數(shù)據(jù)的全過程[21]。
從小波包庫(kù)中選擇能構(gòu)成 2L R 空間的一個(gè)基函數(shù)系稱為 任意固定的 j 值, / 22 2 , , ,j jn n t t k j k Z n Z 均可構(gòu)成個(gè)正交基與短時(shí)傅立葉基類似,稱為子帶基。一個(gè)正交小波來構(gòu)造小波包時(shí),那么與所選擇的小波所對(duì)應(yīng)的,kg 分別是低通分解濾波器以及高通分解濾波器被 2 除后的重函數(shù)序列 ( 0,1,2,...)nW t n : 2 1202 2Nn k nkW t h W t k 2 12 102 2Nn k nkW t g W t k 0W t t是尺度函數(shù); 1W t t是小波函數(shù)。包對(duì)信號(hào)的分解特性變換不僅對(duì)低頻部分進(jìn)行分解,而且還對(duì)高頻部分進(jìn)行分解方法。圖 3.1 為信號(hào)的小波包分解示意圖。
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.13;R730.2
【圖文】:
北京理工大學(xué)碩士學(xué)位論文的基因表情況。所謂基因表達(dá)就是 DNA 到 mRNA 再到蛋白的過程,其中基因表達(dá)水平常常通過該基因所轉(zhuǎn)錄的 mRNA 的數(shù)量來衡量。在基因芯片實(shí)驗(yàn)中,,先選擇不同狀態(tài)的樣本,并將其分為實(shí)驗(yàn)樣本和參考樣本。在其 mRNA 轉(zhuǎn)錄過程分別用紅、綠熒光基團(tuán)進(jìn)行標(biāo)記并混合,再與微陣列的探針序列進(jìn)行雜交等步驟獲得微陣列上每個(gè)點(diǎn)的紅光強(qiáng)度和綠光強(qiáng)度(Cy5 和 Cy3),那么基因在實(shí)驗(yàn)樣本中的表達(dá)水平就是其比值。圖 1.1展示了基因芯片從制備到實(shí)驗(yàn)獲取基因表達(dá)譜數(shù)據(jù)的全過程[21]。
從小波包庫(kù)中選擇能構(gòu)成 2L R 空間的一個(gè)基函數(shù)系稱為 任意固定的 j 值, / 22 2 , , ,j jn n t t k j k Z n Z 均可構(gòu)成個(gè)正交基與短時(shí)傅立葉基類似,稱為子帶基。一個(gè)正交小波來構(gòu)造小波包時(shí),那么與所選擇的小波所對(duì)應(yīng)的,kg 分別是低通分解濾波器以及高通分解濾波器被 2 除后的重函數(shù)序列 ( 0,1,2,...)nW t n : 2 1202 2Nn k nkW t h W t k 2 12 102 2Nn k nkW t g W t k 0W t t是尺度函數(shù); 1W t t是小波函數(shù)。包對(duì)信號(hào)的分解特性變換不僅對(duì)低頻部分進(jìn)行分解,而且還對(duì)高頻部分進(jìn)行分解方法。圖 3.1 為信號(hào)的小波包分解示意圖。
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.13;R730.2
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 應(yīng)鳳祥,楊式升,張敏,李豫喜,周宏燕;激光掃描共聚焦顯微鏡研究?jī)?chǔ)層孔隙結(jié)構(gòu)[J];沉積學(xué)報(bào);2002年01期
2 李穎新,阮曉鋼;基于支持向量機(jī)的腫瘤分類特征基因選取[J];計(jì)算機(jī)研究與發(fā)展;2005年10期
3 龐廣昌,陶|
本文編號(hào):2532509
本文鏈接:http://www.sikaile.net/yixuelunwen/zlx/2532509.html
最近更新
教材專著