基于稀疏矩陣分解的特征基因識(shí)別方法研究
本文關(guān)鍵詞:基于稀疏矩陣分解的特征基因識(shí)別方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著信息技術(shù)的進(jìn)步和數(shù)據(jù)庫(kù)的使用,各種各樣的信息呈爆炸式增長(zhǎng),人們很難從海量的數(shù)據(jù)中找到有用的信息。數(shù)據(jù)庫(kù)技術(shù)和機(jī)器學(xué)習(xí)的迅速發(fā)展,使得數(shù)據(jù)挖掘作為一種新的數(shù)據(jù)處理技術(shù)登上歷史舞臺(tái)。近年來(lái),各種生物基因組研究相繼開(kāi)展,使得生物學(xué)實(shí)驗(yàn)數(shù)據(jù)的數(shù)量呈爆炸式增長(zhǎng)。過(guò)去的數(shù)據(jù)分析方法已經(jīng)遠(yuǎn)遠(yuǎn)不能滿(mǎn)足實(shí)際研究的需要,稀疏矩陣分解理論作為新一代的數(shù)據(jù)挖掘技術(shù)能夠很好地處理大規(guī);虮磉_(dá)數(shù)據(jù),進(jìn)一步從基因表達(dá)數(shù)據(jù)中識(shí)別出包含關(guān)鍵信息的特征基因,從而為生命科學(xué)更好地認(rèn)識(shí)生命提供了有效的手段和方法。本文通過(guò)綜合分析國(guó)內(nèi)外學(xué)者對(duì)稀疏矩陣分解理論和特征基因識(shí)別算法方面的研究成果,發(fā)現(xiàn)其中存在部分學(xué)術(shù)研究上的缺乏,因此,筆者基于以往的研究成果,通過(guò)對(duì)數(shù)據(jù)挖掘算法進(jìn)行深入研究,選擇其中的特征提取作為重點(diǎn)研究方向,對(duì)稀疏矩陣分解展開(kāi)研究,并對(duì)稀疏矩陣分解算法進(jìn)行改進(jìn),提出了兩種新的特征基因識(shí)別算法:基于類(lèi)別信息的懲罰性矩陣分解算法和基于P范數(shù)的魯棒特征提取算法;陬(lèi)別信息的懲罰性矩陣分解根據(jù)基因表達(dá)數(shù)據(jù)中不同的樣本數(shù)得到總散度矩陣,并將總散度矩陣進(jìn)行矩陣分解,重建一個(gè)新的數(shù)據(jù)矩陣,然后利用懲罰性矩陣分解對(duì)新的數(shù)據(jù)矩陣進(jìn)行處理,得到稀疏特征樣本,最后,根據(jù)稀疏特征樣本中的非零項(xiàng)來(lái)識(shí)別特征基因;赑范數(shù)的魯棒特征提取算法利用Schattenp范數(shù)作為正則化函數(shù)來(lái)得到低秩矩陣,利用pL作為誤差函數(shù)來(lái)提高對(duì)離群值的魯棒性,因此該算法可以有效地識(shí)別特征基因。為了驗(yàn)證這兩種算法的性能,本文分別在仿真數(shù)據(jù)集和基因表達(dá)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),并同現(xiàn)有的方法相比較。實(shí)驗(yàn)結(jié)果表明,筆者提出的算法是有效可行的。本論文的創(chuàng)新點(diǎn)之一在于通過(guò)總散度矩陣引入樣本類(lèi)別信息,并與PMD進(jìn)行結(jié)合,提出一種新的有監(jiān)督特征提取算法基于類(lèi)別信息的懲罰性矩陣分解算法(CIPMD)來(lái)識(shí)別特征基因,并成功將CIPMD應(yīng)用在基因表達(dá)數(shù)據(jù)分析中;創(chuàng)新點(diǎn)之二是基于Schattenp范數(shù)和pL范數(shù),提出基于P范數(shù)的魯棒特征提取算法(PRFE)來(lái)識(shí)別特征基因。
【關(guān)鍵詞】:稀疏矩陣分解 特征基因 基因表達(dá)數(shù)據(jù) 類(lèi)別信息 懲罰性矩陣分解 P范數(shù) 魯棒特征提取 低秩
【學(xué)位授予單位】:曲阜師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP311.13;G250
【目錄】:
- 摘要3-4
- Abstract4-8
- 第1章 緒論8-14
- 1.1 研究背景及意義8-9
- 1.1.1 研究背景8-9
- 1.1.2 研究意義9
- 1.2 國(guó)內(nèi)外研究綜述9-11
- 1.3 研究思路與方法11-14
- 1.3.1 研究思路11-12
- 1.3.2 研究方法12-14
- 第2章 相關(guān)概念解析14-24
- 2.1 稀疏矩陣分解理論概述14-18
- 2.1.1 矩陣分解理論14-16
- 2.1.2 稀疏表示理論16-18
- 2.2 特征基因識(shí)別概述18-24
- 2.2.1 基因表達(dá)數(shù)據(jù)及其特點(diǎn)18-19
- 2.2.2 特征基因識(shí)別方法介紹19-24
- 第3章 基于類(lèi)別信息的懲罰性矩陣分解算法24-40
- 3.1 基于類(lèi)別信息的懲罰性矩陣分解算法24-26
- 3.1.1 散度矩陣24-25
- 3.1.2 構(gòu)建新矩陣25
- 3.1.3 懲罰性矩陣分解25-26
- 3.2 CIPMD在特征基因識(shí)別中的應(yīng)用26-27
- 3.3 實(shí)驗(yàn)結(jié)果與討論27-38
- 3.3.1 仿真實(shí)驗(yàn)結(jié)果與分析27-30
- 3.3.2 基因表達(dá)數(shù)據(jù)實(shí)驗(yàn)結(jié)果與分析30-38
- 3.4 小結(jié)38-40
- 第4章 基于P范數(shù)的魯棒特征提取算法40-59
- 4.1 基于P范數(shù)的魯棒特征提取算法40-45
- 4.1.1 P范數(shù)概念40
- 4.1.2 基于P范數(shù)的魯棒特征提取算法40-41
- 4.1.3 算法的求解41-44
- 4.1.4 算法中p值的選擇44-45
- 4.2 PRFE在特征基因識(shí)別中的應(yīng)用45-46
- 4.3 實(shí)驗(yàn)結(jié)果與討論46-57
- 4.3.1 仿真實(shí)驗(yàn)結(jié)果與分析46-49
- 4.3.2 基因表達(dá)數(shù)據(jù)實(shí)驗(yàn)結(jié)果與分析49-57
- 4.4 小結(jié)57-59
- 第5章 結(jié)論與展望59-62
- 5.1 研究結(jié)論59
- 5.2 研究創(chuàng)新點(diǎn)及展望59-62
- 5.2.1 研究的創(chuàng)新點(diǎn)59
- 5.2.2 研究的不足59-60
- 5.2.3 研究的展望60-62
- 參考文獻(xiàn)62-68
- 在讀期間發(fā)表的學(xué)術(shù)論文及研究成果68-70
- 致謝70
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 紀(jì)效霞;陳柯;;有限元中稀疏矩陣的存儲(chǔ)[J];棗莊學(xué)院學(xué)報(bào);2008年05期
2 李長(zhǎng)興;;稀疏矩陣的轉(zhuǎn)置[J];計(jì)算機(jī)光盤(pán)軟件與應(yīng)用;2013年05期
3 史樹(shù)民,董相端;稀疏矩陣在統(tǒng)計(jì)文件組織中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用與軟件;1987年06期
4 張興令,郭敏燕;一個(gè)高階稀疏矩陣的壓縮存放法[J];計(jì)算機(jī)應(yīng)用與軟件;1987年06期
5 李昱明,董萬(wàn)鵬,彭穎紅;基于0-1屬性矩陣的矩陣壓縮存貯方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年02期
6 蔣川群;杜奕;;稀疏矩陣相乘的一個(gè)改進(jìn)算法[J];計(jì)算機(jī)工程與應(yīng)用;2009年19期
7 任建民,張義門(mén);模擬半導(dǎo)體器件的一種稀疏矩陣及其算法[J];電子科學(xué)學(xué)刊;1989年01期
8 高鳳榮,杜小勇,王珊;一種基于稀疏矩陣劃分的個(gè)性化推薦算法[J];微電子學(xué)與計(jì)算機(jī);2004年02期
9 褚一平;陳勤;吳鋌;;大型稀疏矩陣線(xiàn)形相關(guān)列的求解算法和實(shí)現(xiàn)方法研究[J];石油工業(yè)計(jì)算機(jī)應(yīng)用;2004年04期
10 居悌;電路的計(jì)算機(jī)輔助設(shè)計(jì)——八、稀疏矩陣技術(shù)[J];微電子學(xué)與計(jì)算機(jī);1986年08期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 宋琦;陳璞;;稀疏求解—結(jié)構(gòu)修改的一種新的可能性[A];北京力學(xué)會(huì)第20屆學(xué)術(shù)年會(huì)論文集[C];2014年
2 徐道遠(yuǎn);王寶庭;王向東;馮伯林;;求解大型稀疏矩陣的ICCG法[A];第八屆全國(guó)結(jié)構(gòu)工程學(xué)術(shù)會(huì)議論文集(第Ⅰ卷)[C];1999年
3 苑維然;陳璞;劉凱欣;;非對(duì)稱(chēng)線(xiàn)性方程組的快速外存解法[A];中國(guó)力學(xué)學(xué)會(huì)學(xué)術(shù)大會(huì)'2005論文摘要集(下)[C];2005年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 劉健;基于稀疏矩陣分解的特征基因識(shí)別方法研究[D];曲阜師范大學(xué);2015年
2 莊立;稀疏矩陣向量乘及自動(dòng)調(diào)優(yōu)[D];杭州電子科技大學(xué);2011年
3 馮廣祥;大型稀疏矩陣直接求解算法的研究及實(shí)現(xiàn)[D];東北大學(xué);2010年
4 丁玲;低秩與稀疏矩陣恢復(fù)問(wèn)題的若干研究[D];浙江大學(xué);2012年
5 吳超凡;基于UB樹(shù)的大型稀疏矩陣存儲(chǔ)研究[D];云南大學(xué);2013年
6 王亞南;基于FPGA的稀疏矩陣分解實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
7 趙加強(qiáng);基于OpenCL的稀疏矩陣向量乘優(yōu)化[D];吉林大學(xué);2012年
8 施浩;基于FPGA的稀疏矩陣向量乘的優(yōu)化研究與實(shí)現(xiàn)[D];南京郵電大學(xué);2011年
9 胡耀國(guó);基于GPU的有限元方法研究[D];華中科技大學(xué);2011年
10 梁添;基于GPU的稀疏矩陣運(yùn)算優(yōu)化研究[D];華中科技大學(xué);2012年
本文關(guān)鍵詞:基于稀疏矩陣分解的特征基因識(shí)別方法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):429588
本文鏈接:http://www.sikaile.net/tushudanganlunwen/429588.html