基于深度學習的高維稀疏數(shù)據(jù)分類研究與應用
發(fā)布時間:2021-08-10 09:50
互聯(lián)網(wǎng)大數(shù)據(jù)中蘊含著海量文本,如何有效地管理和利用這些數(shù)據(jù)是信息科學的研究熱點。與此同時,隨著高通量實驗技術(shù)的不斷進步,生物組學數(shù)據(jù)呈現(xiàn)爆炸性增長,基于組學數(shù)據(jù)的疾病特征分析成為生物醫(yī)學研究的熱點問題。文本和代謝組學數(shù)據(jù)雖然來源不同,卻都有高維和稀疏的特點。傳統(tǒng)機器學習方法在解決高維稀疏矩陣計算問題時,常會因維數(shù)災難得不到令人滿意的結(jié)果。本文提出了基于深度學習的高維稀疏數(shù)據(jù)分類方法,重點討論了深度學習在文本和代謝組學數(shù)據(jù)分類上的應用。具體研究工作如下:(1)針對于高維稀疏文本數(shù)據(jù),提出了一種深度置信網(wǎng)絡(luò)(deep belief networks,DBN)和Softmax分類器相融合的文本分類方法。在該方法中,DBN用來對高維和稀疏文本數(shù)據(jù)降維,Softmax實現(xiàn)對降維數(shù)據(jù)的分類。在預訓練過程中,DBN和Softmax分別完成各自的工作;在微調(diào)階段,將二者作為一個整體,引入了L-BFGS(limited memory Broyden Fletcher Goldfarb Shanno)算法調(diào)整系統(tǒng)模型參數(shù)。在Reuters-21578和20-Newsgroup數(shù)據(jù)集上的實驗表明,針對不同規(guī)...
【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:89 頁
【學位級別】:博士
【部分圖文】:
小規(guī)模數(shù)據(jù)集實驗誤差率比較圖
小規(guī)模數(shù)據(jù)集實驗均方誤差變化比較
大規(guī)模數(shù)據(jù)集實驗誤差率比較圖
【參考文獻】:
期刊論文
[1]丹參多酚酸鹽改善擴張性心肌病心肌功能的作用機制[J]. 王曦燁,單曉彤,王伊林,李丹,趙明,許良. 高等學;瘜W學報. 2016(05)
[2]Biomarkers for pancreatic cancer:Recent achievements in proteomics and genomics through classical and multivariate statistical methods[J]. Emilio Marengo,Elisa Robotti. World Journal of Gastroenterology. 2014(37)
[3]白細胞介素37在類風濕關(guān)節(jié)炎發(fā)病機制中的作用[J]. 陳歡雪,王曉非. 中國醫(yī)科大學學報. 2014(03)
[4]K-最近鄰分類技術(shù)的改進算法[J]. 王曉曄,王正歐. 電子與信息學報. 2005(03)
[5]一種實用高效的文本分類算法[J]. 王建會,王洪偉,申展,胡運發(fā). 計算機研究與發(fā)展. 2005(01)
[6]概念推理網(wǎng)及其在文本分類中的應用[J]. 李曉黎,劉繼敏,史忠植. 計算機研究與發(fā)展. 2000(09)
博士論文
[1]文本分類及其特征降維研究[D]. 廖一星.浙江大學 2012
本文編號:3333839
【文章來源】:吉林大學吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:89 頁
【學位級別】:博士
【部分圖文】:
小規(guī)模數(shù)據(jù)集實驗誤差率比較圖
小規(guī)模數(shù)據(jù)集實驗均方誤差變化比較
大規(guī)模數(shù)據(jù)集實驗誤差率比較圖
【參考文獻】:
期刊論文
[1]丹參多酚酸鹽改善擴張性心肌病心肌功能的作用機制[J]. 王曦燁,單曉彤,王伊林,李丹,趙明,許良. 高等學;瘜W學報. 2016(05)
[2]Biomarkers for pancreatic cancer:Recent achievements in proteomics and genomics through classical and multivariate statistical methods[J]. Emilio Marengo,Elisa Robotti. World Journal of Gastroenterology. 2014(37)
[3]白細胞介素37在類風濕關(guān)節(jié)炎發(fā)病機制中的作用[J]. 陳歡雪,王曉非. 中國醫(yī)科大學學報. 2014(03)
[4]K-最近鄰分類技術(shù)的改進算法[J]. 王曉曄,王正歐. 電子與信息學報. 2005(03)
[5]一種實用高效的文本分類算法[J]. 王建會,王洪偉,申展,胡運發(fā). 計算機研究與發(fā)展. 2005(01)
[6]概念推理網(wǎng)及其在文本分類中的應用[J]. 李曉黎,劉繼敏,史忠植. 計算機研究與發(fā)展. 2000(09)
博士論文
[1]文本分類及其特征降維研究[D]. 廖一星.浙江大學 2012
本文編號:3333839
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3333839.html
最近更新
教材專著