基于微陣列質(zhì)譜數(shù)據(jù)的卵巢癌預測研究
發(fā)布時間:2021-08-12 21:02
癌癥是人類生命和健康的主要威脅之一,是世界上最致命的疾病。近年來,通過微陣列質(zhì)譜數(shù)據(jù)進行癌癥預測,實現(xiàn)癌癥早期發(fā)現(xiàn),提高癌癥病患的生存率,成為人們關(guān)注的焦點。本文首先對癌癥預測的背景意義以及癌癥預測的研究現(xiàn)狀和方法進行闡明和綜述,并對基于機器學習的預測方法進行分析和歸納。在此基礎(chǔ)上,進行基于微陣列數(shù)據(jù)的卵巢癌預測研究,提出基于主成分分析、人工蜂群優(yōu)化和支持向量回歸機的PCA-ABC-SVR卵巢癌預測模型。對于模型的訓練數(shù)據(jù),針對微陣列數(shù)據(jù)集的特點,采用PCA主成分分析法對數(shù)據(jù)進行降維處理,并采用ABC人工蜂群優(yōu)化算法進行支持向量回歸機SVR的參數(shù)選取,實現(xiàn)PCA-ABC-SVR卵巢癌預測模型的建立。最后,在給定的實驗軟硬件平臺環(huán)境下,進行k值選取、模型對比和優(yōu)化對比三個仿真實驗,通過訓練數(shù)據(jù)集實現(xiàn)所提模型的學習和訓練。通過實驗結(jié)果的分析,驗證了本文所提出的PCA-ABC-SVR模型在卵巢癌預測方面的可行性和優(yōu)越性。
【文章來源】:哈爾濱理工大學黑龍江省
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【部分圖文】:
本文組織結(jié)構(gòu)框圖
哈爾濱理工大學工學碩士學位論文-11-式如下:)()()(lhRRemp(2-9)公式中,lhlhlh4log)12(log)(,)(lh叫做置信風險;l成為數(shù)據(jù)樣本數(shù);參數(shù)h叫做VC維。目前,當進行結(jié)構(gòu)風險最小化求解時,兩種可行方案經(jīng)常被應用[49]。真實風險由置信風險以及經(jīng)驗風險)(empR組成,如公式(2-9)所示。三者同VC維h和訓練樣本數(shù)l密切相關(guān)。如圖2-2所示。圖2-2結(jié)構(gòu)風險最小化原理圖Fig.2-2Principlediagramofstructuralriskminimization2.3支持向量回歸機算法自上世紀九十年代中期以來,作為一種基于統(tǒng)計學習理論的機器學習方法,支持向量機研究逐步開展起來。最大間隔法被SVM采用,同時廣義最大間隔法被采用,之后廣義最優(yōu)分類超平面在高維數(shù)據(jù)空間中通過非線性變換被求取,即凸二次規(guī)劃問題,最終獲得最優(yōu)解,該方案針對于解決非線性可分問題。核函數(shù)的映射將輸入向量轉(zhuǎn)化到高維空間,中間的節(jié)點對應一個支持向量,中間節(jié)點的線性組合被輸出,由此可見,SVM理論的結(jié)構(gòu)與一個神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相似。如圖2-3所示。真實學習風險置信區(qū)間經(jīng)驗風險VC維風險
哈爾濱理工大學工學碩士學位論文-12-圖2-3支持向量機結(jié)構(gòu)圖Fig.2-3SVMstructure回歸和分類兩類問題在于輸出變量的取值范圍上存在差異,其中回歸問題的輸出變量的范圍屬于連續(xù)的實數(shù),而分類問題的輸出變量為有限個類別,SVM可以解決回歸和分類這兩類問題。在實際問題的方案中,根據(jù)使用不同的損失函數(shù),SVR可以分為以下幾種基本類型,即最小二乘SVR、SVRv和SVR等。這就是支持向量回歸是SVM在回歸估計問題上的拓展型應用。在本文中,支持向量回歸機被選用以解決癌癥預測的建模過程。下式為不敏感損失函數(shù):iiiiiiiiiyxfyxfyxfxfyxL)(,)()(,0))(,,((2-10)SVR存在線性回歸和非線性回歸兩類情況,這與分類問題是類似的。上式中,對應的實際值和目標輸出值分別表示為y和f(x),輸入值表示為x,不敏感系數(shù)表示為。對于線性SVR,采用函數(shù)(2-11)式:bxwxfT)((2-11)其中偏置向量表示為b,權(quán)向量表示為w,目標函數(shù)表示為f(x)。ya1y1a2y2。。。。。。a3y3K(x1,x)K(x2,x)。。。。。。K(x3,x)x1x2。。。。。。xi
【參考文獻】:
期刊論文
[1]皮膚鱗狀細胞癌轉(zhuǎn)錄組學微陣列分析方法的研究策略及進展[J]. 韓向春,鄭力強,馮志芳,馬靜. 解放軍醫(yī)學雜志. 2019(06)
[2]求解柔性作業(yè)車間調(diào)度問題的多策略融合Pareto人工蜂群算法[J]. 趙博選,高建民,付穎斌,趙姣. 系統(tǒng)工程理論與實踐. 2019(05)
[3]基因治療及細胞治療發(fā)展態(tài)勢分析[J]. 遲培娟,陳芳,Cynthia Liu,Qiongqiong Zhou,Yi Deng,Yingzhu Li,韓濤,余敏,楊艷萍,王學昭. 中國生物工程雜志. 2019(05)
[4]基于功能納米材料的液相生物芯片檢測技術(shù)[J]. 武衛(wèi)杰,冷遠逵,沈夢飛,李萬萬. 化學進展. 2019(Z1)
[5]基因表達數(shù)據(jù)中的局部模式挖掘研究綜述[J]. 姜濤,李戰(zhàn)懷. 計算機研究與發(fā)展. 2018(11)
[6]基于雙層結(jié)構(gòu)的加速K-NN分類方法[J]. 王曉,趙麗. 計算機工程與設(shè)計. 2018(04)
[7]Hybrid artificial bee colony algorithm with variable neighborhood search and memory mechanism[J]. FAN Chengli,FU Qiang,LONG Guangzheng,XING Qinghua. Journal of Systems Engineering and Electronics. 2018(02)
[8]支持向量機模型與應用綜述[J]. 劉方園,王水花,張煜東. 計算機系統(tǒng)應用. 2018(04)
[9]基于改進鄰域搜索策略的人工蜂群算法[J]. 魏鋒濤,岳明娟,鄭建明. 控制與決策. 2019(05)
[10]量子粒子群優(yōu)化的人工蜂群算法[J]. 杜康宇,毛力,毛羽,楊弘,肖煒. 傳感器與微系統(tǒng). 2018(03)
博士論文
[1]支持向量機算法參數(shù)選擇及其在電站鍋爐系統(tǒng)中的應用研究[D]. 黃景濤.浙江大學 2005
碩士論文
[1]基于自組織映射網(wǎng)絡(luò)的多目標粒子群優(yōu)化算法[D]. 郭倩倩.鄭州大學 2018
[2]基于聚類的基因差異共表達分析[D]. 張萍.黑龍江大學 2017
[3]支持向量機在電力系統(tǒng)短期負荷預測中的應用及改進[D]. 李云飛.西南交通大學 2006
本文編號:3339070
【文章來源】:哈爾濱理工大學黑龍江省
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【部分圖文】:
本文組織結(jié)構(gòu)框圖
哈爾濱理工大學工學碩士學位論文-11-式如下:)()()(lhRRemp(2-9)公式中,lhlhlh4log)12(log)(,)(lh叫做置信風險;l成為數(shù)據(jù)樣本數(shù);參數(shù)h叫做VC維。目前,當進行結(jié)構(gòu)風險最小化求解時,兩種可行方案經(jīng)常被應用[49]。真實風險由置信風險以及經(jīng)驗風險)(empR組成,如公式(2-9)所示。三者同VC維h和訓練樣本數(shù)l密切相關(guān)。如圖2-2所示。圖2-2結(jié)構(gòu)風險最小化原理圖Fig.2-2Principlediagramofstructuralriskminimization2.3支持向量回歸機算法自上世紀九十年代中期以來,作為一種基于統(tǒng)計學習理論的機器學習方法,支持向量機研究逐步開展起來。最大間隔法被SVM采用,同時廣義最大間隔法被采用,之后廣義最優(yōu)分類超平面在高維數(shù)據(jù)空間中通過非線性變換被求取,即凸二次規(guī)劃問題,最終獲得最優(yōu)解,該方案針對于解決非線性可分問題。核函數(shù)的映射將輸入向量轉(zhuǎn)化到高維空間,中間的節(jié)點對應一個支持向量,中間節(jié)點的線性組合被輸出,由此可見,SVM理論的結(jié)構(gòu)與一個神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相似。如圖2-3所示。真實學習風險置信區(qū)間經(jīng)驗風險VC維風險
哈爾濱理工大學工學碩士學位論文-12-圖2-3支持向量機結(jié)構(gòu)圖Fig.2-3SVMstructure回歸和分類兩類問題在于輸出變量的取值范圍上存在差異,其中回歸問題的輸出變量的范圍屬于連續(xù)的實數(shù),而分類問題的輸出變量為有限個類別,SVM可以解決回歸和分類這兩類問題。在實際問題的方案中,根據(jù)使用不同的損失函數(shù),SVR可以分為以下幾種基本類型,即最小二乘SVR、SVRv和SVR等。這就是支持向量回歸是SVM在回歸估計問題上的拓展型應用。在本文中,支持向量回歸機被選用以解決癌癥預測的建模過程。下式為不敏感損失函數(shù):iiiiiiiiiyxfyxfyxfxfyxL)(,)()(,0))(,,((2-10)SVR存在線性回歸和非線性回歸兩類情況,這與分類問題是類似的。上式中,對應的實際值和目標輸出值分別表示為y和f(x),輸入值表示為x,不敏感系數(shù)表示為。對于線性SVR,采用函數(shù)(2-11)式:bxwxfT)((2-11)其中偏置向量表示為b,權(quán)向量表示為w,目標函數(shù)表示為f(x)。ya1y1a2y2。。。。。。a3y3K(x1,x)K(x2,x)。。。。。。K(x3,x)x1x2。。。。。。xi
【參考文獻】:
期刊論文
[1]皮膚鱗狀細胞癌轉(zhuǎn)錄組學微陣列分析方法的研究策略及進展[J]. 韓向春,鄭力強,馮志芳,馬靜. 解放軍醫(yī)學雜志. 2019(06)
[2]求解柔性作業(yè)車間調(diào)度問題的多策略融合Pareto人工蜂群算法[J]. 趙博選,高建民,付穎斌,趙姣. 系統(tǒng)工程理論與實踐. 2019(05)
[3]基因治療及細胞治療發(fā)展態(tài)勢分析[J]. 遲培娟,陳芳,Cynthia Liu,Qiongqiong Zhou,Yi Deng,Yingzhu Li,韓濤,余敏,楊艷萍,王學昭. 中國生物工程雜志. 2019(05)
[4]基于功能納米材料的液相生物芯片檢測技術(shù)[J]. 武衛(wèi)杰,冷遠逵,沈夢飛,李萬萬. 化學進展. 2019(Z1)
[5]基因表達數(shù)據(jù)中的局部模式挖掘研究綜述[J]. 姜濤,李戰(zhàn)懷. 計算機研究與發(fā)展. 2018(11)
[6]基于雙層結(jié)構(gòu)的加速K-NN分類方法[J]. 王曉,趙麗. 計算機工程與設(shè)計. 2018(04)
[7]Hybrid artificial bee colony algorithm with variable neighborhood search and memory mechanism[J]. FAN Chengli,FU Qiang,LONG Guangzheng,XING Qinghua. Journal of Systems Engineering and Electronics. 2018(02)
[8]支持向量機模型與應用綜述[J]. 劉方園,王水花,張煜東. 計算機系統(tǒng)應用. 2018(04)
[9]基于改進鄰域搜索策略的人工蜂群算法[J]. 魏鋒濤,岳明娟,鄭建明. 控制與決策. 2019(05)
[10]量子粒子群優(yōu)化的人工蜂群算法[J]. 杜康宇,毛力,毛羽,楊弘,肖煒. 傳感器與微系統(tǒng). 2018(03)
博士論文
[1]支持向量機算法參數(shù)選擇及其在電站鍋爐系統(tǒng)中的應用研究[D]. 黃景濤.浙江大學 2005
碩士論文
[1]基于自組織映射網(wǎng)絡(luò)的多目標粒子群優(yōu)化算法[D]. 郭倩倩.鄭州大學 2018
[2]基于聚類的基因差異共表達分析[D]. 張萍.黑龍江大學 2017
[3]支持向量機在電力系統(tǒng)短期負荷預測中的應用及改進[D]. 李云飛.西南交通大學 2006
本文編號:3339070
本文鏈接:http://www.sikaile.net/yixuelunwen/zlx/3339070.html
最近更新
教材專著