高維DNA甲基化數(shù)據(jù)的隨機(jī)森林降維分析
本文關(guān)鍵詞:高維DNA甲基化數(shù)據(jù)的隨機(jī)森林降維分析
更多相關(guān)文章: 關(guān)節(jié)炎 類風(fēng)濕 DNA甲基化 流行病學(xué)方法
【摘要】:目的將隨機(jī)森林算法用于類風(fēng)濕性關(guān)節(jié)炎病例對(duì)照研究的高維甲基化數(shù)據(jù)的分析,并探討應(yīng)用效果。方法實(shí)例數(shù)據(jù)來(lái)自基因表達(dá)數(shù)據(jù)庫(kù)(gene expression omnibus,GEO),檢索號(hào)為GSE42861,包含354名病例、335名對(duì)照,本文選取類風(fēng)濕性關(guān)節(jié)炎相關(guān)基因區(qū)域所在的第9號(hào)染色體,共納入2 433個(gè)胞嘧啶-磷酸-鳥(niǎo)嘌呤雙核苷酸(cytosine-phosphate-guanine pairs of nucleotides,CpGs)位點(diǎn)。利用隨機(jī)森林計(jì)算變量的重要性評(píng)分并排序;對(duì)排序后的變量進(jìn)行逐步隨機(jī)森林過(guò)程,尋找最有可能與結(jié)果存在關(guān)聯(lián)的變量子集;對(duì)降維后的變量子集進(jìn)行逐步Logistic回歸。結(jié)果逐步隨機(jī)森林篩選出80個(gè)重要的CpG位點(diǎn),Logistic回歸模型中有13個(gè)位點(diǎn)具有統(tǒng)計(jì)學(xué)意義。納入這些位點(diǎn)建立Logistic回歸模型,該模型的預(yù)測(cè)正確率達(dá)88.29%。結(jié)論隨機(jī)森林算法可以大大減少噪音變量,提高檢驗(yàn)效能,適用于高維甲基化數(shù)據(jù)分析。
【作者單位】: 南京醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)學(xué)系;
【關(guān)鍵詞】: 關(guān)節(jié)炎 類風(fēng)濕 DNA甲基化 流行病學(xué)方法
【基金】:國(guó)家自然基金(81530088,81473070,81373102,61301251,81402764) 江蘇省高校優(yōu)勢(shì)學(xué)科建設(shè)專項(xiàng)(2014年) 江蘇省高等學(xué)校自然科學(xué)項(xiàng)目(12KJB310003) 江蘇省青藍(lán)工程資助項(xiàng)目(2014年)
【分類號(hào)】:R593.22
【正文快照】:
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 朱晶晶;趙楊;陸鳳;胡志斌;陳峰;;高維肺癌病例-對(duì)照研究資料的隨機(jī)森林降維分析[J];中華預(yù)防醫(yī)學(xué)雜志;2012年09期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 張秋伊;趙楊;魏永越;張汝陽(yáng);陳峰;;高維DNA甲基化數(shù)據(jù)的隨機(jī)森林降維分析[J];中華疾病控制雜志;2016年06期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 錢維;王超;吳騁;許金芳;葉小飛;杜文民;賀佳;;運(yùn)用隨機(jī)森林分析藥品不良反應(yīng)發(fā)生的影響因素[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2013年02期
2 武曉巖;李康;;隨機(jī)森林方法在基因表達(dá)數(shù)據(jù)分析中的應(yīng)用及研究進(jìn)展[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2009年04期
3 李貞子;張濤;武曉巖;李康;;隨機(jī)森林回歸分析及在代謝調(diào)控關(guān)系研究中的應(yīng)用[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2012年02期
4 劉永春;宋弘;;基于隨機(jī)森林的乳腺腫瘤診斷研究[J];電視技術(shù);2014年15期
5 聶斌;王卓;杜建強(qiáng);朱明峰;林劍鳴;艾國(guó)平;熊玲珠;;基于粗糙集和隨機(jī)森林算法輔助糖尿病并發(fā)癥分類研究[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期
6 武曉巖;李康;;基因表達(dá)數(shù)據(jù)判別分析的隨機(jī)森林方法[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2006年06期
7 武曉巖;閆曉光;李康;;基因表達(dá)數(shù)據(jù)的隨機(jī)森林逐步判別分析方法[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2007年02期
8 馬廣立;趙筱萍;程翼宇;;基于隨機(jī)森林與Chemistry Development Kit描述符的P-gp底物識(shí)別[J];高等學(xué);瘜W(xué)學(xué)報(bào);2007年10期
9 苑婕;李曉杰;陳超;宋向崗;王淑美;;基于隨機(jī)森林算法的川芎成分-靶點(diǎn)-疾病網(wǎng)絡(luò)的預(yù)測(cè)研究[J];中國(guó)中藥雜志;2014年12期
10 ;[J];;年期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前7條
1 謝程利;王金橋;盧漢清;;核森林及其在目標(biāo)檢測(cè)中的應(yīng)用[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
2 武曉巖;方慶偉;;基因表達(dá)數(shù)據(jù)分析的隨機(jī)森林方法及算法改進(jìn)[A];黑龍江省第十次統(tǒng)計(jì)科學(xué)討論會(huì)論文集[C];2008年
3 張?zhí)忑?梁龍;王康;李華;;隨機(jī)森林結(jié)合激光誘導(dǎo)擊穿光譜技術(shù)用于的鋼鐵分類[A];中國(guó)化學(xué)會(huì)第29屆學(xué)術(shù)年會(huì)摘要集——第19分會(huì):化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)[C];2014年
4 相玉紅;張卓勇;;組蛋白去乙;敢种苿┑臉(gòu)效關(guān)系研究[A];第十一屆全國(guó)計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年
5 張濤;李貞子;武曉巖;李康;;隨機(jī)森林回歸分析方法及在代謝組學(xué)中的應(yīng)用[A];2011年中國(guó)衛(wèi)生統(tǒng)計(jì)學(xué)年會(huì)會(huì)議論文集[C];2011年
6 馮飛翔;馮輔周;江鵬程;劉菁;劉建敏;;隨機(jī)森林和k-近鄰法在某型坦克變速箱狀態(tài)識(shí)別中的應(yīng)用[A];第八屆全國(guó)轉(zhuǎn)子動(dòng)力學(xué)學(xué)術(shù)討論會(huì)論文集[C];2008年
7 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹(shù)的集合體和后向消除策略去分類P-糖蛋白化合物[A];第十屆全國(guó)計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2009年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 曹正鳳;隨機(jī)森林算法優(yōu)化研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2014年
2 雷震;隨機(jī)森林及其在遙感影像處理中應(yīng)用研究[D];上海交通大學(xué);2012年
3 岳明;基于隨機(jī)森林和規(guī)則集成法的酒類市場(chǎng)預(yù)測(cè)與發(fā)展戰(zhàn)略[D];天津大學(xué);2008年
4 李書(shū)艷;單點(diǎn)氨基酸多態(tài)性與疾病相關(guān)關(guān)系的預(yù)測(cè)及其機(jī)制研究[D];蘭州大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 錢維;藥品不良反應(yīng)監(jiān)測(cè)中隨機(jī)森林方法的建立與實(shí)現(xiàn)[D];第二軍醫(yī)大學(xué);2012年
2 韓燕龍;基于隨機(jī)森林的指數(shù)化投資組合構(gòu)建研究[D];華南理工大學(xué);2015年
3 賀捷;隨機(jī)森林在文本分類中的應(yīng)用[D];華南理工大學(xué);2015年
4 張文婷;交通環(huán)境下基于改進(jìn)霍夫森林的目標(biāo)檢測(cè)與跟蹤[D];華南理工大學(xué);2015年
5 李強(qiáng);基于多視角特征融合與隨機(jī)森林的蛋白質(zhì)結(jié)晶預(yù)測(cè)[D];南京理工大學(xué);2015年
6 朱玟謙;一種收斂性隨機(jī)森林在人臉檢測(cè)中的應(yīng)用研究[D];武漢理工大學(xué);2015年
7 肖宇;基于序列圖像的手勢(shì)檢測(cè)與識(shí)別算法研究[D];電子科技大學(xué);2014年
8 李慧;一種改進(jìn)的隨機(jī)森林并行分類方法在運(yùn)營(yíng)商大數(shù)據(jù)的應(yīng)用[D];電子科技大學(xué);2015年
9 趙亞紅;面向多類標(biāo)分類的隨機(jī)森林算法研究[D];哈爾濱工業(yè)大學(xué);2014年
10 黎成;基于隨機(jī)森林和ReliefF的致病SNP識(shí)別方法[D];西安電子科技大學(xué);2014年
,本文編號(hào):532656
本文鏈接:http://www.sikaile.net/yixuelunwen/nfm/532656.html