高維多重共線性數(shù)據(jù)特征篩選
發(fā)布時間:2021-04-16 23:58
隨著信息技術(shù)的不斷發(fā)展,在金融、氣象預(yù)測、基因研究等一些領(lǐng)域中,統(tǒng)計學(xué)家常能夠收集到高維數(shù)據(jù)。但由于維數(shù)過高,傳統(tǒng)的統(tǒng)計分析方法和變量選擇方法變得不再穩(wěn)健和難以適用。并且還有其他的難題需要去克服,例如當誤差分布為厚尾分布時,它們的效率都普遍較低甚至它們會變得無法適用;還有當自變量間存在嚴重的多重共線性時,這也會嚴重干擾到變量選擇方法的篩選效果。為了克服多重共線性,本文突破性地提出能夠應(yīng)對存在多重共線性高維線性數(shù)據(jù)的穩(wěn)健的高維特征篩選法。本文的主要工作如下:第一章闡述了在面臨高維數(shù)據(jù)時變量篩選的研究現(xiàn)狀與歷史,并且對一些常用特征篩選方法進行了回顧和學(xué)習(xí),最后對本文的內(nèi)容安排和創(chuàng)新點進行了說明。第二章中提出一種針對多重共線性的高維特征篩選法,可處理存在多重共線性這類型的高維數(shù)據(jù)。當下很多針對高維線性模型的研究都是基于單一的邊際效應(yīng)下進行的,變量的篩選依賴于變量之間相互獨立,這使得當存在變量間存在多重共線性時可能導(dǎo)致變量篩選的不穩(wěn)定性,本文通過引入凈效應(yīng)的這一概念,讓自變量的凈效應(yīng)替代其邊際效應(yīng),提出一種基于全局影響的特征篩選方法,這使得其篩選方法的適用范圍更廣,并進一步通過證明得到了確定篩...
【文章來源】:江西師范大學(xué)江西省
【文章頁數(shù)】:33 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及現(xiàn)狀
1.1.1 超高維特征篩選
1.1.2 多重共線性
1.2 常用特征篩選方法概述
1.2.1 SIS方法
1.2.2 DC-SIS方法
1.3 本文主要內(nèi)容及創(chuàng)新點
2 高維多重共線性型數(shù)據(jù)的變量篩選研究
2.1 引言
2.2 篩選方法與理論研究
2.2.1 篩選方法
2.2.2 理論性質(zhì)
2.3 定理證明
3 數(shù)值模擬與實例分析
3.1 數(shù)值模擬
3.2 實例分析
4 總結(jié)與展望
4.1 研究總結(jié)
4.2 研究展望
參考文獻
致謝
本文編號:3142411
【文章來源】:江西師范大學(xué)江西省
【文章頁數(shù)】:33 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及現(xiàn)狀
1.1.1 超高維特征篩選
1.1.2 多重共線性
1.2 常用特征篩選方法概述
1.2.1 SIS方法
1.2.2 DC-SIS方法
1.3 本文主要內(nèi)容及創(chuàng)新點
2 高維多重共線性型數(shù)據(jù)的變量篩選研究
2.1 引言
2.2 篩選方法與理論研究
2.2.1 篩選方法
2.2.2 理論性質(zhì)
2.3 定理證明
3 數(shù)值模擬與實例分析
3.1 數(shù)值模擬
3.2 實例分析
4 總結(jié)與展望
4.1 研究總結(jié)
4.2 研究展望
參考文獻
致謝
本文編號:3142411
本文鏈接:http://www.sikaile.net/shoufeilunwen/benkebiyelunwen/3142411.html
最近更新
教材專著