高維線性回歸算法比較研究
發(fā)布時(shí)間:2021-12-11 22:58
在大數(shù)據(jù)時(shí)代,高維數(shù)據(jù)廣泛呈現(xiàn)在生物信息,金融經(jīng)濟(jì)和圖像處理等領(lǐng)域,其共同特征之一是預(yù)測變量具有稀疏性.選擇最相關(guān)的預(yù)測變量是高維數(shù)據(jù)分析的主要研究內(nèi)容之一,具有極其重要的應(yīng)用價(jià)值.為此,針對壓縮感知和變量選擇問題的高維線性回歸算法成為學(xué)者們研究的焦點(diǎn),許多快速、有效的算法被相繼提出,為解決壓縮感知和變量選擇問題提供了諸多幫助,值得我們深入探討和仔細(xì)研究.本文從解決壓縮感知,變量選擇問題中的不同模型角度,對目前流行的高維線性回歸算法進(jìn)行比較研究.在對現(xiàn)存算法特點(diǎn)進(jìn)行總結(jié)的前提下,深入地研究算法的精度和效率等重要特性.依托現(xiàn)存的牛頓算法,在此基礎(chǔ)上細(xì)化了牛頓算法的框架和參數(shù)選取,使其達(dá)到更好的數(shù)值效果,同時(shí)提出了未知稀疏度下的自適應(yīng)牛頓算法,并比較了基于解的差異原則,殘量差異原則和HBIC對稀疏度選取的效果.大量的數(shù)值實(shí)驗(yàn)表明,本文細(xì)化的牛頓算法在精度和速度上均優(yōu)于目前在壓縮感知和變量選擇領(lǐng)域公認(rèn)的算法,同時(shí),本文提出的自適應(yīng)牛頓算法在精度上也超過了該領(lǐng)域公認(rèn)的算法.在此基礎(chǔ)上,我們開發(fā)了一個(gè)MATLAB軟件包.
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
四種非凸懲罰函數(shù)圖像(左)和其對應(yīng)的閱值函數(shù)(右)
圖4.1?展示了?稀疏度S對snafix,?snaarm,?SDAR,?MCP,?FoBa,?SP,?HTP,?GrLARS完全準(zhǔn)確恢復(fù)支撐集Y概率的影響.?dāng)?shù)據(jù)集設(shè)置為:(n?=?51000,S?=?10?:?50?:?360,cr?=?l,p?=?0.7,尺=10).其中?10?:?50?:?360?表S以50為間隔從10增加到360.我們可以看到隨著稀疏度S的增加,所有現(xiàn)都在變差.然而,snafix和SDAR隨著稀疏度的增加普遍比其他方,當(dāng)S?=?260時(shí),這兩種算法的表現(xiàn)遠(yuǎn)好于其它算法.從圖4.2中可以看出,言,snafix和SDAR大多數(shù)時(shí)候都是最快的.??31??
圖4.1?展示了?稀疏度S對snafix,?snaarm,?SDAR,?MCP,?FoBa,?SP,?HTP,?GrLARS完全準(zhǔn)確恢復(fù)支撐集Y概率的影響.?dāng)?shù)據(jù)集設(shè)置為:(n?=?51000,S?=?10?:?50?:?360,cr?=?l,p?=?0.7,尺=10).其中?10?:?50?:?360?表S以50為間隔從10增加到360.我們可以看到隨著稀疏度S的增加,所有現(xiàn)都在變差.然而,snafix和SDAR隨著稀疏度的增加普遍比其他方,當(dāng)S?=?260時(shí),這兩種算法的表現(xiàn)遠(yuǎn)好于其它算法.從圖4.2中可以看出,言,snafix和SDAR大多數(shù)時(shí)候都是最快的.??31??
【參考文獻(xiàn)】:
期刊論文
[1]高維模型選擇方法綜述[J]. 李根,鄒國華,張新雨. 數(shù)理統(tǒng)計(jì)與管理. 2012(04)
本文編號:3535550
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
四種非凸懲罰函數(shù)圖像(左)和其對應(yīng)的閱值函數(shù)(右)
圖4.1?展示了?稀疏度S對snafix,?snaarm,?SDAR,?MCP,?FoBa,?SP,?HTP,?GrLARS完全準(zhǔn)確恢復(fù)支撐集Y概率的影響.?dāng)?shù)據(jù)集設(shè)置為:(n?=?51000,S?=?10?:?50?:?360,cr?=?l,p?=?0.7,尺=10).其中?10?:?50?:?360?表S以50為間隔從10增加到360.我們可以看到隨著稀疏度S的增加,所有現(xiàn)都在變差.然而,snafix和SDAR隨著稀疏度的增加普遍比其他方,當(dāng)S?=?260時(shí),這兩種算法的表現(xiàn)遠(yuǎn)好于其它算法.從圖4.2中可以看出,言,snafix和SDAR大多數(shù)時(shí)候都是最快的.??31??
圖4.1?展示了?稀疏度S對snafix,?snaarm,?SDAR,?MCP,?FoBa,?SP,?HTP,?GrLARS完全準(zhǔn)確恢復(fù)支撐集Y概率的影響.?dāng)?shù)據(jù)集設(shè)置為:(n?=?51000,S?=?10?:?50?:?360,cr?=?l,p?=?0.7,尺=10).其中?10?:?50?:?360?表S以50為間隔從10增加到360.我們可以看到隨著稀疏度S的增加,所有現(xiàn)都在變差.然而,snafix和SDAR隨著稀疏度的增加普遍比其他方,當(dāng)S?=?260時(shí),這兩種算法的表現(xiàn)遠(yuǎn)好于其它算法.從圖4.2中可以看出,言,snafix和SDAR大多數(shù)時(shí)候都是最快的.??31??
【參考文獻(xiàn)】:
期刊論文
[1]高維模型選擇方法綜述[J]. 李根,鄒國華,張新雨. 數(shù)理統(tǒng)計(jì)與管理. 2012(04)
本文編號:3535550
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/3535550.html
最近更新
教材專著