天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

帶測(cè)量誤差的可加模型的變量選擇

發(fā)布時(shí)間:2020-06-12 11:14
【摘要】:一般的回歸模型,通常假設(shè)解釋變量的觀測(cè)不含有誤差,然而在很多領(lǐng)域的實(shí)際問(wèn)題中,解釋變量往往含有測(cè)量誤差。如果忽略測(cè)量誤差的影響,可能會(huì)使統(tǒng)計(jì)推斷出現(xiàn)巨大偏差,得出的結(jié)論與真實(shí)情況出入較大,因而近年來(lái),測(cè)量誤差問(wèn)題方面的研究受到廣泛關(guān)注。另一方面,可加模型因其不受函數(shù)形式限制的靈活性,常被應(yīng)用于多類問(wèn)題中。本文研究的重點(diǎn),即是在可加模型的框架下,考慮存在測(cè)量誤差問(wèn)題時(shí)如何進(jìn)行模型估計(jì)以及變量選擇。首先文章基于現(xiàn)有的研究情況,簡(jiǎn)單總結(jié)了測(cè)量誤差模型的基本概念和基本方法,進(jìn)而介紹了處理部分線性測(cè)量誤差模型的思想。為了將這一思想進(jìn)行推廣,文章補(bǔ)充了B樣條和群組變量選擇的理論基礎(chǔ)。然后在此之上進(jìn)行了靈活應(yīng)用,在含測(cè)量誤差的可加模型中使用了B樣條基擬合,將非參數(shù)模型轉(zhuǎn)變?yōu)榫性形式。接著結(jié)合最小二乘方法構(gòu)造了新的目標(biāo)函數(shù),同時(shí)重新定義其中的變量使問(wèn)題簡(jiǎn)化,并利用泰勒展開(kāi)方法進(jìn)行了推導(dǎo),從而完成了式子的化簡(jiǎn)以及對(duì)測(cè)量誤差的修正。最后加上懲罰項(xiàng)進(jìn)行群組變量選擇,通過(guò)坐標(biāo)下降算法迭代求解。之后通過(guò)一系列的模擬研究,分別在自變量之間是否存在相關(guān)性,還有因變量是否對(duì)自變量的變化敏感的情況下,從模型估計(jì)精確度和變量選擇準(zhǔn)確度兩個(gè)方面,對(duì)是否修正了測(cè)量誤差的模型,以及不同的群組變量選擇方法進(jìn)行了對(duì)比。模擬結(jié)果表明,使用了本文所提出的誤差校準(zhǔn)和群組變量選擇方法處理可加模型中的測(cè)量誤差和變量選擇問(wèn)題,得到的模型的估計(jì)精度有所改進(jìn),同時(shí)有利于正確選擇有效變量以及剔除無(wú)關(guān)變量,且群組SCAD方法整體優(yōu)于群組Lasso。最后將本文的方法應(yīng)用到了一份自變量存在測(cè)量誤差的實(shí)際數(shù)據(jù)中,在進(jìn)行變量選擇的同時(shí)建立了脂肪中的熱量關(guān)于各自變量的可加模型。
【圖文】:

測(cè)量誤差,函數(shù)模型,自變量,方差


在測(cè)量誤差問(wèn)題中,如果不懫用合理的模型進(jìn)行處理,容易對(duì)分析結(jié)果帶來(lái)嚴(yán)逡逑重的影響。舉個(gè)例子,考慮一個(gè)響應(yīng)變量y關(guān)于解釋變量X的回歸,X是[-2,2]逡逑上的均勻分布,r的均值為sin(2X),方差為4邋=邋0.10。在圖2.1的上部,我模擬逡逑了邋200個(gè)該模型的觀測(cè)值,從圖中可以清晰地看出正弦曲線的樣子。另外,假設(shè)觀逡逑測(cè)值為W而不是X,其中W服從均值為X,方差為4/9的正態(tài)分布。在圖2.1的下逡逑方,我對(duì)F與觀測(cè)到的W的數(shù)據(jù)同樣繪制了散點(diǎn)圖。可以看到此時(shí)正弦曲線不再逡逑明顯,數(shù)據(jù)的特征被觀測(cè)誤差所掩蓋。為了避免類似問(wèn)題出現(xiàn),測(cè)量誤差模型上逡逑的研宄就顯得十分重要。逡逑測(cè)量誤差模型有兩種基本的分類方式。從自變量的假設(shè),即數(shù)據(jù)結(jié)構(gòu)的角度逡逑出發(fā),測(cè)量誤差模型可以分為函數(shù)模型(ftmctional邋modeling)和結(jié)構(gòu)模型(structural逡逑modeling)^邋0逡逑?函數(shù)模型:自變量X是固定的,或者隨機(jī)變量,后者的分布沒(méi)有被建模。這逡逑7逡逑

測(cè)量誤差,方差,均值


的關(guān)鍵在于測(cè)量誤差的分布決定了測(cè)量誤差產(chǎn)生的影響,因而用來(lái)修正測(cè)量誤差影逡逑響的恰當(dāng)?shù)姆椒ㄈQ于測(cè)量誤差的分布。逡逑在圖2.2中,左側(cè)部分的(X,Y)是由模型¥=燉+N嫌鄭恫,其中\的伭x暇礜希劍,,分v睿村澹藉澹,簿彫观测误差,模型斜率&邋=邋1,截距l(xiāng)M=0,誤差項(xiàng)逡逑e均值為0,方差4=0.25。右側(cè)部分的橫坐標(biāo)則為W,其中\V邋=邋X邋+邋U,且U逡逑是獨(dú)立于X,均值0方差4邋=邋1的測(cè)量誤差?梢钥吹阶髨D中(X,Y)的點(diǎn)更加緊逡逑密地分散在一條直線附近,而右圖中含測(cè)量誤差的數(shù)組(W,Y)的分布則更為不穩(wěn)逡逑定,不易看出其線性的特征,且其擬合的直線傾斜程度也比左圖的小。逡逑關(guān)于測(cè)量誤差對(duì)圖中擬合直線斜率的影響,我們可以通過(guò)理論上的簡(jiǎn)單計(jì)算逡逑來(lái)解釋。實(shí)際上,Y關(guān)于W的線性回歸的最小二乘解不
【學(xué)位授予單位】:廈門(mén)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F224

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 ;L_(1/2) regularization[J];Science China(Information Sciences);2010年06期



本文編號(hào):2709451

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/jingjiguanlilunwen/2709451.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶86eba***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com