零膨脹CMP回歸模型的變量選擇
發(fā)布時間:2022-01-23 10:51
零膨脹計數(shù)模型已在社會經(jīng)濟、醫(yī)療、刑偵研究等諸多領(lǐng)域得以應(yīng)用.零膨脹Conway-Maxwell-Poisson回歸模型作為為常用的零膨脹計數(shù)模型之一可以很好的解決數(shù)據(jù)中出現(xiàn)的過離散與欠離散問題.變量選擇方法可以對大規(guī)?v向數(shù)據(jù)進行處理并從中提取出有用的信息進行統(tǒng)計分析以得到滿意的結(jié)果,其中一類基于懲罰函數(shù)的變量選擇方法受到了統(tǒng)計學者們的廣泛關(guān)注.在已有文獻中,對零膨脹CMP回歸模型的變量選擇方法研究不多.考慮到懲罰廣義估計方程方法在變量選擇等多方面富有準確度與高效性的便利,不需依賴復(fù)雜的聯(lián)合似然函數(shù)計算,還能考慮到數(shù)據(jù)的組間相關(guān)性.因此將該方法應(yīng)用到零膨脹CMP回歸模型中,可以發(fā)揮更多有用的價值.根據(jù)零膨脹CMP回歸模型中離散參數(shù)?會影響均值的特點,本文選擇了改進的ES(Expectation-Solution)算法進行迭代,它包含EM(Expectation Maximization)算法與廣義估計方程方法,優(yōu)勢是可以將不同參數(shù)有針對的區(qū)別對待來分析縱向數(shù)據(jù).基于改進的ES算法,提出模型的變量選擇方法-懲罰廣義估計方程法,即在廣義估計方程中加入滿足大樣本特性的SCAD懲罰函數(shù),配合...
【文章來源】:遼寧師范大學遼寧省
【文章頁數(shù)】:47 頁
【學位級別】:碩士
【部分圖文】:
不同參數(shù)值下CMP分布概率質(zhì)量函數(shù)的變化圖
零膨脹CMP回歸模型的變量選擇261)log(21)()1(log)(112)(1dnmVarpmNNBICnirtititkiti,2)log(21)())1((log)(1122dnyVaryyENNBICnirtitititi.其中inrN,d表示對應(yīng)模型有效參數(shù)的數(shù)目,常使用非零參數(shù)(不包括截距)來預(yù)測d.BIC統(tǒng)計量的值越小,說明模型對實際數(shù)據(jù)的擬合效果越好.選擇出使得BIC準則最小的調(diào)優(yōu)參數(shù)就得出想要的最佳估計.(3)k-折交叉驗證(k-foldCrossValidation,簡稱k-折CV)在文章中出現(xiàn)交叉驗證方法來進行模型選擇的論述最早是在Efron,Morris(1973)[59]中討論的.事實上,交叉驗證方法是一種樣本數(shù)據(jù)分割法,通過重復(fù)循環(huán)使用樣本,實現(xiàn)將樣本數(shù)據(jù)利用率的最大化.利用大部分的樣本來建立模型,再利用剩余小部分樣本對已建立好的模型進行評估.具體的評估方法是:使用建好的模型對剩下樣本進行預(yù)測,并選擇出使殘差平方和最小的模型作為最終的模型.交叉驗證方法的假設(shè)條件比較寬松,只假設(shè)數(shù)據(jù)為相同分布,訓練與測試樣本為獨立的,甚至能夠再放松此假設(shè)條件.因此可以將交叉驗證方法應(yīng)用于幾乎任何框架中的任意算法.與此相比大多數(shù)其他的選擇過程都沒有該普遍性的特質(zhì).此外還注意到,最佳的交叉驗證風險評估并不必是最優(yōu)的模型選擇程序.由Breiman和Spector(1992)[60],留一法能夠使模型得到最佳風險評估,10-折CV方法在模型選擇的結(jié)果表現(xiàn)上更為準確.圖3.110-折交叉驗證示意圖Fig.3.110-foldCrossValidation
【參考文獻】:
期刊論文
[1]零膨脹損失次數(shù)的貝葉斯分位回歸模型[J]. 楊亮,孟生旺. 數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究. 2017(05)
[2]兩類零膨脹負二項回歸模型在汽車保險定價中的應(yīng)用[J]. 徐昕,郭念國. 南陽師范學院學報. 2011(12)
本文編號:3604200
【文章來源】:遼寧師范大學遼寧省
【文章頁數(shù)】:47 頁
【學位級別】:碩士
【部分圖文】:
不同參數(shù)值下CMP分布概率質(zhì)量函數(shù)的變化圖
零膨脹CMP回歸模型的變量選擇261)log(21)()1(log)(112)(1dnmVarpmNNBICnirtititkiti,2)log(21)())1((log)(1122dnyVaryyENNBICnirtitititi.其中inrN,d表示對應(yīng)模型有效參數(shù)的數(shù)目,常使用非零參數(shù)(不包括截距)來預(yù)測d.BIC統(tǒng)計量的值越小,說明模型對實際數(shù)據(jù)的擬合效果越好.選擇出使得BIC準則最小的調(diào)優(yōu)參數(shù)就得出想要的最佳估計.(3)k-折交叉驗證(k-foldCrossValidation,簡稱k-折CV)在文章中出現(xiàn)交叉驗證方法來進行模型選擇的論述最早是在Efron,Morris(1973)[59]中討論的.事實上,交叉驗證方法是一種樣本數(shù)據(jù)分割法,通過重復(fù)循環(huán)使用樣本,實現(xiàn)將樣本數(shù)據(jù)利用率的最大化.利用大部分的樣本來建立模型,再利用剩余小部分樣本對已建立好的模型進行評估.具體的評估方法是:使用建好的模型對剩下樣本進行預(yù)測,并選擇出使殘差平方和最小的模型作為最終的模型.交叉驗證方法的假設(shè)條件比較寬松,只假設(shè)數(shù)據(jù)為相同分布,訓練與測試樣本為獨立的,甚至能夠再放松此假設(shè)條件.因此可以將交叉驗證方法應(yīng)用于幾乎任何框架中的任意算法.與此相比大多數(shù)其他的選擇過程都沒有該普遍性的特質(zhì).此外還注意到,最佳的交叉驗證風險評估并不必是最優(yōu)的模型選擇程序.由Breiman和Spector(1992)[60],留一法能夠使模型得到最佳風險評估,10-折CV方法在模型選擇的結(jié)果表現(xiàn)上更為準確.圖3.110-折交叉驗證示意圖Fig.3.110-foldCrossValidation
【參考文獻】:
期刊論文
[1]零膨脹損失次數(shù)的貝葉斯分位回歸模型[J]. 楊亮,孟生旺. 數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究. 2017(05)
[2]兩類零膨脹負二項回歸模型在汽車保險定價中的應(yīng)用[J]. 徐昕,郭念國. 南陽師范學院學報. 2011(12)
本文編號:3604200
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/3604200.html
最近更新
教材專著