若干模型的分位數變量選擇
本文關鍵詞:若干模型的分位數變量選擇
更多相關文章: 分位數回歸 變量選擇 計數數據 自適應LASSO PNSIM
【摘要】:分位數回歸和變量選擇方法LASSO提出以來,由于其穩(wěn)定的估計,優(yōu)良的估計效率得到了廣泛應用.分位數回歸能夠從不同角度分析數據,變量選擇的提出使模型具有了處理高維數據的能力.本文主要研究在復雜情況下的分位數回歸變量選擇,即醫(yī)療費用數據和離散數據.由于個體觀察的相關性以及分布不連續(xù)導致針對以上兩種數據進行分位數回歸以及變量選擇相對困難.本文根據學者在該領域的相關研究,提出了針對以上兩種特殊數據進行分位數回歸以及變量選擇的方法,并驗證其有效性.對于醫(yī)療費用數據,采用部分非線性單指標模型(PNSIM)進行建模,并采用兩步法進行系數估計和變量選擇.第一步采用基于樣條的兩步估計方法對模型的非參數部分進行估計,當非參數可加部分為階可導時,使用樣條方法得到的估計量以的速度收斂.并且該方法能夠解決維數禍根問題.第二步在求得非參數部分的估計后,再進行系數估計以及變量選擇.部分非線性單指標模型具有良好的靈活性,具有以往提出模型的大部分優(yōu)點.對于離散數據,通過構造連續(xù)隨機變量,使其分位數與響應變量分位數一一對應,進而能夠使用傳統(tǒng)分位數方法進行處理,并在此基礎上進行變量選擇.本文按照如下結構展開.第一章為文獻綜述,介紹近年來該領域的發(fā)展以及相關學者的研究.并且介紹本文的研究內容和創(chuàng)新之處.第二章的重點在于使用部分非線性單指標模型對醫(yī)療費用數據進行建模,運用基于樣條的估計方法對可加模型的非參數部分進行估計,并且在此基礎上進行系數的估計以及變量選擇,本文在這里采用自適應LASSO懲罰項進行變量選擇.章節(jié)最后給出相應的迭代方法,模擬,實例分析以及相關漸近性質的證明.第三章的重點在于對離散數據進行分位數回歸變量選擇.通過對響應變量進行恰當的處理,使傳統(tǒng)分位數回歸方法能夠應用到離散數據.在此基礎上再進行變量選擇.本章最后給出相應的模擬,以驗證提出方法的有效性.迭代算法和相關漸近性質的證明亦在文中給出.第四章給出本文總結,以及未來可能的研究方向.綜上,本文主要介紹對醫(yī)療費用數據用部分非線性單指標模型(PNSIM)進行建模.對于離散數據,將其進行轉換處理后再進行自適應LASSO變量選擇.文中給出的估計量均具有良好的性質,并且避免了維數禍根的問題,對于處理高維解釋變量具有一定的優(yōu)越性.從計算效率來看,第二章中的非參數部分的估計最終轉化為對相關線性模型的求解,避免了多次迭代,極大的提高了運算速度.
【關鍵詞】:分位數回歸 變量選擇 計數數據 自適應LASSO PNSIM
【學位授予單位】:浙江財經大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:O212.1
【目錄】:
- 摘要5-7
- abstract7-10
- 第一章 緒論10-14
- 第一節(jié) 研究背景及意義10-11
- 第二節(jié) 文獻綜述11-13
- 第三節(jié) 論文簡介及創(chuàng)新之處13-14
- 第二章 部分非線性單指標模型的分位數回歸及其變量選擇14-35
- 第一節(jié) 部分非線性單指標模型14
- 第二節(jié) 部分非線性單指標模型(PNSIM)分位數回歸14-19
- 第三節(jié) 估計量的漸近性質19-20
- 第四節(jié) 部分非線性單指標模型的變量選擇20-21
- 第五節(jié) 模擬21-27
- 第六節(jié) 實例分析27-30
- 第七節(jié) 總結30
- 第八節(jié) 定理證明30-35
- 第三章 離散數據分位數回歸變量選擇35-42
- 第一節(jié) 離散數據的分位數回歸35-36
- 第二節(jié) 離散數據的分位數變量選擇36-37
- 第三節(jié) 離散數據分位數變量選擇算法37-38
- 第四節(jié) 模擬38-39
- 第五節(jié) 本章小結39
- 第六節(jié) 定理證明39-42
- 第四章 結論與展望42-43
- 參考文獻43-47
- 附錄47-48
- 致謝48-49
【相似文獻】
中國期刊全文數據庫 前10條
1 楊麗霞;魏立力;;基于粗糙集方法的有序尺度變量選擇[J];寧夏大學學報(自然科學版);2009年02期
2 趙宇;黃思明;;帶有變量選擇過程的分類模型誤差分析[J];數學的實踐與認識;2010年17期
3 樊亞莉;徐群芳;;穩(wěn)健的變量選擇方法及其應用[J];上海理工大學學報;2013年03期
4 陶靖軒;多元分析中的變量選擇問題研究[J];中國計量學院學報;2001年01期
5 李樹軍,紀宏金;對應聚類分析與變量選擇[J];地球物理學進展;2005年03期
6 陳黎明;趙永紅;;轉換函數未知時轉換模型的變量選擇[J];四川大學學報(自然科學版);2011年05期
7 劉民千,張潤楚;超飽和設計的變量選擇[J];南開大學學報(自然科學版);2000年03期
8 王進;;聚類分析中的距離與變量選擇[J];山西財經大學學報;2007年S1期
9 張波;方國斌;;高維面板數據降維與變量選擇方法研究[J];統(tǒng)計與信息論壇;2012年06期
10 高仁祥,張世英,劉豹;基于神經網絡的變量選擇方法[J];系統(tǒng)工程學報;1998年02期
中國重要會議論文全文數據庫 前6條
1 張俊華;方偉武;;調查表分析中變量選擇的一些方法(英文)[A];中國運籌學會第六屆學術交流會論文集(下卷)[C];2000年
2 李洪東;梁逸曾;;高維數據變量選擇新方法研究[A];中國化學會第27屆學術年會第15分會場摘要集[C];2010年
3 李慷;席裕庚;;復雜過程系統(tǒng)中操作變量選擇與定位的方法研究[A];1993年控制理論及其應用年會論文集[C];1993年
4 云永歡;王為婷;梁逸曾;;迭代的保留有信息變量來篩選最佳變量子集的一種多元校正變量選擇方法[A];中國化學會第29屆學術年會摘要集——第19分會:化學信息學與化學計量學[C];2014年
5 徐登;范偉;梁逸曾;;紫外光譜結合變量選擇和偏最小二乘回歸同時測定水中重金屬鎘、鋅、鈷[A];中國化學會第29屆學術年會摘要集——第19分會:化學信息學與化學計量學[C];2014年
6 梁逸曾;李洪東;許青松;曹東升;張志敏;;灰色化學建模與模型集群分析——兼論過擬合、穩(wěn)健估計、變量選擇與模型評價[A];中國化學會第27屆學術年會第15分會場摘要集[C];2010年
中國博士學位論文全文數據庫 前10條
1 王大榮;分散度量模型中的變量選擇[D];北京工業(yè)大學;2009年
2 王明秋;高維數據下若干回歸模型的變量選擇問題研究[D];大連理工大學;2012年
3 劉吉彩;生存數據統(tǒng)計模型的變量選擇方法[D];華東師范大學;2014年
4 樊亞莉;穩(wěn)健變量選擇方法的若干問題研究[D];復旦大學;2013年
5 唐凱臨;變量選擇和變換的新方法研究[D];同濟大學;2008年
6 董瑩;高維共線性統(tǒng)計模型的參數估計與變量選擇[D];大連理工大學;2014年
7 葉飛;相對誤差準則下的估計理論和變量選擇方法的研究[D];清華大學;2013年
8 袁晶;貝葉斯方法在變量選擇問題中的應用[D];山東大學;2013年
9 王樹云;基于Bayes方法和圖限制下正規(guī)化方法的變量選擇問題及其在基因組數據中的應用[D];山東大學;2010年
10 姬永剛;分位數回歸中的貝葉斯變量選擇[D];東北師范大學;2012年
中國碩士學位論文全文數據庫 前10條
1 趙冬琦;基于變量選擇的股指期貨對股票市場影響的實證研究[D];蘭州大學;2015年
2 程勇;多水平模型的變量選擇在農戶人均收入數據中的應用[D];云南財經大學;2015年
3 鄧秋玲;SCAD和ADS方法在比例風險模型中的應用[D];廣西大學;2015年
4 韋新星;幾種變量選擇方法在Cox模型中的應用[D];廣西大學;2015年
5 王唯;部分線性模型的變量選擇問題研究[D];湘潭大學;2015年
6 徐國盛;若干模型的分位數變量選擇[D];浙江財經大學;2016年
7 閆闖;多元回歸模型中變量選擇問題研究[D];黑龍江大學;2011年
8 康贊亮;計量經濟學模型變量選擇與設定的理論方法研究[D];清華大學;2009年
9 張丹;乘積模型的變量選擇[D];河南大學;2014年
10 郝亞楠;基于L_2-Fused Lasso變量選擇方法的性質及應用研究[D];北京交通大學;2014年
,本文編號:1067435
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/1067435.html