內(nèi)存約束下的高維變系數(shù)分位數(shù)回歸模型
發(fā)布時間:2021-03-12 01:29
近年來,統(tǒng)計學研究的熱點集中到高維數(shù)據(jù)分析板塊。從數(shù)據(jù)的維度出發(fā),數(shù)據(jù)的特點可以概括為樣本量極其大,特征數(shù)非常多。分別對應于人們對事物觀測的頻率及數(shù)量增加,角度及渠道增多。這些特征表現(xiàn)在經(jīng)濟、社會、科學中的各個領域,這些領域越來越重視數(shù)據(jù)的作用,其發(fā)展受到數(shù)據(jù)的驅(qū)動。這催促著作為工具的計算機和統(tǒng)計方法需要適應時代的要求。在大數(shù)據(jù)的環(huán)境下,硬件基礎設施,高效的計算方法,統(tǒng)計分析方法是相輔相成的。硬件設施如計算機內(nèi)存,計算機處理能力,獲取數(shù)據(jù)的渠道及儲存數(shù)據(jù)的介質(zhì)等影響著后兩者的方法運用。計算方法決定了進行數(shù)據(jù)分析的時間花費和穩(wěn)定性。統(tǒng)計方法保障了結果的精確性。而事實上,不同統(tǒng)計方法也受制于樣本特征,在高維度海量數(shù)據(jù)中,傳統(tǒng)的優(yōu)良方法往往失效。這些限制給當下的數(shù)據(jù)科學家們帶來挑戰(zhàn)。大規(guī)模的數(shù)據(jù)分析任務往往需要優(yōu)質(zhì)的基礎平臺,快速的計算方法以及相適應的統(tǒng)計學理論加持。然而現(xiàn)實中這類數(shù)據(jù)對計算機處理統(tǒng)計模型造成了阻礙。很多時候,計算機由于內(nèi)存的限制無法處理大規(guī)模的數(shù)據(jù)。這在當下各個領域所方便獲取和廉價儲存的高頻率、高維度數(shù)據(jù)來說是徒勞的,導致無法及時利用總體數(shù)據(jù)中的信息。諸如生物醫(yī)療的數(shù)據(jù),基...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
Chapter 1 Introduction
1.1 Background
1.2 Source and Significance
1.3 Literature Review
1.4 Research Contents and Structure
1.4.1 Research Contents
1.4.2 Thesis Outline
1.5 Brief Summary
Chapter 2 Distributed Processing
2.1 Numerical Optimization Algorithm
2.2 Method in Statistics
2.3 Brief Summary
Chapter 3 Quantile Regression Model
3.1 Quantile Varying Coefficients Regression
3.1.1 General Form
3.1.2 Variable Selection in High-Dimensional Data
3.1.3 Distributed Regression Model under Memory Constraint
3.2 Asymptotic Properties
3.3 Brief Summary
Chapter 4 Empirical Results
4.1 Numerical Simulations
4.2 Real Data Example
4.3 Brief Summary
Conclusions
結論
References
Acknowledgements
本文編號:3077446
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
Chapter 1 Introduction
1.1 Background
1.2 Source and Significance
1.3 Literature Review
1.4 Research Contents and Structure
1.4.1 Research Contents
1.4.2 Thesis Outline
1.5 Brief Summary
Chapter 2 Distributed Processing
2.1 Numerical Optimization Algorithm
2.2 Method in Statistics
2.3 Brief Summary
Chapter 3 Quantile Regression Model
3.1 Quantile Varying Coefficients Regression
3.1.1 General Form
3.1.2 Variable Selection in High-Dimensional Data
3.1.3 Distributed Regression Model under Memory Constraint
3.2 Asymptotic Properties
3.3 Brief Summary
Chapter 4 Empirical Results
4.1 Numerical Simulations
4.2 Real Data Example
4.3 Brief Summary
Conclusions
結論
References
Acknowledgements
本文編號:3077446
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/3077446.html
最近更新
教材專著