大規(guī)模數(shù)據(jù)下基于充分降維的Leverage重要性抽樣方法
發(fā)布時(shí)間:2021-02-21 08:40
隨著信息技術(shù)的飛速發(fā)展,大規(guī)模數(shù)據(jù)在短時(shí)間內(nèi)搜集并儲(chǔ)存下來,為分析決策提供了巨大的信息量,也給統(tǒng)計(jì)建模帶來了一定難度。對(duì)于樣本容量大、變量個(gè)數(shù)少的數(shù)據(jù),Leverage重要性抽樣是一個(gè)簡(jiǎn)便可行的方法。本文發(fā)現(xiàn),該方法中度量樣本重要性的Leverage分?jǐn)?shù)與因變量無關(guān),而且在維度較大的情形下對(duì)樣本沒有區(qū)分程度,使得估計(jì)結(jié)果較差。為了同時(shí)考慮因變量和維度的影響,本文提出了基于充分降維的Leverage重要性抽樣方法。該方法以不損失信息為前提,在充分降維的空間內(nèi)重新計(jì)算Leverage分?jǐn)?shù),使得抽樣更具有代表性。模擬數(shù)據(jù)分析顯示,在樣本容量較大的復(fù)雜數(shù)據(jù)中,相比于原始的Leverage重要性抽樣方法,本文提出的方法可以降低估計(jì)的均方誤差。三個(gè)實(shí)際數(shù)據(jù)也證實(shí)了該方法的可行性和有效性。
【文章來源】:統(tǒng)計(jì)研究. 2020,37(03)北大核心CSSCI
【文章頁數(shù)】:15 頁
本文編號(hào):3044112
【文章來源】:統(tǒng)計(jì)研究. 2020,37(03)北大核心CSSCI
【文章頁數(shù)】:15 頁
本文編號(hào):3044112
本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/3044112.html
最近更新
教材專著