語言學(xué)定量研究中的穩(wěn)健統(tǒng)計(jì)方法
【圖文】:
圖1:標(biāo)準(zhǔn)正態(tài)分布和污染正態(tài)分布征的任一參數(shù),記作θ(F)。Fε是另一個(gè)分布,與分布F的柯爾莫可洛夫距離(Kolmogorovdistance,兩個(gè)分布最大差異絕對(duì)值)為ε。使θ(Fε)任意變大或變小的最小值ε即為θ的崩潰點(diǎn)。常用的總體平均數(shù)μ和標(biāo)準(zhǔn)差σ的崩潰點(diǎn)為0。估計(jì)量X(樣本平均數(shù))和s(樣本標(biāo)準(zhǔn)差)的有限樣本崩潰點(diǎn)(finitesamplebreakdownpoint)是1/n(n是樣本量),即一個(gè)異常值就可能會(huì)使它們?nèi)我庾兇蠡蜃冃Q句話說,μ、σ及其估計(jì)量X和s不具有穩(wěn)健性。當(dāng)小幅度偏離正態(tài)分布導(dǎo)致σ膨脹時(shí),基于樣本平均數(shù)的常規(guī)統(tǒng)計(jì)檢驗(yàn)方法(如t檢驗(yàn)和方差分析)就會(huì)喪失統(tǒng)計(jì)分析的有效性。使用平均數(shù)的另外一個(gè)問題是,當(dāng)數(shù)據(jù)分布偏離正態(tài)時(shí),μ可能偏向分布的尾巴,樣本平均數(shù)X不能很好地反映典型的被試特征會(huì)是什么樣子。在此情況下,平均數(shù)失去了應(yīng)有的價(jià)值。為了便于理解數(shù)據(jù)分布的變化對(duì)統(tǒng)計(jì)結(jié)果的影響,下面通過模擬方法探討在正態(tài)分布和污染正態(tài)分布(contaminatednormaldistribution)情況下采用獨(dú)立樣本t檢驗(yàn)的統(tǒng)計(jì)效力。圖1比較標(biāo)準(zhǔn)正態(tài)分布和污染正態(tài)分布曲線。圖1中的左分圖顯示μ1=0和σ1=1的標(biāo)準(zhǔn)正態(tài)分布,右圖為μ2=0和σ2=3.3的污染正態(tài)分布(即由一個(gè)平均數(shù)為0、標(biāo)準(zhǔn)差為1、概率為0.9的標(biāo)準(zhǔn)正態(tài)分布與平均數(shù)為0、標(biāo)準(zhǔn)差為10、概率為0.1的正態(tài)分布混合而成)。橫坐標(biāo)為隨機(jī)變量值,縱坐標(biāo)為概率密度值。這兩幅圖都是對(duì)稱的,且為鐘形(bell-shaped)。除了標(biāo)準(zhǔn)正態(tài)分布峰頂比污染正態(tài)分布稍陡峭外,幾乎看不出其他區(qū)別,因?yàn)閳D中這兩個(gè)分布的柯爾莫可洛夫距離為0.04。但是,污染正態(tài)分布為重尾巴分布,小幅度地偏離標(biāo)準(zhǔn)正態(tài)分布使方差增至10.9。假設(shè)有兩個(gè)正態(tài)分布總體,一個(gè)總體的μ1
?,11,8,9,10,10,11,10,8,5,10,11,9,12,8,12,8,10;組二(T2):9,8,9,8,7,8,9,6,7,7,8,5,9,9,8,9,8,4,4,6,8,,4,7,6,7,6,7,8,4,8;組三(T3):9,5,8,7,8,13,6,9,6,10,7,6,14,5,8,7,17,6,22,11,6,13,7,6,10,8,6,7,8,5。3.2.1數(shù)據(jù)分布性質(zhì)診斷本例在實(shí)驗(yàn)設(shè)計(jì)和因變量的性質(zhì)上似乎適合使用常規(guī)的單因素方差分析。但是,常規(guī)的方差分析要求因變量數(shù)據(jù)滿足正態(tài)分布和方差齊性假設(shè),因此在開展推理統(tǒng)計(jì)之前,需要診斷數(shù)據(jù)分布的性質(zhì)。圖2是利用以上三組數(shù)據(jù)繪制的小提琴圖(violinplot)。小提琴圖由箱圖(boxplot)與核密度圖(kerneldensityplot)組合而成。兩個(gè)對(duì)稱的核密度圖置于箱圖2:三組數(shù)據(jù)分布小提琴圖·24·
【作者單位】: 南京工業(yè)大學(xué)外國(guó)語言文學(xué)學(xué)院;
【基金】:國(guó)家社科基金項(xiàng)目“英語語言學(xué)研究生實(shí)驗(yàn)研究能力系統(tǒng)評(píng)價(jià)研究”(編號(hào):13BYY079) 南京工業(yè)大學(xué)哲學(xué)社會(huì)科學(xué)科研創(chuàng)新團(tuán)隊(duì)資助項(xiàng)目(編號(hào):SKTD201505),南京工業(yè)大學(xué)高等教育發(fā)展專項(xiàng)(編號(hào):HED2016013)的階段性成果
【分類號(hào)】:H08
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 蘇新春;漢語詞匯定量研究的運(yùn)用及其特點(diǎn)——兼談《語言學(xué)方法論》的定量研究觀[J];廈門大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2001年04期
2 張少林;;效應(yīng)幅度:外語定量研究不能忽視的測(cè)度值[J];外語教學(xué)理論與實(shí)踐;2009年03期
3 魏日寧;;再談外語定量研究中的效應(yīng)幅度[J];現(xiàn)代外語;2012年04期
4 李德鵬;;定量研究的反思與重構(gòu)——以語言學(xué)為例[J];社會(huì)科學(xué)研究;2013年03期
5 沈榕秋;談漢語方言的定量研究[J];語文研究;1994年02期
6 梅晴;;語言教育研究中的定量與定性的研究方法[J];考試周刊;2010年29期
7 龔嶸;;二/外語教育研究范式的哲學(xué)思考:定性與定量研究設(shè)計(jì)決策的交互制約[J];外語教學(xué)理論與實(shí)踐;2013年03期
8 李鳳蘭;;來華巴基斯坦留學(xué)生漢語學(xué)習(xí)與自我認(rèn)同變化定量研究[J];經(jīng)營(yíng)管理者;2014年05期
9 鄺霞;“有沒有”反復(fù)問句的定量研究——對(duì)經(jīng)典作家白話文作品的定量研究[J];漢語學(xué)習(xí);2000年03期
10 姚霖霜;闕紫江;;淺談異化論與歸化論的困境和出路[J];外語教育;2003年00期
相關(guān)碩士學(xué)位論文 前1條
1 邢杰;翻譯研究中的定性與定量研究[D];廣東外語外貿(mào)大學(xué);2006年
本文編號(hào):2553203
本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanyishu/2553203.html