兩種多組DIF檢測方法的比較研究
發(fā)布時(shí)間:2017-11-07 11:08
本文關(guān)鍵詞:兩種多組DIF檢測方法的比較研究
更多相關(guān)文章: 項(xiàng)目功能差異 多組DIF方法 GLR GLord PISA
【摘要】:項(xiàng)目功能差異(DIF)分析作為確保測驗(yàn)公平的環(huán)節(jié)中非常重要的一環(huán),受到了國際上的大量關(guān)注。但是目前對于DIF的研究主要集中于研究適用于檢測兩個群體間的DIF效應(yīng)的方法之上,而隨著大型國際評估項(xiàng)目的興起與盛行,如PISA, TIMSS等,對能夠檢測多個群體間DIF效應(yīng)的方法的需求也隨之增大了。而目前針對于多組DIF方法的研究較少,且不夠深入,。在經(jīng)過文獻(xiàn)分析后發(fā)現(xiàn),還未有多組DIF檢測方法:GLR和GLord卡方方法的模擬比較研究,因此本研究將研究對象確定為這兩種方法。本研究在對DIF的相關(guān)概念及兩組DIF方法進(jìn)行簡要介紹后,回顧了多組DIF檢測方法的發(fā)展過程,然后介紹了GLR和GLord卡方方法的模型與公式。本研究的實(shí)驗(yàn)共包括三個:研究一作為預(yù)實(shí)驗(yàn),簡單比較了GLR和GLord卡方方法及各自對應(yīng)的兩組方法(LR、BLR、Lord卡方、BLord卡方)在多組條件下的檢測情況,研究結(jié)果發(fā)現(xiàn)兩組DIF方法(LR和Lord)的Ⅰ型錯誤膨脹幅度太大,而Bonferroni校正后的BLR和BLord卡方則檢出率太低,兩類方法無論在控制Ⅰ型錯誤率上還是檢出率上,都不如多組方法(GLR和GLord卡方)的結(jié)果,因此在多組DIF檢測時(shí)推薦使用多組方法;研究二是本研究的重點(diǎn),探索GLR和GLord卡方方法的DIF檢測情況。研究發(fā)現(xiàn),兩種方法的Ⅰ型錯誤率都隨樣本量的增加而下降,隨DIF組數(shù)量的增加而升高。在能力分布不等時(shí),兩種方法出現(xiàn)了不同程度的Ⅰ型錯誤膨脹,GLR膨脹的程度更大;而檢出率在能力分布相等和不等時(shí)的變化趨勢是一致的,都隨著樣本量的增加而升高,隨著DIF題目比例和DIF組數(shù)量的增加而呈現(xiàn)先上升后下降的趨勢;研究三則選用PISA2009閱讀素養(yǎng)中的部分?jǐn)?shù)據(jù)(4個國家在29個題目上的作答數(shù)據(jù))比較了GLR和GLord卡方方法的DIF檢測情況。檢測結(jié)果發(fā)現(xiàn),兩種方法檢測出的含有DIF的題目及比例是相同的,測驗(yàn)中檢測出含有DIF的題目比例較大。
【學(xué)位授予單位】:浙江師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:B841
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 康春花;辛濤;;測驗(yàn)理論的新發(fā)展:多維項(xiàng)目反應(yīng)理論[J];心理科學(xué)進(jìn)展;2010年03期
,本文編號:1152140
本文鏈接:http://www.sikaile.net/shekelunwen/xinlixingwei/1152140.html
最近更新
教材專著