敏感問題9種RRT模型下(分層)二階段抽樣調查設計的統(tǒng)計方法及其應用
本文關鍵詞:敏感問題9種RRT模型下(分層)二階段抽樣調查設計的統(tǒng)計方法及其應用
更多相關文章: 敏感問題 隨機應答技術(RRT) 艾滋病 (分層)二階段抽樣 樣本大小
【摘要】:目的: 敏感問題由于具有高度私人機密性或不便在公開場合表態(tài)和陳述,若采用直接詢問等傳統(tǒng)的調查方式,會產(chǎn)生無應答偏倚或故意說謊偏倚。為了提高敏感問題的正確應答率,國內外統(tǒng)計學家研究開發(fā)出了一系列關于敏感問題調查的隨機應答技術(Randomized Response Technique, RRT)模型。 目前,國內外研究較多的敏感問題類型為二項選擇敏感問題和數(shù)量特征敏感問題,而對于多項選擇敏感問題較少關注;研究較多的敏感問題抽樣調查的統(tǒng)計方法主要局限于簡單隨機抽樣,實際應用也主要局限于小范圍特殊人群小樣本的簡單隨機抽樣調查,或在大規(guī)模調查中將復雜抽樣調查方法獲取的敏感問題資料誤用簡單隨機抽樣調查有關公式來統(tǒng)計分析;抽樣調查是重要的研究方法,抽樣設計是抽樣調查的關鍵,樣本大小的估計是抽樣設計的重要環(huán)節(jié)。但關于敏感問題隨機應答模型在各種復雜抽樣方法下各階段樣本大小的估計,目前相關文獻仍較少見。有鑒于此,本文擬對9種隨機應答模型與二階段抽樣及分層二階段抽樣2種抽樣方法組合的共18種調查方法,在給出敏感問題特征相關統(tǒng)計量計算公式的基礎上,當限定抽樣誤差的大小使調查費用達到最小及限定調查費用的大小使抽樣誤差達到最小兩種情況下,推導出估計敏感問題特征總體比例及總體均數(shù)時的最優(yōu)樣本大小計算公式,為適用于各類型敏感問題較大規(guī);虼笠(guī)模調查的復雜抽樣方法提供了科學的樣本大小估計公式;通過對北京市男同性戀人群敏感問題特征的初步調查分析,為掌握北京市性病、艾滋病的流行趨勢提供了初步的數(shù)據(jù),并估計出樣本大小計算公式中的有關統(tǒng)計量的數(shù)值;針對本團隊擬于2013年開展的國家自然科學基金項目《敏感問題高危人群基數(shù)調查估計的統(tǒng)計方法及其應用》(編號:81273188)研究中北京市男同性戀人群基數(shù)及敏感問題特征的二階段與分層二階段抽樣調查,按本文所推導的計算公式估計出各層各階段的樣本大小,完成該國家自然科學基金項目研究中的調查設計;對科學估計艾滋病高危人群基數(shù)及敏感問題的特征提供統(tǒng)計方法,為有關部門制訂性病、艾滋病預防控制規(guī)劃、措施提供科學依據(jù)。 方法: 一、對二項選擇敏感問題Warner隨機應答模型、二項選擇敏感問題Simmons隨機應答模型、二項選擇敏感問題雙無關問題模型和二項選擇敏感問題改進的隨機應答模型,多項選擇敏感問題單一樣本隨機應答模型、多項選擇敏感問題隨機間接應答模型以及數(shù)量特征敏感問題無關聯(lián)問題模型、數(shù)量特征敏感問題加法模型、數(shù)量特征敏感問題乘法模型9種隨機應答模型,與二階段抽樣、分層二階段抽樣2種抽樣方法組合的共18種調查方法,根據(jù)Cochran的經(jīng)典抽樣理論、全概率公式、均數(shù)的基本性質、方差的基本性質等概率論與數(shù)理統(tǒng)計學理論方法,給出了敏感問題總體比例、總體均數(shù)的估計量及其估計方差的計算公式。 二、分別對以上18種調查方法,在限定抽樣誤差的大小使調查費用達到最小及限定調查費用的大小使抽樣誤差達到最小兩種情況下,使用哥西不等式、求條件極小值點等高等代數(shù)與高等數(shù)學的方法,從數(shù)學上推導出估計敏感問題特征總體比例、總體均數(shù)時各階段的最優(yōu)樣本大小計算公式。 三、設計RRT的隨機化裝置,制定敏感問題的調查問卷,采用二項選擇敏感問題Simmons模型、多項選擇敏感問題隨機應答模型、數(shù)量特征敏感問題加法模型及二階段抽樣、分層二階段抽樣方法,于2010年8月至2010年10月對北京市男男性行為人群(men who have sex with men, MSM)進行初步調查;并按本文給出的統(tǒng)計公式,對調查資料作初步的統(tǒng)計分析并估計出樣本大小計算公式中的有關統(tǒng)計量的數(shù)值。 四、根據(jù)本文推導的敏感問題復雜抽樣方法下的樣本大小計算公式和初步調查得到的有關統(tǒng)計量的數(shù)值,對二項選擇敏感問題Simmons模型、多項選擇敏感問題隨機應答模型、數(shù)量特征敏感問題加法模型下共10個敏感問題的二階段抽樣與分層二階段抽樣,分別計算在限定抽樣誤差的值使調查費用達到最小時所需各階段最優(yōu)樣本大小和限定調查費用的值使抽樣誤差達到最小時所需各階段最優(yōu)樣本大小。 結果: 一、本文設計了9種隨機應答模型與二階段、分層二階段2種抽樣方法組合的18種調查方法,分別對18種調查方法,給出了敏感問題總體比例、總體均數(shù)的估計量及其估計方差計算公式。 二、本文分別對9種隨機應答模型與2種復雜抽樣方法組合的18種調查方法,當限定抽樣誤差的大小使調查費用達到最小及限定調查費用的大小使抽樣誤差達到最小兩種情況下,推導出估計敏感問題特征總體比例、總體均數(shù)的各階段最優(yōu)樣本大小計算公式。 三、本文對北京市男男性行為人群進行了敏感問題3種隨機應答模型下二階段抽樣、分層二階段抽樣的初步調查。其中二階段抽樣得到如下主要初步調查結果:北京市MSM人群首次男男性行為的年齡均數(shù)為21.9歲、標準誤為0.1792歲;男男性行為月人均不同性伴人數(shù)2.79人,標準誤為0.0860人;月人均男男性行為次數(shù)為4.8次,標準誤為0.1587次;最近一次肛交男男性行為安全套全程使用的比例為77.63%,標準誤為1.82%;上月男男性行為中從不全程使用安全套、有時全程使用安全套、每次全程使用安全套、沒有肛交的比例分別為6.07%、29.16%、55.60%、8.86%,其標準誤分別為0.93%、1.30%、1.84%、1.10%;男男商業(yè)性性行為的次均費用200元、200-399元、400-599元、600元以上的比例分別為2.60%、3.18%、0.88%、5.99%,其標準誤分別為0.57%、1.05%、0.35%、0.65%;最近一年HIV病毒檢測結果為陽性、結果不確定、沒有檢查過的比例分別為4.89%、1.31%、4.22%,其標準誤分別為1.05%、0.54%、1.26%;最近一年性病檢測結果有性病、無性病、沒有檢查過的比例分別為14.58%、77.49%、7.38%,其標準誤分別為1.70%、2.37%、1.45%;男男性行為的方式為肛交、口交的比例分別為69.23%、15.57%,其標準誤分別為2.21%、1.79%;安全套使用有破損的比例為3.53%,其標準誤為0.92%。 四、針對本團隊擬于2013年開展的國家自然科學基金項目《敏感問題高危人群基數(shù)調查估計的統(tǒng)計方法及其應用》(編號:81273188)研究中北京市男同性戀人群基數(shù)及敏感問題特征的二階段與分層二階段抽樣調查,根據(jù)本文給出的公式和調查結果,計算出各層各階段樣本大小的估計值。 1、二階段抽樣:第一階段需抽取的區(qū)縣數(shù)n1=13,第二階段平均每個區(qū)縣需抽取的男男性行為者人數(shù)n2=129(人)。 2、分層二階段抽樣:第一層(15-29歲層)需抽取的區(qū)縣數(shù)n11,=8,平均每個區(qū)縣需抽取的男男性行為者人數(shù)n21=121(人);第二層(30-49歲層)需抽取的區(qū)縣數(shù)n12=8,平均每個區(qū)縣需抽取的男男性行為者人數(shù)n22=113(人)。 結論: 一、本文對敏感問題9種隨機應答模型與二階段、分層二階段2種抽樣方法組合的共18種調查方法,給出了敏感問題特征總體比例、總體均數(shù)的估計量及其估計方差的統(tǒng)計公式,并將其中三種隨機應答模型的二階段與分層二階段抽樣調查方法成功應用于北京市男男性行為人群這一性病、艾滋病高危人群的敏感問題預調查,取得了良好的實際應用效果。說明本文提供的調查方法及其統(tǒng)計公式科學、可靠、有效,具有廣泛的應用前景。 二、預調查結果提示北京市男男性行為人群存在無固定性伴、肛交為主要性行為方式、全程使用安全套比例低、男男商業(yè)性性行為比例高(分層二階段抽樣結果達到6.11%)、未進行HIV病毒與性病檢測比例高、安全套破損比例高(分層二階段抽樣結果達到5.43%)等艾滋病、性病高危性行為,性病艾滋病的防控形勢不容樂觀,應引起政府、衛(wèi)生部門的高度重視,尋找合理的應對措施。 三、本文對敏感問題9種隨機應答模型與二階段、分層二階段2種抽樣方法組合的共18種調查方法,在限定抽樣誤差的大小使調查費用達到最小及限定調查費用的大小使抽樣誤差達到最小兩種情況下,推導出估計敏感問題特征總體比例、總體均數(shù)的各層各階段最優(yōu)樣本大小計算公式,為敏感問題的抽樣調查設計提供了科學的新方法。采用3種隨機應答模型與二階段、分層二階段2種抽樣方法組合的6種調查方法及本文推導的公式,對北京市男男性行為人群基數(shù)及敏感特征的調查估計了各層各階段所需的最優(yōu)樣本大小,具有廣泛的應用前景和推廣意義。
【關鍵詞】:敏感問題 隨機應答技術(RRT) 艾滋病 (分層)二階段抽樣 樣本大小
【學位授予單位】:蘇州大學
【學位級別】:博士
【學位授予年份】:2012
【分類號】:R181.1
【目錄】:
- 中文摘要4-8
- Abstract8-13
- 目錄13-15
- 引言15-19
- 第一部分 敏感問題(分層)二階段抽樣調查設計的統(tǒng)計方法19-90
- 1. 二項選擇敏感問題Warner模型的二階段抽樣19-22
- 2. 二項選擇敏感問題Simmons模型的二階段抽樣22-25
- 3. 二項選擇敏感問題雙無關問題模型的二階段抽樣25-29
- 4. 二項選擇敏感問題改進的隨機應答模型的二階段抽樣29-32
- 5. 多項選擇敏感問題單一樣本隨機應答模型的二階段抽樣32-35
- 6. 多項選擇敏感問題隨機間接應答模型的二階段抽樣35-38
- 7. 數(shù)量特征敏感問題無關聯(lián)問題模型的二階段抽樣38-42
- 8. 數(shù)量特征敏感問題加法模型的二階段抽樣42-45
- 9. 數(shù)量特征敏感問題乘法模型的二階段抽樣45-48
- 10. 二項選擇敏感問題Warner模型的分層兩階段抽樣48-52
- 11. 二項選擇敏感問題Simmons模型的分層兩階段抽樣52-56
- 12. 二項選擇敏感問題雙無關問題模型的分層兩階段抽樣56-62
- 13. 二項選擇敏感問題改進隨機應答模型的分層兩階段抽樣62-66
- 14. 多項選擇敏感問題單一樣本隨機應答模型分層二階段抽樣66-71
- 15. 多項選擇敏感問題隨機間接應答模型的分層二階段抽樣71-75
- 16. 數(shù)量特征敏感問題無關聯(lián)問題模型的分層二階段抽樣75-80
- 17. 數(shù)量特征敏感問題加法模型分層二階段抽樣80-85
- 18. 數(shù)量特征敏感問題乘法模型分層二階段抽樣85-90
- 第二部分 北京市男男性行為人群的(分層)二階段抽樣調查90-144
- 1. 前言90-91
- 2. 調查設計91-93
- 3. 調查和結果分析93-144
- 第三部分 北京市男男性行為人群基數(shù)及性行為特征抽樣調查樣本大小的估計144-179
- 1. 二階段隨機抽樣樣本大小的計算144-158
- 2. 分層二階段隨機抽樣樣本大小的計算158-178
- 3. 最終樣本大小的確定178-179
- 討論179-183
- 總結與展望183-185
- 參考文獻185-191
- 綜述191-209
- 參考文獻201-209
- 攻讀博士學位期間主要科研成果209-210
- 附錄210-213
- 致謝213
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 趙馨;閆在在;張景;魏福紅;丁立剛;唐俊;;Warner模型中方差估計的隨機組方法[J];內蒙古科技大學學報;2010年03期
2 楊海山;Simmons敏感性問題抽樣調查誤差的估算[J];中國煤炭經(jīng)濟學院學報;1996年02期
3 聶書云,王建宏;社會敏感問題統(tǒng)計調查方法研究[J];川北教育學院學報;2002年04期
4 章棟恩;隨機化應答調查方案的參數(shù)估計問題[J];純粹數(shù)學與應用數(shù)學;2000年02期
5 高歌;范玉波;王冕;;敏感問題隨機應答技術模型分層整群抽樣下參數(shù)的估計[J];第二軍醫(yī)大學學報;2009年02期
6 王麗艷;夏冬艷;吳玉華;張大鵬;王璐;呂繁;;乘數(shù)法估計北京、哈爾濱兩市男性同性戀人群規(guī)模的研究[J];華南預防醫(yī)學;2006年03期
7 蔡于茂;劉惠;潘鵬;洪福昌;馮鐵建;;應用同伴推動抽樣法對深圳地區(qū)男男性接觸者AIDS相關知識和危險行為調查[J];華南預防醫(yī)學;2009年01期
8 查干花;苗志峰;王麗艷;王璐;趙金扣;;同伴推動抽樣法在西部某城市男男性接觸者基數(shù)估計中的應用[J];華南預防醫(yī)學;2009年06期
9 曾鴻;鐘蕾;;論網(wǎng)絡調查與傳統(tǒng)調查方法的綜合應用[J];工業(yè)技術經(jīng)濟;2006年12期
10 完顏華;閆在在;;Warner模型中的Jackknife方法[J];河南教育學院學報(自然科學版);2006年03期
,本文編號:673617
本文鏈接:http://www.sikaile.net/yixuelunwen/liuxingb/673617.html