心血管病流行病調(diào)查中缺失數(shù)據(jù)填補方法的比較及模擬研究
發(fā)布時間:2023-11-02 19:27
目的 心血管疾病是世界范圍內(nèi)嚴重危害人類健康的疾病,近年來研究顯示,其發(fā)病率和死亡率在發(fā)展中國家日益增高,針對這一類慢性疾病,很多大規(guī)模的流行病學調(diào)查研究開展起來,為心血管病的預(yù)防提供了新線索和大樣本數(shù)據(jù)的證據(jù)。然而,由于人的社會屬性和心理特點,常常導(dǎo)致一些科研資料存在不完整數(shù)據(jù)的情況,即存在缺失數(shù)據(jù)。對于缺失比例在一定范圍內(nèi)的數(shù)據(jù),過去的做法多是直接刪除,這種直接的做法雖然簡單易行,但卻會減少觀測的樣本量,從而影響分析結(jié)果的檢驗效能。近些年,插補類方法正得到越來越多專家和學者的認可,相應(yīng)的新方法發(fā)展迅速。本研究利用單一插補和多重插補等方法處理缺失數(shù)據(jù),重點對多重插補類方法之間的差別進行比較,期望尋找到適用于常規(guī)慢性流行病學調(diào)查研究中缺失數(shù)據(jù)的填補策略與方法。 方法 以心血管病領(lǐng)域的一個大樣本、多變量數(shù)據(jù)集為基礎(chǔ),采用蒙特卡洛技術(shù),按照完全隨機缺失機制模擬該數(shù)據(jù)集在5%、10%、20%、30%四種缺失比例下,單個不同類型變量(包括連續(xù)變量、二值變量、有序變量和名義變量)的缺失情形,以及單調(diào)缺失模式兩個變量缺失,或任意缺失模式兩個變量缺失情形。每種缺失情形模擬500次。每次模擬中,分別采...
【文章頁數(shù)】:185 頁
【學位級別】:博士
【文章目錄】:
表索引
圖索引
中英文縮略詞
中文摘要
Abstract
第一章 引論
1.1 什么是缺失數(shù)據(jù)
1.2 缺失數(shù)據(jù)的研究意義
1.3 數(shù)據(jù)缺失的機制
1.4 數(shù)據(jù)缺失的模式
1.5 缺失數(shù)據(jù)的處理方法
1.6 處理方法比較研究現(xiàn)狀
1.7 本研究內(nèi)容
1.8 研究方法
第二章 數(shù)據(jù)與方法
2.1 數(shù)據(jù)來源
2.1.1 定性變量的描述
2.1.2 定量變量的描述
2.1.3 SNP位點
2.2 缺失值處理方法
2.2.1 刪除法
2.2.2 單一插補-線性回歸法
2.2.3 多重插補
2.2.3.1 多重插補-線性回歸法
2.2.3.2 多重插補-預(yù)測均值匹配法
2.2.3.3 多重插補-趨勢得分法
2.2.3.4 多重插補-馬爾科夫鏈蒙特卡洛法
2.2.3.5 多重插補-logistic回歸法
2.2.3.6 多重插補-判別函數(shù)法
2.3 缺失值模擬與處理方法
2.3.1 連續(xù)變量處理效果的比較
2.3.2 分類變量處理效果的比較
2.3.3 不同填充策略和方法處理效果的綜合評價
2.3.4 處理策略和方法的具體實施
第三章 單變量缺失處理結(jié)果
3.1 單個連續(xù)變量缺失處理結(jié)果
3.1.1 缺失比例為5%
3.1.2 缺失比例為10%
3.1.3 缺失比例為20%
3.1.4 缺失比例為30%
3.1.5 插補效果綜合比較
3.2 單個二值變量缺失處理結(jié)果
3.2.1 缺失比例為5%
3.2.2 缺失比例為10%
3.2.3 缺失比例為20%
3.2.4 缺失比例為30%
3.2.5 插補效果綜合比較
3.3 單個有序變量缺失處理結(jié)果
3.3.1 缺失比例為5%
3.3.2 缺失比例為10%
3.3.3 缺失比例為20%
3.3.4 缺失比例為30%
3.3.5 插補效果綜合比較
3.4 單個名義變量缺失處理結(jié)果
3.4.1 缺失比例為5%
3.4.2 缺失比例為10%
3.4.3 缺失比例為20%
3.4.4 缺失比例為30%
3.4.5 插補效果綜合比較
第四章 多變量缺失處理結(jié)果
4.1 單調(diào)缺失模式多變量缺失處理結(jié)果
4.1.1 兩連續(xù)變量缺失處理結(jié)果
4.1.1.1 缺失比例為5%
4.1.1.2 缺失比例為10%
4.1.1.3 缺失比例為20%
4.1.1.4 缺失比例為30%
4.1.1.5 插補效果綜合比較
4.1.2 連續(xù)變量與二值變量缺失處理結(jié)果
4.1.2.1 缺失比例為5%
4.1.2.2 缺失比例為10%
4.1.2.3 缺失比例為20%
4.1.2.4 缺失比例為30%
4.1.2.5 插補效果綜合比較
4.1.3 連續(xù)變量與有序變量缺失處理結(jié)果
4.1.3.1 缺失比例為5%
4.1.3.2 缺失比例為10%
4.1.3.3 缺失比例為20%
4.1.3.4 缺失比例為30%
4.1.3.5 插補效果綜合比較
4.1.4 連續(xù)變量與名義變量缺失處理結(jié)果
4.1.4.1 缺失比例為5%
4.1.4.2 缺失比例為10%
4.1.4.3 缺失比例為20%
4.1.4.4 缺失比例為30%
4.1.4.5 插補效果綜合比較
4.2 任意缺失模式多變量缺失處理結(jié)果
4.2.1 兩連續(xù)變量缺失處理結(jié)果
4.2.1.1 缺失比例為5%
4.2.1.2 缺失比例為10%
4.2.1.3 缺失比例為20%
4.2.1.4 缺失比例為30%
4.2.1.5 插補效果綜合比較
4.2.2 連續(xù)變量與二值變量缺失處理結(jié)果
4.2.2.1 缺失比例為5%
4.2.2.2 缺失比例為10%
4.2.2.3 缺失比例為20%
4.2.2.4 缺失比例為30%
4.2.2.5 插補效果綜合比較
4.2.3 連續(xù)變量與有序變量缺失處理結(jié)果
4.2.3.1 缺失比例為5%
4.2.3.2 缺失比例為10%
4.2.3.3 缺失比例為20%
4.2.3.4 缺失比例為30%
4.2.3.5 插補效果綜合比較
4.2.4 連續(xù)變量與名義變量缺失處理結(jié)果
4.2.4.1 缺失比例為5%
4.2.4.2 缺失比例為10%
4.2.4.3 缺失比例為20%
4.2.4.4 缺失比例為30%
4.2.4.5 插補效果綜合比較
第五章 結(jié)論與討論
5.1 主要結(jié)論
5.1.1 單變量缺失
5.1.2 單調(diào)缺失模式多變量缺失
5.1.3 任意缺失模式多變量缺失
5.2 主要創(chuàng)新
5.2.1 多重插補方法的全面比較
5.2.2 不同插補方法處理效果的“統(tǒng)”、“分”評價
5.3 本研究的不足之處
5.4 相關(guān)展望
參考文獻
文獻綜述
參考文獻
代表論著
個人簡介
致謝
本文編號:3859615
【文章頁數(shù)】:185 頁
【學位級別】:博士
【文章目錄】:
表索引
圖索引
中英文縮略詞
中文摘要
Abstract
第一章 引論
1.1 什么是缺失數(shù)據(jù)
1.2 缺失數(shù)據(jù)的研究意義
1.3 數(shù)據(jù)缺失的機制
1.4 數(shù)據(jù)缺失的模式
1.5 缺失數(shù)據(jù)的處理方法
1.6 處理方法比較研究現(xiàn)狀
1.7 本研究內(nèi)容
1.8 研究方法
第二章 數(shù)據(jù)與方法
2.1 數(shù)據(jù)來源
2.1.1 定性變量的描述
2.1.2 定量變量的描述
2.1.3 SNP位點
2.2 缺失值處理方法
2.2.1 刪除法
2.2.2 單一插補-線性回歸法
2.2.3 多重插補
2.2.3.1 多重插補-線性回歸法
2.2.3.2 多重插補-預(yù)測均值匹配法
2.2.3.3 多重插補-趨勢得分法
2.2.3.4 多重插補-馬爾科夫鏈蒙特卡洛法
2.2.3.5 多重插補-logistic回歸法
2.2.3.6 多重插補-判別函數(shù)法
2.3 缺失值模擬與處理方法
2.3.1 連續(xù)變量處理效果的比較
2.3.2 分類變量處理效果的比較
2.3.3 不同填充策略和方法處理效果的綜合評價
2.3.4 處理策略和方法的具體實施
第三章 單變量缺失處理結(jié)果
3.1 單個連續(xù)變量缺失處理結(jié)果
3.1.1 缺失比例為5%
3.1.2 缺失比例為10%
3.1.3 缺失比例為20%
3.1.4 缺失比例為30%
3.1.5 插補效果綜合比較
3.2 單個二值變量缺失處理結(jié)果
3.2.1 缺失比例為5%
3.2.2 缺失比例為10%
3.2.3 缺失比例為20%
3.2.4 缺失比例為30%
3.2.5 插補效果綜合比較
3.3 單個有序變量缺失處理結(jié)果
3.3.1 缺失比例為5%
3.3.2 缺失比例為10%
3.3.3 缺失比例為20%
3.3.4 缺失比例為30%
3.3.5 插補效果綜合比較
3.4 單個名義變量缺失處理結(jié)果
3.4.1 缺失比例為5%
3.4.2 缺失比例為10%
3.4.3 缺失比例為20%
3.4.4 缺失比例為30%
3.4.5 插補效果綜合比較
第四章 多變量缺失處理結(jié)果
4.1 單調(diào)缺失模式多變量缺失處理結(jié)果
4.1.1 兩連續(xù)變量缺失處理結(jié)果
4.1.1.1 缺失比例為5%
4.1.1.2 缺失比例為10%
4.1.1.3 缺失比例為20%
4.1.1.4 缺失比例為30%
4.1.1.5 插補效果綜合比較
4.1.2 連續(xù)變量與二值變量缺失處理結(jié)果
4.1.2.1 缺失比例為5%
4.1.2.2 缺失比例為10%
4.1.2.3 缺失比例為20%
4.1.2.4 缺失比例為30%
4.1.2.5 插補效果綜合比較
4.1.3 連續(xù)變量與有序變量缺失處理結(jié)果
4.1.3.1 缺失比例為5%
4.1.3.2 缺失比例為10%
4.1.3.3 缺失比例為20%
4.1.3.4 缺失比例為30%
4.1.3.5 插補效果綜合比較
4.1.4 連續(xù)變量與名義變量缺失處理結(jié)果
4.1.4.1 缺失比例為5%
4.1.4.2 缺失比例為10%
4.1.4.3 缺失比例為20%
4.1.4.4 缺失比例為30%
4.1.4.5 插補效果綜合比較
4.2 任意缺失模式多變量缺失處理結(jié)果
4.2.1 兩連續(xù)變量缺失處理結(jié)果
4.2.1.1 缺失比例為5%
4.2.1.2 缺失比例為10%
4.2.1.3 缺失比例為20%
4.2.1.4 缺失比例為30%
4.2.1.5 插補效果綜合比較
4.2.2 連續(xù)變量與二值變量缺失處理結(jié)果
4.2.2.1 缺失比例為5%
4.2.2.2 缺失比例為10%
4.2.2.3 缺失比例為20%
4.2.2.4 缺失比例為30%
4.2.2.5 插補效果綜合比較
4.2.3 連續(xù)變量與有序變量缺失處理結(jié)果
4.2.3.1 缺失比例為5%
4.2.3.2 缺失比例為10%
4.2.3.3 缺失比例為20%
4.2.3.4 缺失比例為30%
4.2.3.5 插補效果綜合比較
4.2.4 連續(xù)變量與名義變量缺失處理結(jié)果
4.2.4.1 缺失比例為5%
4.2.4.2 缺失比例為10%
4.2.4.3 缺失比例為20%
4.2.4.4 缺失比例為30%
4.2.4.5 插補效果綜合比較
第五章 結(jié)論與討論
5.1 主要結(jié)論
5.1.1 單變量缺失
5.1.2 單調(diào)缺失模式多變量缺失
5.1.3 任意缺失模式多變量缺失
5.2 主要創(chuàng)新
5.2.1 多重插補方法的全面比較
5.2.2 不同插補方法處理效果的“統(tǒng)”、“分”評價
5.3 本研究的不足之處
5.4 相關(guān)展望
參考文獻
文獻綜述
參考文獻
代表論著
個人簡介
致謝
本文編號:3859615
本文鏈接:http://www.sikaile.net/yixuelunwen/xxg/3859615.html
最近更新
教材專著