隨機森林算法在產(chǎn)后抑郁風險預測中的應用
發(fā)布時間:2024-05-17 19:38
目的:探討隨機森林算法在產(chǎn)后抑郁影響因素的篩選和風險預測中的應用效果。方法:選取2017年6月至2018年6月在湖南省長沙市某三甲醫(yī)院接受產(chǎn)前檢查并在該醫(yī)院分娩,符合納入和排除標準的孕早期婦女為研究對象。入組時,使用自編的調(diào)查問卷、中文版愛丁堡產(chǎn)后抑郁量表(Edinburgh Postnatal Depression Scale,EPDS)調(diào)查研究對象的人口經(jīng)濟學、心理社會學、生物學和產(chǎn)科及其他特征;產(chǎn)后4~6周內(nèi),采用中文版EPDS進行抑郁評分和自編的產(chǎn)后資料問卷收集分娩和產(chǎn)后資料。采用R軟件在訓練數(shù)據(jù)集上建立產(chǎn)后抑郁風險預測的隨機森林模型,在驗證數(shù)據(jù)集上采用預測準確率、靈敏度、特異度、陽性預測值、陰性預測值和曲線下面積(area under curve,AUC)評價模型的預測效果。結(jié)果:共調(diào)查406例研究對象,其中150例的EPDS得分≥9,產(chǎn)后抑郁的發(fā)生率為36.9%。通過隨機森林算法對訓練集建立的模型在驗證集上驗證,得出預測準確度為80.10%,靈敏度為61.40%,特異度為89.10%,陽性預測值為73.00%,陰性預測值為82.80%,AUC值0.833。采用隨機森林算法通...
【文章頁數(shù)】:8 頁
【部分圖文】:
本文編號:3975960
【文章頁數(shù)】:8 頁
【部分圖文】:
圖1PPD風險預測的隨機森林模型建立過程
隨機森林算法在應用過程中得到的主要結(jié)果為變量的重要性評分,其目的是對解釋變量在結(jié)局發(fā)展中的重要性進行評價[5]。對測試樣本中的變量進行重新排列,對重新排列前后出現(xiàn)的誤差率進行再次計算,比較兩個誤差率之間是否存在差值,差值即為每棵樹的重要評分標準。在隨機森林模型的建立過程中,結(jié)局變....
圖2PPD風險預測的隨機森林模型訓練集和驗證集上ROC曲線
以隨機森林模型預測精度的平均下降量對PPD隨機森林模型的總體變量重要性評分進行排序,排在前10位的重要預測變量為:產(chǎn)前抑郁、產(chǎn)后經(jīng)濟擔憂程度、產(chǎn)后工作擔憂程度、FT3孕早期、HDL孕晚期、向嬰幼兒發(fā)脾氣、TCHOL孕早期、TG孕早期、Hct孕晚期、TG孕晚期(表2)。3討論
本文編號:3975960
本文鏈接:http://www.sikaile.net/yixuelunwen/fuchankeerkelunwen/3975960.html
最近更新
教材專著