大樣本非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)前處理方法研究
發(fā)布時(shí)間:2023-04-05 02:00
基于大樣本非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)的特征,和蛋白質(zhì)組學(xué)領(lǐng)域相較于轉(zhuǎn)錄組學(xué),代謝組學(xué)領(lǐng)域數(shù)據(jù)前處理方法的“滯后性”,并從快速增長的、由精準(zhǔn)醫(yī)學(xué)為代表的諸多高速發(fā)展領(lǐng)域產(chǎn)生的大樣本量實(shí)驗(yàn)數(shù)據(jù)處理的需求出發(fā),本研究開發(fā)了針對(duì)大樣本非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)前處理的R工具包preprocessor。通過對(duì)其他組學(xué)領(lǐng)域數(shù)據(jù)前處理方法的篩選,preprocessor特別集成了適用于大樣本,尤其是臨床大樣本非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)的前處理方法,如EigenMS、QC-RLSC、missForest等,并致力于解決大樣本量及臨床樣本高異質(zhì)性帶來的數(shù)據(jù)偏差問題和非標(biāo)記定量方法帶來的數(shù)據(jù)缺失問題,同時(shí)工具包中也包括一些蛋白質(zhì)組學(xué)數(shù)據(jù)經(jīng)典前處理方法作為保守選擇或方便對(duì)比。本工具包包含完整的大樣本非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)前處理流程,包括數(shù)據(jù)讀取、清洗、評(píng)估、校正、缺失值填補(bǔ)和前處理方法對(duì)比等,并生成報(bào)告,從而輔助研究者選取合適的前處理方法以解決大樣本非標(biāo)記定量蛋白質(zhì)組學(xué)分析面臨的特有問題。
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
內(nèi)容摘要
ABSTRACT
第一章 引言
第一節(jié) 非標(biāo)記定量蛋白質(zhì)組學(xué)技術(shù)的研究進(jìn)展
第二節(jié) 非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)前處理的研究進(jìn)展
一 數(shù)據(jù)校正
二 缺失值填補(bǔ)
三 臨床大樣本非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)前處理工具
第二章 前處理方法及效果評(píng)估方法
第一節(jié) 數(shù)據(jù)校正方法
一 不校正
二 分位數(shù)校正
三 上四分位數(shù)校正
四 方差穩(wěn)定校正
五 替代變量分析校正
六 EigenMS
七 QC-RLSC
第二節(jié) 數(shù)據(jù)校正效果評(píng)估方法
一 樣本豐度總和
二 變異系數(shù)
三 合并組內(nèi)變異系數(shù)
四 合并組內(nèi)估計(jì)方差
五 合并組內(nèi)絕對(duì)中位差
六 質(zhì)控樣本相關(guān)性系數(shù)
七 聚類分析
八 數(shù)據(jù)分布
九 統(tǒng)計(jì)檢驗(yàn)結(jié)果
第三節(jié) 缺失值填補(bǔ)方法
一 不填補(bǔ)缺失值
二 數(shù)據(jù)統(tǒng)計(jì)量填補(bǔ)
三 k近鄰填補(bǔ)
四 鏈?zhǔn)椒匠潭嘀靥钛a(bǔ)
五 基于隨機(jī)森林的迭代填補(bǔ)
第四節(jié) 缺失值填補(bǔ)效果評(píng)估方法
第三章 實(shí)驗(yàn)結(jié)果及分析
第一節(jié) 數(shù)據(jù)來源
第二節(jié) 數(shù)據(jù)評(píng)估
一 總體趨勢(shì)
二 缺失模式
三 變異分析及相關(guān)性分析
四 聚類分析
第三節(jié) 數(shù)據(jù)校正結(jié)果評(píng)估
一 總體趨勢(shì)箱線圖
二 樣本總豐度分布箱線圖
三 質(zhì)控樣本變異系數(shù)與相關(guān)系數(shù)
四 聚類分析
五 密度圖
六 平均組內(nèi)變異參數(shù)
第四節(jié) 缺失值填補(bǔ)結(jié)果評(píng)估
一 總體趨勢(shì)箱線圖
二 質(zhì)控樣本變異系數(shù)與相關(guān)系數(shù)
三 聚類分析
四 密度圖
第五節(jié) 數(shù)據(jù)前處理對(duì)后續(xù)分析的影響
一 p值分布變化
二 差異基因
第六節(jié) 填補(bǔ)與校正順序
第四章 結(jié)論與討論
參考文獻(xiàn)
附錄
附錄一 preprocessor的安裝
附錄二 preprocessor的使用
后記
致謝
本文編號(hào):3782501
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
內(nèi)容摘要
ABSTRACT
第一章 引言
第一節(jié) 非標(biāo)記定量蛋白質(zhì)組學(xué)技術(shù)的研究進(jìn)展
第二節(jié) 非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)前處理的研究進(jìn)展
一 數(shù)據(jù)校正
二 缺失值填補(bǔ)
三 臨床大樣本非標(biāo)記定量蛋白質(zhì)組學(xué)數(shù)據(jù)前處理工具
第二章 前處理方法及效果評(píng)估方法
第一節(jié) 數(shù)據(jù)校正方法
一 不校正
二 分位數(shù)校正
三 上四分位數(shù)校正
四 方差穩(wěn)定校正
五 替代變量分析校正
六 EigenMS
七 QC-RLSC
第二節(jié) 數(shù)據(jù)校正效果評(píng)估方法
一 樣本豐度總和
二 變異系數(shù)
三 合并組內(nèi)變異系數(shù)
四 合并組內(nèi)估計(jì)方差
五 合并組內(nèi)絕對(duì)中位差
六 質(zhì)控樣本相關(guān)性系數(shù)
七 聚類分析
八 數(shù)據(jù)分布
九 統(tǒng)計(jì)檢驗(yàn)結(jié)果
第三節(jié) 缺失值填補(bǔ)方法
一 不填補(bǔ)缺失值
二 數(shù)據(jù)統(tǒng)計(jì)量填補(bǔ)
三 k近鄰填補(bǔ)
四 鏈?zhǔn)椒匠潭嘀靥钛a(bǔ)
五 基于隨機(jī)森林的迭代填補(bǔ)
第四節(jié) 缺失值填補(bǔ)效果評(píng)估方法
第三章 實(shí)驗(yàn)結(jié)果及分析
第一節(jié) 數(shù)據(jù)來源
第二節(jié) 數(shù)據(jù)評(píng)估
一 總體趨勢(shì)
二 缺失模式
三 變異分析及相關(guān)性分析
四 聚類分析
第三節(jié) 數(shù)據(jù)校正結(jié)果評(píng)估
一 總體趨勢(shì)箱線圖
二 樣本總豐度分布箱線圖
三 質(zhì)控樣本變異系數(shù)與相關(guān)系數(shù)
四 聚類分析
五 密度圖
六 平均組內(nèi)變異參數(shù)
第四節(jié) 缺失值填補(bǔ)結(jié)果評(píng)估
一 總體趨勢(shì)箱線圖
二 質(zhì)控樣本變異系數(shù)與相關(guān)系數(shù)
三 聚類分析
四 密度圖
第五節(jié) 數(shù)據(jù)前處理對(duì)后續(xù)分析的影響
一 p值分布變化
二 差異基因
第六節(jié) 填補(bǔ)與校正順序
第四章 結(jié)論與討論
參考文獻(xiàn)
附錄
附錄一 preprocessor的安裝
附錄二 preprocessor的使用
后記
致謝
本文編號(hào):3782501
本文鏈接:http://www.sikaile.net/shoufeilunwen/mpalunwen/3782501.html
最近更新
教材專著