天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 醫(yī)學(xué)論文 > 腫瘤論文 >

基于DNA甲基化數(shù)據(jù)的原發(fā)灶不明惡性腫瘤溯源研究

發(fā)布時(shí)間:2020-11-16 10:37
   原發(fā)灶不明惡性腫瘤(Cancer of unknown primary,CUP)是指無(wú)法確定原發(fā)位置的轉(zhuǎn)移性腫瘤。腫瘤的轉(zhuǎn)移是指腫瘤細(xì)胞從原發(fā)位置通過(guò)侵入循環(huán)系統(tǒng),轉(zhuǎn)移到其他身體部位并繼續(xù)生長(zhǎng)的過(guò)程。找到CUP原發(fā)位置有助于確定更有效的治療方案,對(duì)于改善患者的預(yù)后具有重要的意義。傳統(tǒng)的檢測(cè)手段包括臨床、影響和病理檢查等,僅能確定50%~80%患者的原發(fā)位置,剩余20%~50%的患者仍然無(wú)法確定原發(fā)灶,亟待更有效的手段出現(xiàn)。DNA甲基化是一種重要的基因修飾方式,甲基化水平具有組織特異性,有助于確定腫瘤的原發(fā)位置。機(jī)器學(xué)習(xí)算法可以從大量的甲基化數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,依此對(duì)未知的樣本進(jìn)行分類(lèi),因此適用于甲基化腫瘤溯源問(wèn)題。本研究通過(guò)對(duì)比和評(píng)估,選取合適的甲基化特征和機(jī)器學(xué)習(xí)模型構(gòu)建了腫瘤溯源分類(lèi)器。首先,本文收集了TCGA數(shù)據(jù)庫(kù)中31種腫瘤的450K甲基化數(shù)據(jù),進(jìn)行數(shù)據(jù)過(guò)濾和特征篩選后,使用主成分分析、非負(fù)矩陣分解和奇異值分解三種方法進(jìn)行了降維,然后使用8種機(jī)器學(xué)習(xí)模型(LASSO、神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、支持向量機(jī)、線(xiàn)性判別、K近鄰、決策樹(shù)、樸素貝葉斯)分別構(gòu)建了分類(lèi)器并進(jìn)行了評(píng)估。我們發(fā)現(xiàn)LASSO和神經(jīng)網(wǎng)絡(luò)的分類(lèi)效果最好,在5折交叉驗(yàn)證中分別達(dá)到了96.77%和96.76%的精確度。我們使用來(lái)自GEO的10種癌癥甲基化數(shù)據(jù)對(duì)前文訓(xùn)練的模型進(jìn)行了評(píng)估,發(fā)現(xiàn)LASSO在獨(dú)立測(cè)試集上取得了91.97%的精確度,驗(yàn)證了模型的效果。在此基礎(chǔ)上,本研究對(duì)比了甲基化水平、基因表達(dá)水平(mRNA)、小RNA(miRNA)和長(zhǎng)鏈非編碼RNA(lncRNA)作為特征集建立LASSO分類(lèi)器的精確度,發(fā)現(xiàn)甲基化水平訓(xùn)練的分類(lèi)器效果最好。為了改進(jìn)模型,篩選出分類(lèi)能力最強(qiáng)的探針集合,提高訓(xùn)練效率,本文提出了一種新的探針排序方式——Maximum F-statistic Maximum Distance(MFMD),該方法將探針的F統(tǒng)計(jì)量和與其余探針的平均歐氏距離進(jìn)行加權(quán)平均。根據(jù)MFMD排序的前5000個(gè)探針建立的LASSO精度達(dá)到了95.05%。基于前文構(gòu)建的8種分類(lèi)器,我們搭建了甲基化腫瘤溯源平臺(tái)CUPtracer(http://cuptracer.i-sanger.com/)。CUPtracer基于web.py框架搭建,提供了常用甲基化分析軟件結(jié)果的格式轉(zhuǎn)換工具和郵件提醒服務(wù)。CUPtracer所有模型的參數(shù)均已進(jìn)行優(yōu)化,用戶(hù)無(wú)需對(duì)參數(shù)進(jìn)行設(shè)置。CUPtracer為沒(méi)有編程基礎(chǔ)的研究者提供了便捷的腫瘤溯源分析途徑?傊,本研究使用甲基化數(shù)據(jù)構(gòu)建了準(zhǔn)確度較高的CUP腫瘤溯源分類(lèi)器,并搭建了甲基化腫瘤溯源平臺(tái),為今后的CUP研究提供了思路和工具。
【學(xué)位單位】:華東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類(lèi)】:R73
【部分圖文】:

探針,精確度,置信區(qū)間,分類(lèi)器


圖 2-1 top 5000 探針建立的分類(lèi)器準(zhǔn)確度95%置信區(qū)間表 2-12 探針數(shù)量與精確度探針數(shù)量 LASSO精確度 神經(jīng)網(wǎng)絡(luò)精確度700 90.22%±1.05% 90.38%±0.77%1000 92.19%±1.08% 90.84%±0.73%5000 96.05%±1.15% 94.75%±1.37%10000 96.20%±1.05% 94.21%±0.95%將基于 MFMD 方法排序的前 1000 個(gè)探針?biāo)诨蚴褂?DAVID6.8 進(jìn)行GO 功能注釋?zhuān)?2-13 列出了 Count 在 10 以上且 P 值小于 0.1 的部分 GOterm。其中多個(gè)基因已有文獻(xiàn)表明與各種癌癥相關(guān)。Cao 等人發(fā)現(xiàn) LTBP1 基因與肝細(xì)胞癌的早期病變有關(guān)[19]。而 GDF5 參與了乳腺癌 MCF-7 細(xì)胞中 TGF 依賴(lài)性的血管再生過(guò)程,抑制 GDF5 的表達(dá)會(huì)引起該過(guò)程的紊亂[20]。JAG1 基因

上傳,示例,格式,甲基化水平


溯源 web 服務(wù)器(CUPtracer)。式Ptracer 將格式規(guī)定為 5 列的 bed 文件,示例如圖 3-1 所示。其chr”的染色體編號(hào),第二列是起始位置,第三列是終止位置甲基化的 reads 數(shù),第五列是測(cè)序深度。其中,HM450K 甲基是單個(gè)的 CpG 位點(diǎn),因此第二列和第三列一般相差 1。第四列現(xiàn)缺失值,缺失值以“NA”表示,這些含有缺失值的行會(huì)在除。在后續(xù)的分析中,實(shí)際使用的是甲基化水平的 Beta 值,這種格式是因?yàn)椴⒉皇撬械募谆椒治鲕浖伎梢缘玫侥艿玫郊谆?reads 數(shù)和測(cè)序深度,因此 CUPtracer 將在數(shù)據(jù) Beta 值。

分析流程


圖 3-2 CUPtracer 分析流程r 使用 web.py 框架,整個(gè) web server 的架構(gòu)如圖 3-數(shù)據(jù)并選擇模型,網(wǎng)頁(yè)端 web 服務(wù)器向 controller 提的 job ID 返回到頁(yè)面。Controller 在 mongo 數(shù)據(jù)庫(kù)中上傳文件的地址、選擇的模型和任務(wù)提交時(shí)間,并,然后向 ToolAgent 發(fā)起計(jì)算任務(wù)。ToolAgent 分為其中 tool 負(fù)責(zé)在計(jì)算節(jié)點(diǎn)上調(diào)用 CUPtracer 計(jì)算程責(zé)將 tool 投遞到計(jì)算集群上,并監(jiān)控任務(wù)的運(yùn)行狀新投遞一個(gè)任務(wù),最多會(huì)重新投遞三次,如果四次息。Controller 在 mongo 數(shù)據(jù)庫(kù)中新建記錄時(shí),會(huì)得
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 朝樂(lè)孟;李全福;;膽囊癌組織甲基化水平的研究[J];內(nèi)蒙古醫(yī)科大學(xué)學(xué)報(bào);2013年02期

2 薛晶晶;陳松筆;;木薯不同發(fā)育期塊根基因組DNA甲基化變化分析[J];生物技術(shù)通報(bào);2018年05期

3 張志勇;李春宏;仇小強(qiáng);農(nóng)清清;何敏;覃健;蔣貴發(fā);黃明立;;廣西長(zhǎng)壽地區(qū)人群白細(xì)胞DNA總體甲基化水平研究[J];中國(guó)老年學(xué)雜志;2009年12期

4 馮旭;;miR-34b/c甲基化與非小細(xì)胞肺癌患者預(yù)后的關(guān)系研究[J];系統(tǒng)醫(yī)學(xué);2017年23期

5 孫東旭;張崇華;鄭瑋峰;李征;張曉峰;;廚師人群基因組DNA總甲基化水平及影響因素分析[J];中國(guó)工業(yè)醫(yī)學(xué)雜志;2016年03期

6 袁金玲;郭廣平;岳晉軍;吳曉麗;顧小平;;孝順竹開(kāi)花過(guò)程中DNA甲基化水平動(dòng)態(tài)研究[J];西北植物學(xué)報(bào);2012年01期

7 楊建環(huán);邢超;胡小涵;;基因組甲基化異常與兒童原發(fā)性腎病綜合征相關(guān)性研究[J];中國(guó)衛(wèi)生檢驗(yàn)雜志;2017年20期

8 董亞娟;程舟;李珊;周銅水;陳家寬;萬(wàn)樹(shù)文;顧敏;張文駒;;HPLC法測(cè)定不同年齡人參DNA的甲基化水平[J];中草藥;2007年09期

9 陳豪;張晶雅;胡雪姣;陸小軍;王軍;周燕虹;應(yīng)斌武;周靜;;甲基化芯片篩選結(jié)核感染相關(guān)基因及后續(xù)驗(yàn)證[J];四川大學(xué)學(xué)報(bào)(醫(yī)學(xué)版);2018年05期

10 徐酩;呂京澴;孫玉潔;;乳腺癌MCF-7細(xì)胞Alu甲基化水平的MSRE-qPCR法檢測(cè)[J];南京醫(yī)科大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年07期


相關(guān)博士學(xué)位論文 前8條

1 毛宇彬;轉(zhuǎn)錄因子Dermol、Twist在多種人類(lèi)腫瘤中的功能分析與甲基化調(diào)控機(jī)制[D];廈門(mén)大學(xué);2007年

2 蘇改秀;兒童系統(tǒng)性紅斑狼瘡基因組甲基化水平及LINE-1序列甲基化水平的研究[D];北京協(xié)和醫(yī)學(xué)院;2016年

3 趙國(guó)昌;永久性心房顫動(dòng)的基因組DNA甲基化分析[D];首都醫(yī)科大學(xué);2017年

4 汪炳良;蘿卜春化作用及其與DNA甲基化水平的關(guān)系[D];浙江大學(xué);2004年

5 劉細(xì)玉;成人隱匿性自身免疫性糖尿病患者CD4+T淋巴細(xì)胞H3賴(lài)氨酸9甲基化水平改變的臨床意義及其機(jī)制研究[D];浙江大學(xué);2018年

6 賈敏;胰島素對(duì)ER-α甲基化調(diào)控在動(dòng)脈粥樣硬化中的作用研究[D];第三軍醫(yī)大學(xué);2017年

7 伍洲煒;常見(jiàn)誘發(fā)因素加重系統(tǒng)性紅斑狼瘡的機(jī)制研究[D];上海交通大學(xué);2015年

8 黃焱磊;肛門(mén)直腸畸形腸壁內(nèi)神經(jīng)支配的相關(guān)研究[D];復(fù)旦大學(xué);2008年


相關(guān)碩士學(xué)位論文 前10條

1 楊冰潔;PRMT5介導(dǎo)的甲基化與氧糖剝奪再灌注損傷的關(guān)系探討[D];南華大學(xué);2018年

2 羅彤;基于DNA甲基化數(shù)據(jù)的原發(fā)灶不明惡性腫瘤溯源研究[D];華東師范大學(xué);2018年

3 李浩;胃癌風(fēng)險(xiǎn)相關(guān)差異甲基化—差異表達(dá)基因篩選及驗(yàn)證研究[D];中國(guó)醫(yī)科大學(xué);2018年

4 陳曦;性成熟前豬睪丸全基因組DNA甲基化的動(dòng)態(tài)特征[D];四川農(nóng)業(yè)大學(xué);2017年

5 張琳;mGluR3 DNA甲基化介導(dǎo)產(chǎn)前應(yīng)激子代大鼠抑郁樣行為[D];西北大學(xué);2018年

6 李佳;DKK3甲基化、ITIH5甲基化對(duì)肝細(xì)胞肝癌診斷價(jià)值的研究[D];山東大學(xué);2018年

7 陳錚;MiR-615-5p對(duì)肝癌細(xì)胞轉(zhuǎn)移調(diào)控作用機(jī)制的研究[D];天津醫(yī)科大學(xué);2013年

8 王斯靚;高壓靜電場(chǎng)處理甘草三年生植株DNA甲基化多態(tài)性分析[D];內(nèi)蒙古大學(xué);2018年

9 張亮;同型半胱氨酸在早年應(yīng)激誘導(dǎo)的腸易激綜合征中的作用及其甲基化機(jī)制[D];軍事科學(xué)院;2018年

10 王艷華;焦?fàn)t逸散物致呼吸系統(tǒng)損傷與基因組DNA甲基化改變的生物標(biāo)志物研究[D];中國(guó)疾病預(yù)防控制中心;2017年



本文編號(hào):2886066

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/yixuelunwen/zlx/2886066.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)048e9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com