兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺
發(fā)布時間:2021-12-24 10:14
腫瘤是成人和兒童死亡的主要原因,但相對而言,大多數(shù)兒童腫瘤是比較罕見的疾病。Therapeutically Applicable Research To Generate Effective Treatments(TARGET)數(shù)據(jù)庫已經(jīng)釋放了多種兒童腫瘤的多組學(xué)數(shù)據(jù)以及臨床數(shù)據(jù)。這些數(shù)據(jù)為挖掘兒童腫瘤發(fā)展相關(guān)分子機制創(chuàng)造了條件。然而,由于組學(xué)數(shù)據(jù)具有存儲量大,維度高等特點,對無生物信息學(xué)背景的研究人員而言門檻較高且難以使用,極大地限制了多組學(xué)數(shù)據(jù)在兒童腫瘤中的應(yīng)用。此外,目前很少有專門針對兒童腫瘤數(shù)據(jù)分析的平臺,為無生物信息科研背景或編程能力薄弱的研究人員使用。因此,本課題開發(fā)了兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺,通過Web Server的形式進行展示;趤碜訥EO、TARGET、SRA數(shù)據(jù)庫中的多種兒童腫瘤的不同組學(xué)數(shù)據(jù),提供了多種定制化的分析功能,包括基因基本信息查詢、基因差異表達分析、甲基化差異分析、多組學(xué)關(guān)聯(lián)分析、相似基因計算檢測、患者生存分析、腫瘤免疫細胞浸潤程度分析。本平臺針對兒童腫瘤數(shù)據(jù)進行了多方位的分析,為相關(guān)的研究人員提供全面、簡潔的數(shù)據(jù)挖掘功能,致力于將多組學(xué)應(yīng)用于兒...
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
TARGET數(shù)據(jù)庫數(shù)據(jù)類型
華東師范大學(xué)碩士學(xué)位論文6度分析模塊。對于可以提前進行分析計算的數(shù)據(jù),我們會提前通過程序腳本計算出分析結(jié)果,并存儲在本地的MySQL數(shù)據(jù)庫中。本文旨在開發(fā)常用的數(shù)據(jù)分析功能,對數(shù)據(jù)挖掘進行可視化,使得更多的研究人員通過簡單的操作就能實現(xiàn)復(fù)雜的數(shù)據(jù)分析。兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺的系統(tǒng)架構(gòu)如圖1-2所示,整個系統(tǒng)的工作流程如下,前期先進行數(shù)據(jù)收集工作,分別從TARGET、GEO以及SRA數(shù)據(jù)庫中下載了兒童腫瘤的不同組學(xué)的數(shù)據(jù)和臨床數(shù)據(jù),因為來自不同數(shù)據(jù)庫中的原始數(shù)據(jù)存儲的格式存在差異,所以需要對數(shù)據(jù)進行統(tǒng)一的標(biāo)準化,然后對數(shù)據(jù)進行清洗,過濾掉RNA-Seq數(shù)據(jù)中低豐度的基因以及甲基化芯片中包含大量缺失值的位點,最后對數(shù)據(jù)進行預(yù)處理工作,將數(shù)據(jù)整理成后續(xù)分析可用的輸入格式。數(shù)據(jù)處理好后,下一步便是進行數(shù)據(jù)分析、數(shù)據(jù)挖掘,最后開發(fā)網(wǎng)站平臺進行結(jié)果展示。圖1-2兒童腫瘤多組學(xué)大數(shù)據(jù)分析數(shù)據(jù)庫平臺的構(gòu)建流程圖在數(shù)據(jù)分析的模塊中,我們做了在腫瘤癌癥研究中常用的數(shù)據(jù)分析,如基因表達的差異分析、甲基化的差異分析、腫瘤免疫浸潤程度分析、多組學(xué)關(guān)聯(lián)分析、相似基因檢測以及生存分析等。最終并開發(fā)成Web平臺,Web平臺的設(shè)計理念一切從簡,為了讓不會編程的科研人員也能夠快速的做腫瘤癌癥相關(guān)的交互式數(shù)據(jù)分析,網(wǎng)站上按照分析的功能模塊進行劃分。系統(tǒng)的數(shù)據(jù)處理和數(shù)據(jù)展示的架
華東師范大學(xué)碩士學(xué)位論文7構(gòu)如圖1-3,原始數(shù)據(jù)通過數(shù)據(jù)計算層得到分析結(jié)果存儲在數(shù)據(jù)層中,然后通過邏輯層的操作將分析結(jié)果通過表格以及矢量圖的形式展現(xiàn)在視圖層中。網(wǎng)站中的所有繪圖功能都是使用R腳本開發(fā)的,網(wǎng)站的輸出包括表格和圖表。網(wǎng)站中的靜態(tài)數(shù)據(jù)可視化主要是通過便攜式文檔格式(PDF)進行呈現(xiàn)。圖1-3兒童腫瘤多組學(xué)大數(shù)據(jù)分析數(shù)據(jù)庫的架構(gòu)與此同時,本文完成了兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺的網(wǎng)站開發(fā),開發(fā)了多種交互式的數(shù)據(jù)分析功能,并且提供定制化的繪圖功能。網(wǎng)站主要提供了7個模塊:基因基本信息查詢模塊,基因表達差異分析模塊,甲基化差異分析模塊,多組學(xué)關(guān)聯(lián)分析模塊,腫瘤臨床生存分析模塊,相似基因計算檢測模塊,腫瘤免疫細胞浸潤程度分析模塊。兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺網(wǎng)站免費提供給所有用戶,前端是基于HTML5和JavaScript庫(https://jquery.com/)和Bootstrap模板(https://www.bootcss.com/)進行開發(fā),數(shù)據(jù)可視化基于ECHARTS庫
本文編號:3550299
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
TARGET數(shù)據(jù)庫數(shù)據(jù)類型
華東師范大學(xué)碩士學(xué)位論文6度分析模塊。對于可以提前進行分析計算的數(shù)據(jù),我們會提前通過程序腳本計算出分析結(jié)果,并存儲在本地的MySQL數(shù)據(jù)庫中。本文旨在開發(fā)常用的數(shù)據(jù)分析功能,對數(shù)據(jù)挖掘進行可視化,使得更多的研究人員通過簡單的操作就能實現(xiàn)復(fù)雜的數(shù)據(jù)分析。兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺的系統(tǒng)架構(gòu)如圖1-2所示,整個系統(tǒng)的工作流程如下,前期先進行數(shù)據(jù)收集工作,分別從TARGET、GEO以及SRA數(shù)據(jù)庫中下載了兒童腫瘤的不同組學(xué)的數(shù)據(jù)和臨床數(shù)據(jù),因為來自不同數(shù)據(jù)庫中的原始數(shù)據(jù)存儲的格式存在差異,所以需要對數(shù)據(jù)進行統(tǒng)一的標(biāo)準化,然后對數(shù)據(jù)進行清洗,過濾掉RNA-Seq數(shù)據(jù)中低豐度的基因以及甲基化芯片中包含大量缺失值的位點,最后對數(shù)據(jù)進行預(yù)處理工作,將數(shù)據(jù)整理成后續(xù)分析可用的輸入格式。數(shù)據(jù)處理好后,下一步便是進行數(shù)據(jù)分析、數(shù)據(jù)挖掘,最后開發(fā)網(wǎng)站平臺進行結(jié)果展示。圖1-2兒童腫瘤多組學(xué)大數(shù)據(jù)分析數(shù)據(jù)庫平臺的構(gòu)建流程圖在數(shù)據(jù)分析的模塊中,我們做了在腫瘤癌癥研究中常用的數(shù)據(jù)分析,如基因表達的差異分析、甲基化的差異分析、腫瘤免疫浸潤程度分析、多組學(xué)關(guān)聯(lián)分析、相似基因檢測以及生存分析等。最終并開發(fā)成Web平臺,Web平臺的設(shè)計理念一切從簡,為了讓不會編程的科研人員也能夠快速的做腫瘤癌癥相關(guān)的交互式數(shù)據(jù)分析,網(wǎng)站上按照分析的功能模塊進行劃分。系統(tǒng)的數(shù)據(jù)處理和數(shù)據(jù)展示的架
華東師范大學(xué)碩士學(xué)位論文7構(gòu)如圖1-3,原始數(shù)據(jù)通過數(shù)據(jù)計算層得到分析結(jié)果存儲在數(shù)據(jù)層中,然后通過邏輯層的操作將分析結(jié)果通過表格以及矢量圖的形式展現(xiàn)在視圖層中。網(wǎng)站中的所有繪圖功能都是使用R腳本開發(fā)的,網(wǎng)站的輸出包括表格和圖表。網(wǎng)站中的靜態(tài)數(shù)據(jù)可視化主要是通過便攜式文檔格式(PDF)進行呈現(xiàn)。圖1-3兒童腫瘤多組學(xué)大數(shù)據(jù)分析數(shù)據(jù)庫的架構(gòu)與此同時,本文完成了兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺的網(wǎng)站開發(fā),開發(fā)了多種交互式的數(shù)據(jù)分析功能,并且提供定制化的繪圖功能。網(wǎng)站主要提供了7個模塊:基因基本信息查詢模塊,基因表達差異分析模塊,甲基化差異分析模塊,多組學(xué)關(guān)聯(lián)分析模塊,腫瘤臨床生存分析模塊,相似基因計算檢測模塊,腫瘤免疫細胞浸潤程度分析模塊。兒童腫瘤多組學(xué)大數(shù)據(jù)分析平臺網(wǎng)站免費提供給所有用戶,前端是基于HTML5和JavaScript庫(https://jquery.com/)和Bootstrap模板(https://www.bootcss.com/)進行開發(fā),數(shù)據(jù)可視化基于ECHARTS庫
本文編號:3550299
本文鏈接:http://www.sikaile.net/shoufeilunwen/benkebiyelunwen/3550299.html
最近更新
教材專著