在細胞重編程過程中階段特異性基因簇的預測研究
發(fā)布時間:2021-07-19 17:52
細胞重編程是在特定誘導條件下,將分化的成熟體細胞重編程為多能性甚至全能性細胞的過程。了解細胞重編程過程中不同階段基因表達的特異性變化,對于闡明誘導性多能干細胞(induced pluripotent stem cells,iPSCs)的重編程機制、提高其誘導效率具有重要作用。目前的生物實驗已通過對多能性轉(zhuǎn)錄因子的篩選、組合及過表達,成功將成熟體細胞誘導分化為iPSCs。但是,現(xiàn)有研究未見從轉(zhuǎn)錄因子的結(jié)合峰及組蛋白修飾等其它因素的角度篩選階段特異性基因簇的研究。因此,本文基于轉(zhuǎn)錄因子的結(jié)合峰及結(jié)合組蛋白修飾等其他因素建立理論預測模型對重編程階段特異性基因簇進行預測。本文的研究內(nèi)容共包括三部分:(1)基于轉(zhuǎn)錄因子(transcription factor,TF)結(jié)合譜特征的階段特異性基因簇的預測。(2)基于組蛋白修飾(histone modification,HMs)特征的階段特異性基因簇的預測。(3)基于TF結(jié)合聯(lián)合HMs特征的階段特異性基因簇的預測。本文的ChIP-seq數(shù)據(jù)和微陣列轉(zhuǎn)錄組數(shù)據(jù)均來自Gene Expression Omnibus(GEO)數(shù)據(jù)庫,登錄號分別為GSE675...
【文章來源】:內(nèi)蒙古大學內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
細胞重編程過程
在細胞重編程過程中階段特異性基因簇的預測研究20圖3.2Oct4-BP模型Figure3.2ThemodelofOct4-BP基于Oct4-BP方法的階段特異性基因簇的分類預測模型的步驟為如下:步驟1.構(gòu)造分類:在已有的研究基礎(chǔ)上,進一步利用基因的差異表達分別對基因啟動子,增強子區(qū)域構(gòu)造階段特異性基因簇:起始階段、成熟階段和穩(wěn)定階段。并將得到的結(jié)果作為類別標簽;步驟2.提取特征:統(tǒng)計Oct4及RNApol在階段特異性基因簇區(qū)域的結(jié)合peak總量,將其作為模型的前兩個特征,第三個特征為標準化的基因表達值,后兩個特征分別是Oct4和RNApol乘法交互項、基因表達值平方交互項;步驟3.初始化網(wǎng)絡:根據(jù)階段特異性基因簇的定義確定網(wǎng)絡輸入層節(jié)點數(shù)為5、隱含層節(jié)點數(shù)為3,輸出層節(jié)點數(shù)為3,并初始化輸入層、隱含層和輸出層神經(jīng)元之間的連接權(quán)值,初始化隱含層閾值,輸出層閾值,給定學習速率0.0075和神經(jīng)元激勵函數(shù)sigmoid:步驟4.網(wǎng)絡訓練:取定迭代次數(shù)為10000,計算隱含層輸出,輸出層及誤差,根據(jù)網(wǎng)絡預測誤差更新權(quán)值及閾值,迭代訓練分類網(wǎng)絡;步驟5.根據(jù)步驟4得到的模型參數(shù),計算出分類方法的評價指標PRF值、Rocarea和準確率等,并對基因啟動子和增強子區(qū)域的預測性能進行評估。3.5結(jié)果與分析通過統(tǒng)計分析和特征組合提取3個階段特異性基因簇的啟動子和增強子區(qū)域Oct4和RNApol的結(jié)合peak信息,獲得5維特征向量,并由此構(gòu)建了三個階段特異性基因簇的分類預測模型Oct4-BP。基于Oct4-BP模型,我們得到了基因啟動子和增強子區(qū)域的分類預測結(jié)
內(nèi)蒙古大學碩士學位論文21果,如圖3.3-3.4所示。由圖3.3-3.4可以看出,對于Rocarea,增強子區(qū)域的分類結(jié)果比啟動子區(qū)域的分類結(jié)果提升了4%。圖3.3基于Oct4的階段特異性基因簇的預測結(jié)果:啟動子區(qū)域特征預測結(jié)果Figure3.3Predictionresultsofphase-specificgeneclustersbasedonOct4:predictionresultsinpromoterregioncharacteristics
【參考文獻】:
期刊論文
[1]基于詞向量語義分類的微博實體鏈接方法[J]. 馮沖,石戈,郭宇航,龔靜,黃河燕. 自動化學報. 2016(06)
[2]染色質(zhì)免疫共沉淀-測序(ChIP-Seq)技術(shù)及數(shù)據(jù)分析方法介紹[J]. 楊薇,劉若水. 河南科學. 2014(08)
[3]基于證據(jù)理論的多分類器中文微博觀點句識別[J]. 郭云龍,潘玉斌,張澤宇,李莉. 計算機工程. 2014(04)
[4]SVM多類別分類方法在客戶流失預測中的應用研究[J]. 李興國,謝偉,盧光松. 計算機應用與軟件. 2010(03)
碩士論文
[1]小鼠誘導性多潛能干細胞系的建立與鑒定[D]. 申紅芬.中南大學 2009
[2]擬南芥一具亮氨酸拉鏈的轉(zhuǎn)錄因子的功能研究與表達分析[D]. 邊金艷.山東師范大學 2008
本文編號:3291153
【文章來源】:內(nèi)蒙古大學內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
細胞重編程過程
在細胞重編程過程中階段特異性基因簇的預測研究20圖3.2Oct4-BP模型Figure3.2ThemodelofOct4-BP基于Oct4-BP方法的階段特異性基因簇的分類預測模型的步驟為如下:步驟1.構(gòu)造分類:在已有的研究基礎(chǔ)上,進一步利用基因的差異表達分別對基因啟動子,增強子區(qū)域構(gòu)造階段特異性基因簇:起始階段、成熟階段和穩(wěn)定階段。并將得到的結(jié)果作為類別標簽;步驟2.提取特征:統(tǒng)計Oct4及RNApol在階段特異性基因簇區(qū)域的結(jié)合peak總量,將其作為模型的前兩個特征,第三個特征為標準化的基因表達值,后兩個特征分別是Oct4和RNApol乘法交互項、基因表達值平方交互項;步驟3.初始化網(wǎng)絡:根據(jù)階段特異性基因簇的定義確定網(wǎng)絡輸入層節(jié)點數(shù)為5、隱含層節(jié)點數(shù)為3,輸出層節(jié)點數(shù)為3,并初始化輸入層、隱含層和輸出層神經(jīng)元之間的連接權(quán)值,初始化隱含層閾值,輸出層閾值,給定學習速率0.0075和神經(jīng)元激勵函數(shù)sigmoid:步驟4.網(wǎng)絡訓練:取定迭代次數(shù)為10000,計算隱含層輸出,輸出層及誤差,根據(jù)網(wǎng)絡預測誤差更新權(quán)值及閾值,迭代訓練分類網(wǎng)絡;步驟5.根據(jù)步驟4得到的模型參數(shù),計算出分類方法的評價指標PRF值、Rocarea和準確率等,并對基因啟動子和增強子區(qū)域的預測性能進行評估。3.5結(jié)果與分析通過統(tǒng)計分析和特征組合提取3個階段特異性基因簇的啟動子和增強子區(qū)域Oct4和RNApol的結(jié)合peak信息,獲得5維特征向量,并由此構(gòu)建了三個階段特異性基因簇的分類預測模型Oct4-BP。基于Oct4-BP模型,我們得到了基因啟動子和增強子區(qū)域的分類預測結(jié)
內(nèi)蒙古大學碩士學位論文21果,如圖3.3-3.4所示。由圖3.3-3.4可以看出,對于Rocarea,增強子區(qū)域的分類結(jié)果比啟動子區(qū)域的分類結(jié)果提升了4%。圖3.3基于Oct4的階段特異性基因簇的預測結(jié)果:啟動子區(qū)域特征預測結(jié)果Figure3.3Predictionresultsofphase-specificgeneclustersbasedonOct4:predictionresultsinpromoterregioncharacteristics
【參考文獻】:
期刊論文
[1]基于詞向量語義分類的微博實體鏈接方法[J]. 馮沖,石戈,郭宇航,龔靜,黃河燕. 自動化學報. 2016(06)
[2]染色質(zhì)免疫共沉淀-測序(ChIP-Seq)技術(shù)及數(shù)據(jù)分析方法介紹[J]. 楊薇,劉若水. 河南科學. 2014(08)
[3]基于證據(jù)理論的多分類器中文微博觀點句識別[J]. 郭云龍,潘玉斌,張澤宇,李莉. 計算機工程. 2014(04)
[4]SVM多類別分類方法在客戶流失預測中的應用研究[J]. 李興國,謝偉,盧光松. 計算機應用與軟件. 2010(03)
碩士論文
[1]小鼠誘導性多潛能干細胞系的建立與鑒定[D]. 申紅芬.中南大學 2009
[2]擬南芥一具亮氨酸拉鏈的轉(zhuǎn)錄因子的功能研究與表達分析[D]. 邊金艷.山東師范大學 2008
本文編號:3291153
本文鏈接:http://www.sikaile.net/shoufeilunwen/benkebiyelunwen/3291153.html
最近更新
教材專著