ATAC測(cè)序鑒定牦;蚪M非編碼保守元件
發(fā)布時(shí)間:2021-04-13 20:25
非編碼保守元件(conserved non-coding elements,CNEs)是指在基因組中不編碼蛋白質(zhì)、也不編碼rRNA或tRNA,但是在進(jìn)化過(guò)程中極為保守的非編碼序列。CNEs普遍存在于基因組中,多聚集在發(fā)育相關(guān)基因附近,在基因組中扮演著多種調(diào)控元件角色,直接或間接參與基因表達(dá)調(diào)控,影響物種的發(fā)育、表型和適應(yīng)性進(jìn)化。牦牛作為青藏高原特有畜種,對(duì)青藏高原的極端環(huán)境具有極強(qiáng)的適應(yīng)能力。近來(lái)多組學(xué)研究已經(jīng)從不同層面對(duì)牦牛的高原適應(yīng)機(jī)制進(jìn)行了研究,鑒定到一批與高原適應(yīng)性相關(guān)的基因,但是相關(guān)的調(diào)控元件及其調(diào)控機(jī)制仍然缺乏系統(tǒng)研究。本論文通過(guò)比較基因組學(xué)鑒定牦牛基因組CNEs,并對(duì)牦牛心臟組織進(jìn)行ATAC測(cè)序揭示全基因組中具有調(diào)控活性的序列,最后綜合鑒定在牦;蚪M中與高原適應(yīng)性相關(guān)的保守調(diào)控元件,為理解牦牛高原適應(yīng)機(jī)制提供新的候選元件和新視角。首先,基于比較基因組學(xué)的方法對(duì)?频狞S牛、歐洲野牛、北美野牛、瘤牛、大額牛、水牛、牦牛七個(gè)物種基因組序列進(jìn)行多重比對(duì),基于PhastCons軟件,鑒定了3,653個(gè)具有調(diào)控功能的候選非編碼保守元件,對(duì)這些CNEs附近的基因進(jìn)行GO富集分析,發(fā)現(xiàn)...
【文章來(lái)源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CNE序列中堿基特征
蘭州大學(xué)碩士學(xué)位論文ATAC測(cè)序鑒定牦;蚪M非編碼保守元件12其中,ATAC-seq(AssayforTransposase-AccessibleChromatinwithhighthroughputsequencing,ATAC-seq)是2013年由美國(guó)斯坦福大學(xué)WilliamGreenleaf開發(fā)的檢測(cè)開放染色質(zhì)的方法[146],可以在高分辨率全基因組水平上檢測(cè)開放染色質(zhì)區(qū)域中的調(diào)控元件,適用于多種細(xì)胞類型和物種,該技術(shù)主要依賴于高活性Tn5轉(zhuǎn)座酶對(duì)開放區(qū)域的高敏感性來(lái)檢測(cè)開放染色質(zhì)區(qū)域并獲得功能元件(圖1.2)。相比DNase-seq[150]、MNase-seq[151]和FAIRE-seq[152]方法,ATAC-seq建庫(kù)所需細(xì)胞量少,實(shí)驗(yàn)重復(fù)性好對(duì)測(cè)序深度要求低,操作簡(jiǎn)單,可以快速高效地實(shí)現(xiàn)全基因組染色質(zhì)開放區(qū)域調(diào)控元件的鑒定。傳統(tǒng)的建庫(kù)方式需要經(jīng)過(guò)DNA片段化、末端修復(fù)、接頭連接、文庫(kù)擴(kuò)建、多次純化分選等多個(gè)繁瑣的步驟,耗時(shí)很長(zhǎng)[153]。在ATAC-seq中,僅僅需要500-50,000個(gè)細(xì)胞就可以在很短的時(shí)間內(nèi)建庫(kù),因?yàn)門n5轉(zhuǎn)座酶可同時(shí)切割足夠長(zhǎng)的裸露DNA并標(biāo)記測(cè)序接頭,可將傳統(tǒng)的繁瑣建庫(kù)方法整合為1步完成,從而高效率地準(zhǔn)確分析染色質(zhì)開放區(qū)域,并同時(shí)獲得轉(zhuǎn)錄因子的結(jié)合位點(diǎn)、核小體區(qū)域以及開放染色質(zhì)的位置等信息,現(xiàn)已成為研究染色質(zhì)開放區(qū)域調(diào)控元件的主要方法。圖1.2ATAC-seq示意圖(摘自Annunziatoelal,2008)Fig1.2ATAC-seqreactionschematic
蘭州大學(xué)碩士學(xué)位論文ATAC測(cè)序鑒定牦;蚪M非編碼保守元件20圖2.1CNEs方法流程Fig2.1Methodsforfindingconservednon-codingelements2.3非編碼保守元件分析2.3.1基因組功能元件分布注釋基因組中非編碼保守元件,可能存在一定的調(diào)控功能。一般來(lái)說(shuō),蛋白編碼基因附近的調(diào)控元件會(huì)更有可能參與調(diào)控基因的表達(dá)。所以我們首先考慮確認(rèn)這些CNEs在基因附近的位置分布,根據(jù)牦;蚪M蛋白編碼基因注釋文件劃分四個(gè)非重疊組:5’10kb區(qū)域(相對(duì)于翻譯起始位點(diǎn)),3’10kb區(qū)域(相對(duì)于翻譯終止位點(diǎn)),內(nèi)含子和基因間區(qū),計(jì)算落在基因組中這幾個(gè)區(qū)域內(nèi)CNEs的比例。2.3.2motif分析轉(zhuǎn)錄因子結(jié)合位點(diǎn)是基因組中轉(zhuǎn)錄因子特異性結(jié)合的調(diào)控區(qū)域的DNA序列,TFBS位置權(quán)重矩陣也成稱為motif。它是基因組中一種特征序列,這種特征性序列motif在一定程度上也影響基因的表達(dá)調(diào)控,通常在非編碼保守序列中包括有轉(zhuǎn)錄因子結(jié)合位點(diǎn)[111]。我們使用MEME(http://meme-suite.org/)基于EM[171]算法來(lái)尋找motif。一般在編碼基因附近的序列更有可能具有功能性,為了獲得更可能具有調(diào)控功能的CNEs,首先我們根據(jù)牦;蚪M蛋白質(zhì)編碼基因注釋文件,計(jì)算篩選出在蛋白編碼基因上下游附近10kb范圍內(nèi)CNEs,使用bedtools獲取這部分CNEs的基因組序列文件。MEME輸入文件為CNEs對(duì)應(yīng)的fasta格式文件,參數(shù)設(shè)定modzoops,evt<0.05,minw=6,maxw=50來(lái)獲得較長(zhǎng)的motif。之后對(duì)
【參考文獻(xiàn)】:
博士論文
[1]ATAC-seq數(shù)據(jù)分析軟件開發(fā)及其在肥胖誘導(dǎo)的慢性炎癥研究中的應(yīng)用[D]. 左祖奇.中國(guó)科學(xué)技術(shù)大學(xué) 2019
[2]牦牛全基因組CNV及高原適應(yīng)性候選基因(HO1)的研究[D]. 張全偉.甘肅農(nóng)業(yè)大學(xué) 2015
本文編號(hào):3135954
【文章來(lái)源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CNE序列中堿基特征
蘭州大學(xué)碩士學(xué)位論文ATAC測(cè)序鑒定牦;蚪M非編碼保守元件12其中,ATAC-seq(AssayforTransposase-AccessibleChromatinwithhighthroughputsequencing,ATAC-seq)是2013年由美國(guó)斯坦福大學(xué)WilliamGreenleaf開發(fā)的檢測(cè)開放染色質(zhì)的方法[146],可以在高分辨率全基因組水平上檢測(cè)開放染色質(zhì)區(qū)域中的調(diào)控元件,適用于多種細(xì)胞類型和物種,該技術(shù)主要依賴于高活性Tn5轉(zhuǎn)座酶對(duì)開放區(qū)域的高敏感性來(lái)檢測(cè)開放染色質(zhì)區(qū)域并獲得功能元件(圖1.2)。相比DNase-seq[150]、MNase-seq[151]和FAIRE-seq[152]方法,ATAC-seq建庫(kù)所需細(xì)胞量少,實(shí)驗(yàn)重復(fù)性好對(duì)測(cè)序深度要求低,操作簡(jiǎn)單,可以快速高效地實(shí)現(xiàn)全基因組染色質(zhì)開放區(qū)域調(diào)控元件的鑒定。傳統(tǒng)的建庫(kù)方式需要經(jīng)過(guò)DNA片段化、末端修復(fù)、接頭連接、文庫(kù)擴(kuò)建、多次純化分選等多個(gè)繁瑣的步驟,耗時(shí)很長(zhǎng)[153]。在ATAC-seq中,僅僅需要500-50,000個(gè)細(xì)胞就可以在很短的時(shí)間內(nèi)建庫(kù),因?yàn)門n5轉(zhuǎn)座酶可同時(shí)切割足夠長(zhǎng)的裸露DNA并標(biāo)記測(cè)序接頭,可將傳統(tǒng)的繁瑣建庫(kù)方法整合為1步完成,從而高效率地準(zhǔn)確分析染色質(zhì)開放區(qū)域,并同時(shí)獲得轉(zhuǎn)錄因子的結(jié)合位點(diǎn)、核小體區(qū)域以及開放染色質(zhì)的位置等信息,現(xiàn)已成為研究染色質(zhì)開放區(qū)域調(diào)控元件的主要方法。圖1.2ATAC-seq示意圖(摘自Annunziatoelal,2008)Fig1.2ATAC-seqreactionschematic
蘭州大學(xué)碩士學(xué)位論文ATAC測(cè)序鑒定牦;蚪M非編碼保守元件20圖2.1CNEs方法流程Fig2.1Methodsforfindingconservednon-codingelements2.3非編碼保守元件分析2.3.1基因組功能元件分布注釋基因組中非編碼保守元件,可能存在一定的調(diào)控功能。一般來(lái)說(shuō),蛋白編碼基因附近的調(diào)控元件會(huì)更有可能參與調(diào)控基因的表達(dá)。所以我們首先考慮確認(rèn)這些CNEs在基因附近的位置分布,根據(jù)牦;蚪M蛋白編碼基因注釋文件劃分四個(gè)非重疊組:5’10kb區(qū)域(相對(duì)于翻譯起始位點(diǎn)),3’10kb區(qū)域(相對(duì)于翻譯終止位點(diǎn)),內(nèi)含子和基因間區(qū),計(jì)算落在基因組中這幾個(gè)區(qū)域內(nèi)CNEs的比例。2.3.2motif分析轉(zhuǎn)錄因子結(jié)合位點(diǎn)是基因組中轉(zhuǎn)錄因子特異性結(jié)合的調(diào)控區(qū)域的DNA序列,TFBS位置權(quán)重矩陣也成稱為motif。它是基因組中一種特征序列,這種特征性序列motif在一定程度上也影響基因的表達(dá)調(diào)控,通常在非編碼保守序列中包括有轉(zhuǎn)錄因子結(jié)合位點(diǎn)[111]。我們使用MEME(http://meme-suite.org/)基于EM[171]算法來(lái)尋找motif。一般在編碼基因附近的序列更有可能具有功能性,為了獲得更可能具有調(diào)控功能的CNEs,首先我們根據(jù)牦;蚪M蛋白質(zhì)編碼基因注釋文件,計(jì)算篩選出在蛋白編碼基因上下游附近10kb范圍內(nèi)CNEs,使用bedtools獲取這部分CNEs的基因組序列文件。MEME輸入文件為CNEs對(duì)應(yīng)的fasta格式文件,參數(shù)設(shè)定modzoops,evt<0.05,minw=6,maxw=50來(lái)獲得較長(zhǎng)的motif。之后對(duì)
【參考文獻(xiàn)】:
博士論文
[1]ATAC-seq數(shù)據(jù)分析軟件開發(fā)及其在肥胖誘導(dǎo)的慢性炎癥研究中的應(yīng)用[D]. 左祖奇.中國(guó)科學(xué)技術(shù)大學(xué) 2019
[2]牦牛全基因組CNV及高原適應(yīng)性候選基因(HO1)的研究[D]. 張全偉.甘肅農(nóng)業(yè)大學(xué) 2015
本文編號(hào):3135954
本文鏈接:http://www.sikaile.net/shoufeilunwen/zaizhiyanjiusheng/3135954.html
最近更新
教材專著