天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于系統(tǒng)發(fā)育基因組學(xué)分析解決困難進(jìn)化問(wèn)題的策略研究

發(fā)布時(shí)間:2019-09-19 16:32
【摘要】:隨著高通量測(cè)序技術(shù)的快速發(fā)展,分子系統(tǒng)發(fā)育學(xué)進(jìn)入了以海量數(shù)據(jù)為特征的系統(tǒng)發(fā)育基因組學(xué)時(shí)代(phylogenomics)。組學(xué)大數(shù)據(jù)給分子系統(tǒng)發(fā)育學(xué)帶來(lái)了前所未有的機(jī)遇,許多傳統(tǒng)系統(tǒng)發(fā)育學(xué)難以解析的生物類群進(jìn)化關(guān)系通過(guò)增加數(shù)據(jù)有了明確的結(jié)果。然而隨著研究的深入,學(xué)者們發(fā)現(xiàn)在海量數(shù)據(jù)中,“信號(hào)”與“噪音”是并存的。當(dāng)我們探究少數(shù)十分棘手的系統(tǒng)發(fā)育關(guān)系時(shí)(例如經(jīng)歷快速輻射性進(jìn)化類群的親緣關(guān)系),使用現(xiàn)有的分析方法可能出現(xiàn)稀少的真實(shí)“信號(hào)”(phylogenetic signal)被系統(tǒng)誤差引起的“噪音”(phylogenetic noise)完全掩蓋的情況,致使我們得出一個(gè)解析度高但不能反映真實(shí)進(jìn)化歷史的系統(tǒng)發(fā)育關(guān)系。本論文的工作在于試圖突破現(xiàn)有的數(shù)據(jù)分析瓶頸,從提出新的數(shù)據(jù)分析思路及選擇新的數(shù)據(jù)類型入手,運(yùn)用海量數(shù)據(jù)解決極具爭(zhēng)議的有頜類脊椎動(dòng)物系統(tǒng)發(fā)育框架及勞亞獸總目各目間親緣關(guān)系問(wèn)題。Ⅰ.有頜類脊椎動(dòng)物系統(tǒng)發(fā)育基因組學(xué)研究如何從海量數(shù)據(jù)中篩選出真實(shí)的“信號(hào)”,降低數(shù)據(jù)中存在的“噪音”,以得到一個(gè)穩(wěn)定且真實(shí)的系統(tǒng)發(fā)育關(guān)系是系統(tǒng)發(fā)育基因組學(xué)研究的重要課題。目前常見(jiàn)的提升數(shù)據(jù)質(zhì)量的方法包括選擇更完整的數(shù)據(jù)集、選擇進(jìn)化歷程與現(xiàn)有模型更匹配的慢速進(jìn)化的基因等等。但缺乏實(shí)例對(duì)這些數(shù)據(jù)篩選方法進(jìn)行橫向評(píng)估比較。有頜類脊椎動(dòng)物系統(tǒng)發(fā)育框架上許多節(jié)點(diǎn)即使進(jìn)入大數(shù)據(jù)時(shí)代仍頗具爭(zhēng)議,使得其成為檢驗(yàn)現(xiàn)有數(shù)據(jù)篩選方案的絕佳例子。本研究基于新測(cè)的10個(gè)有頜類脊椎動(dòng)物物種的轉(zhuǎn)錄組數(shù)據(jù)結(jié)合公共數(shù)據(jù)庫(kù)中的基因組及轉(zhuǎn)錄組數(shù)據(jù),構(gòu)建了一個(gè)包含58個(gè)物種,4682個(gè)蛋白質(zhì)編碼基因的氨基酸數(shù)據(jù)集,用于探索有頜類脊椎動(dòng)物系統(tǒng)發(fā)育框架問(wèn)題。另外,我們選取了有頜類脊椎動(dòng)物系統(tǒng)發(fā)育樹(shù)上六個(gè)具有爭(zhēng)議的節(jié)點(diǎn)作為測(cè)試對(duì)象,對(duì)已有的數(shù)據(jù)篩選方案進(jìn)行分析及評(píng)估。結(jié)果顯示,每個(gè)測(cè)試問(wèn)題均存在大量的沖突信號(hào),而現(xiàn)有的數(shù)據(jù)篩選方案在解決具有多個(gè)困難問(wèn)題的系統(tǒng)發(fā)育關(guān)系時(shí),提升數(shù)據(jù)信噪比的效果不佳,篩選數(shù)據(jù)建樹(shù)結(jié)果不穩(wěn)定且高度不一致,重建的系統(tǒng)發(fā)育關(guān)系會(huì)隨著數(shù)據(jù)集大小及建樹(shù)方法的不同而發(fā)生改變。基于此現(xiàn)象,我們提出了問(wèn)題針對(duì)型(question-specific)數(shù)據(jù)篩選策略,即針對(duì)每個(gè)困難問(wèn)題生成特定的篩選數(shù)據(jù)集。該策略包括兩種不同的方法,方法一為明確表態(tài)法,即將不能明確支持有關(guān)困難問(wèn)題所有假說(shuō)中任意一種的基因從數(shù)據(jù)集中刪除。方法二為節(jié)點(diǎn)原則法,是指所選的基因必須能夠支持與研究問(wèn)題具有相關(guān)性的特定的拓?fù)浣Y(jié)構(gòu)。經(jīng)檢驗(yàn),問(wèn)題針對(duì)型數(shù)據(jù)篩選策略在六個(gè)測(cè)試對(duì)象中均有效地提高了數(shù)據(jù)信噪比,所得結(jié)果具有魯棒性。利用目前最大的有頜類脊椎動(dòng)物數(shù)據(jù)集,我們提供了一個(gè)可靠的有頜類脊椎動(dòng)物系統(tǒng)框架。除此之外,我們的結(jié)果再次證明了簡(jiǎn)單的增加數(shù)據(jù)在解決某些難點(diǎn)問(wèn)題時(shí)是遠(yuǎn)遠(yuǎn)不夠的。我們提出的問(wèn)題針對(duì)型數(shù)據(jù)篩選策略也為今后解決生命之樹(shù)上的困難節(jié)點(diǎn)提供了新思路。Ⅱ.勞亞獸總目系統(tǒng)發(fā)育基因組學(xué)研究厘清經(jīng)歷輻射性進(jìn)化(rapid radiation)類群的親緣關(guān)系一直是困擾進(jìn)化生物學(xué)家的難題。各物種在極短的時(shí)間完成物種分化及形成意味著僅有很少的能夠反應(yīng)真實(shí)進(jìn)化歷史的“信號(hào)”得以在序列中積累。出于數(shù)據(jù)的易得性及易操作性,現(xiàn)有大部分研究都以進(jìn)化速度較慢的蛋白質(zhì)編碼序列作為數(shù)據(jù)源進(jìn)行系統(tǒng)發(fā)育學(xué)分析,而鮮少使用進(jìn)化速度更快的非編碼區(qū)序列推斷快速輻射類群的親緣關(guān)系。勞亞獸是經(jīng)歷快速輻射性進(jìn)化的代表類群,其各目間親緣關(guān)系一直存在很大爭(zhēng)議,且前人研究大多基于蛋白質(zhì)編碼序列。為了解決這一歷史難題,我們利用公共數(shù)據(jù)庫(kù)中基因組數(shù)據(jù)構(gòu)建了兩個(gè)數(shù)據(jù)集,物種取樣涵蓋了除鱗甲目之外的其他5個(gè)目代表物種,形成由3638個(gè)基因構(gòu)成的全長(zhǎng)為19,055,073 bp的內(nèi)含子數(shù)據(jù)集及由10259個(gè)基因構(gòu)成的全長(zhǎng)為20,994,285 bp的蛋白質(zhì)編碼序列數(shù)據(jù)集,并分別采用超級(jí)矩陣方法及基于溯祖理論的物種樹(shù)方法對(duì)勞亞獸各目間發(fā)育關(guān)系進(jìn)行推斷。數(shù)據(jù)分析結(jié)果表明,內(nèi)含子數(shù)據(jù)相比于蛋白質(zhì)編碼數(shù)據(jù)在解決勞亞獸問(wèn)題中有更強(qiáng)且勻質(zhì)的系統(tǒng)發(fā)育信號(hào)。對(duì)建樹(shù)結(jié)果比較發(fā)現(xiàn),內(nèi)含子數(shù)據(jù)使用兩種方法建樹(shù)所得拓?fù)浣Y(jié)構(gòu)一致,且所有節(jié)點(diǎn)以支持率100%解析,而蛋白質(zhì)編碼序列得到的拓?fù)浣Y(jié)構(gòu)不一致,且得到的系統(tǒng)發(fā)育關(guān)系解析度低。為了檢驗(yàn)內(nèi)含子的高解析度系統(tǒng)發(fā)育樹(shù)不是由于系統(tǒng)誤差造成的錯(cuò)誤結(jié)果,我們通過(guò)不同數(shù)據(jù)篩選條件對(duì)內(nèi)含子數(shù)據(jù)進(jìn)行重采樣并建樹(shù),并對(duì)蛋白質(zhì)編碼序列數(shù)據(jù)集做同樣處理。同時(shí)本研究還探究了不同外類群的組合方式對(duì)內(nèi)含子建樹(shù)及蛋白質(zhì)編碼序列建樹(shù)的影響。研究結(jié)果表明,數(shù)據(jù)重采樣及外類群的選擇對(duì)內(nèi)含子數(shù)據(jù)構(gòu)建的系統(tǒng)發(fā)育樹(shù)影響極小,而蛋白質(zhì)編碼序列構(gòu)建的系統(tǒng)發(fā)育樹(shù)會(huì)隨著數(shù)據(jù)篩選條件的不同及外類群的不同組合產(chǎn)生巨大變化。除此之外,通過(guò)統(tǒng)計(jì)數(shù)據(jù)中單基因樹(shù)拓?fù)浣Y(jié)構(gòu)我們發(fā)現(xiàn),無(wú)論是內(nèi)含子數(shù)據(jù)集還是蛋白質(zhì)編碼序列數(shù)據(jù)集,出現(xiàn)頻率最高的單基因樹(shù)的拓?fù)浣Y(jié)構(gòu)與內(nèi)含子完整數(shù)據(jù)集建樹(shù)結(jié)果相同,說(shuō)明從單基因樹(shù)頻率來(lái)看,蛋白質(zhì)編碼序列數(shù)據(jù)中“信號(hào)”與內(nèi)含子數(shù)據(jù)內(nèi)部是一致的。利用目前最大的非編碼的內(nèi)含子序列數(shù)據(jù)集重建勞亞獸各目間親緣關(guān)系,我們得到了一個(gè)穩(wěn)定且完全解析的系統(tǒng)發(fā)育關(guān)系,所得結(jié)果支持真盲缺目位于勞亞獸的基出位置,剩下四個(gè)目分為兩支,奇蹄目與翼手目關(guān)系更近,鯨偶蹄目與食肉目為姐妹類群。這一全新的系統(tǒng)發(fā)育關(guān)系假說(shuō),向揭示勞亞獸的生命之樹(shù)又邁進(jìn)了一步。同時(shí),我們的分析說(shuō)明了包含有更多“信號(hào)”的內(nèi)含子數(shù)據(jù)將是未來(lái)解決生命之樹(shù)上其他經(jīng)歷快速輻射性進(jìn)化的困難節(jié)點(diǎn)的重要數(shù)據(jù)類型。
【圖文】:

所有物,形式,發(fā)育基因,發(fā)育學(xué)


第一章緒論發(fā)育基因組學(xué)概述發(fā)育學(xué)概念上的生物多種多樣,但無(wú)論是原核生物、真核生物、植物、祖先演化而來(lái)。這一部共同進(jìn)化的歷史決定了不同類群之關(guān)聯(lián),而這種關(guān)聯(lián)可以用進(jìn)化樹(shù)的形式進(jìn)行描繪。系統(tǒng)發(fā)tics)正是追溯物種進(jìn)化歷史,并嘗試用生命之樹(shù)形式描述各門(mén)學(xué)科(Tree of Life, 圖 1-1)。

兩棲類,魚(yú)化石,物種,魚(yú)類


解析物種間系統(tǒng)發(fā)育關(guān)系的難點(diǎn)所在。盡管如此,試圖揭開(kāi)歷史的面紗,對(duì)生命進(jìn)化的奧妙一探究竟生物進(jìn)化史最直接的證據(jù)最早被用于系統(tǒng)發(fā)育關(guān)系統(tǒng)發(fā)育關(guān)系推斷具有局限性,因?yàn)?1)化石的數(shù)據(jù)耗費(fèi)大量時(shí)間搜尋與收集;2)目前找到的化石記錄牛一毛,大部分物種的化石記錄稀缺;3)找到的部物種,很難將其歸類到某個(gè)門(mén)類下;4)化石記錄通石記錄間難以找到可供比較的共同特征。基于以上直接用于系統(tǒng)發(fā)育框架的推斷,,而是作為已滅絕物物進(jìn)化歷史的認(rèn)識(shí),如處于從魚(yú)到兩棲類過(guò)渡狀態(tài)實(shí)了從魚(yú)類到兩棲類的進(jìn)化(圖 1-2)。
【學(xué)位授予單位】:中山大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類號(hào)】:Q349

【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 王章群;解增言;蔡應(yīng)繁;舒坤賢;黃飛飛;;系統(tǒng)發(fā)育基因組學(xué)研究進(jìn)展[J];遺傳;2014年07期

2 鄒新慧;葛頌;;基因樹(shù)沖突與系統(tǒng)發(fā)育基因組學(xué)研究[J];植物分類學(xué)報(bào);2008年06期

3 于黎;張亞平;;系統(tǒng)發(fā)育基因組學(xué)——重建生命之樹(shù)的一條迷人途徑[J];遺傳;2006年11期



本文編號(hào):2538244

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/jckxbs/2538244.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5f3d7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com