8. 植物比較基因組學(xué)和數(shù)據(jù)庫(kù)
最近,農(nóng)作物和家畜核苷酸序列的積累,使我們能夠在全基因組范圍內(nèi)比較分析模式生物的基因和發(fā)現(xiàn)新的涉及表型的相關(guān)基因。從不同物種得來(lái)的基因組的整合信息,如大規(guī)模收集的cDNA和全基因組測(cè)序計(jì)劃的數(shù)據(jù)將有利于我們共享關(guān)于模式生物和應(yīng)用生物基因功能的信息,也將加速重要農(nóng)藝性狀相關(guān)的分子水平的研究。在網(wǎng)絡(luò)上可以訪問(wèn)的一些植物基因組學(xué)的信息資源已經(jīng)出現(xiàn),另外還有一些適當(dāng)?shù)姆治龉ぞ。?是植物基因組一些個(gè)綜合數(shù)據(jù)庫(kù)的網(wǎng)址。
表4 植物綜合數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù) 植物 網(wǎng)址
TAIR 擬南芥
SIGnAL 擬南芥
RARGE 擬南芥
Rice Genome Annotation Project 水稻
RAP-DB 水稻
SOL genomics network 茄科
Gramene 禾本科
GrainGenes 麥類作物
SoyBase 大豆
MazieGDB 玉米
CyanoBase 藍(lán)細(xì)菌
GDR (Genome Database for Rosaceae) 薔薇科
Brassica Genome Gateway 蕓苔
Cucurbit Genomics Database 葫蘆科
Phytozome 植物 (全基因組信息)
PlantGDB 植物(全基因組或/大規(guī)模 EST信息)
EnsemblPlants 植物(全基因組信息)
ChloroplastDB 植物(葉綠體基因組)
KEGG PLANT 植物(全基因組或/大規(guī)模 EST信息)
8.1 植物門戶網(wǎng)站信息資源
TAIR是位于美國(guó)的擬南芥信息資源網(wǎng)站(The Arabidopsis Information Resource, TAIR)(),也是國(guó)際上最為權(quán)威的擬南芥基因組數(shù)據(jù)庫(kù)和擬南芥基因組注釋系統(tǒng)。它具有豐富的數(shù)據(jù)資源和最新的注釋信息。擬南芥轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)DATF的每個(gè)條目都有TAIR鏈接,可以直接查看最新更新信息。Salk研究所基因組分析實(shí)驗(yàn)室(The Salk Institute Genomic Analysis Laboratory,SIGnAL) 也主要是一個(gè)涉及擬南芥的信息資源(),,它整合了各種組學(xué)數(shù)據(jù)。RIKEN植物科學(xué)研究中心的基因組的百科全書(The RIKEN Arabidopsis Genome Encyclopedia,RARGE) 能夠提供關(guān)于擬南芥的各種組學(xué)信息()。上述這樣的門戶網(wǎng)站都提供了獲取組學(xué)綜合數(shù)據(jù)的生物資源,還設(shè)有注解基因的數(shù)據(jù),如基因的全長(zhǎng)cDNA克隆、基因突變、基因表達(dá)模式和基因組中的同源基因Gramene 是谷類比較圖譜的資源網(wǎng)站。它是一個(gè)協(xié)助性的、以網(wǎng)絡(luò)為基礎(chǔ)的公開(kāi)性數(shù)據(jù)資源,致力于稻科植物的比較基因組分析。Gramene的目標(biāo)是使用公用工程信息促進(jìn)交叉物種的同源關(guān)系研究。這些公用工程信息包括基因組、EST序列、蛋白質(zhì)結(jié)構(gòu)和功能分析、遺傳學(xué)和物理圖譜、生物化學(xué)通路的闡述、表型特征和突變的QTL定位及描述。作為一個(gè)信息源,Gramene可以在公共資源中提供更多有價(jià)值的資料,便于研究者利用。
隨著基因組測(cè)序計(jì)劃的實(shí)施,分享組學(xué)進(jìn)展成果和整合相關(guān)資源的門戶網(wǎng)站也相繼推出。其中包括番茄基因組測(cè)序計(jì)劃的基因組信息資源門戶網(wǎng)站()。 SoyBase是大豆基因組研究資源的門戶網(wǎng)站,它公布全基因組序列數(shù)據(jù)()。MaizeGDB是關(guān)于玉米生物信息社會(huì)的數(shù)據(jù)庫(kù),包括遺傳和基因組數(shù)據(jù)集和相關(guān)信息()。Sol 基因組網(wǎng)絡(luò)是茄科植物基因組的門戶網(wǎng)站,包含有番茄基因組計(jì)劃的信息資源()。此外還有大豆數(shù)據(jù)庫(kù)SoyBase(),它是一個(gè)全面的大豆遺傳學(xué)和基因組學(xué)的信息資源庫(kù)。玉米基因組的網(wǎng)站在(),該數(shù)據(jù)庫(kù)包括玉米所有遺傳學(xué)、基因產(chǎn)物、功能分析以及相關(guān)文獻(xiàn)查閱等的信息。
8.2 植物種間基因組尺度比較
隨著一些植物物種基因組測(cè)序的完成,基因組規(guī)模的比較分析開(kāi)始能夠被用來(lái)開(kāi)發(fā)數(shù)據(jù)和發(fā)布數(shù)據(jù)集,以識(shí)別植物物種之間保守或特殊的性質(zhì)。
人們已經(jīng)利用從模式生物基因組測(cè)序推導(dǎo)出的蛋白質(zhì)組數(shù)據(jù)集,完成了若干項(xiàng)嘗試,目的是建立平臺(tái),以驗(yàn)證基因和闡明基因重復(fù)和種間基因功能的多樣化。全面基因家族的數(shù)據(jù)集通常利用計(jì)算機(jī)程序來(lái)完成,包括進(jìn)先行一次所有的序列相似性搜索,然后是聚類蛋白質(zhì)家族,方法如馬爾可夫聚類(Markov Clustering,MCL)或蛋白質(zhì)結(jié)構(gòu)域分析等。
物種間基因的排列以及相關(guān)的染色體定位也被稱為同線性或共線性,這已經(jīng)成為從共同祖先基因推導(dǎo)到一個(gè)相關(guān)的物種的重要方法。植物基因組復(fù)制數(shù)據(jù)庫(kù)(The plant genome duplication database,PGDD)能夠提供植物全基因組序列和基因組同線性關(guān)系( .agtec.uga.edu/duplication/)。
8.3 植物基因組學(xué)重點(diǎn)數(shù)據(jù)庫(kù)
序列特異性DNA結(jié)合結(jié)構(gòu)域是關(guān)鍵的分子開(kāi)關(guān),它能夠控制或影響許多生物過(guò)程,例如發(fā)育或?qū)Νh(huán)境的變化反應(yīng)等。在植物中,擬南芥全基因組范圍內(nèi),鑒定編碼轉(zhuǎn)錄因子基因的實(shí)驗(yàn)最早實(shí)施和公布,這些信息與其它生物比較,揭示了一些植物特有轉(zhuǎn)錄因子的特點(diǎn)。在過(guò)去的十年中,通過(guò)完整的基因組序列信息的利用,人們已經(jīng)能夠在一些生物中匯編描述轉(zhuǎn)錄因子調(diào)節(jié)系統(tǒng)和功能的組織結(jié)構(gòu)網(wǎng)絡(luò)。有很多數(shù)據(jù)庫(kù)可以提供植物編碼轉(zhuǎn)錄因子基因的信息,這些信息通常是基于計(jì)算機(jī)方法的預(yù)測(cè),如序列的相似性搜索或/和隱含馬爾可夫搜索保守的DNA結(jié)合結(jié)構(gòu)域(表5)。
Database URL Species
RARTF 擬南芥
AGRIS, AtTFDB 擬南芥
DATF 擬南芥
DRTF 水稻
DPTF 白楊
TOBFAC 煙草
SoybeanTFDB 大豆
PlantTFDB 22種植物
PlnTFDB 20種植物
GRASSIUS, GrassTFDB 玉米、水稻、高粱、甘蔗
LegumeTFDB 大豆、百脈根、蒺藜苜蓿
DBD ?Home 多于700物種
最近,深入的轉(zhuǎn)錄因子編碼基因數(shù)據(jù)庫(kù)整合已經(jīng)完成,從而建立了一個(gè)綜合性的、基于轉(zhuǎn)錄因子信息的比較基因組學(xué)轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)。 GRASSIUS邁出了建立一個(gè)全面信息平臺(tái)的第一步,這個(gè)平臺(tái)能夠整合信息、工具和植物比較基因組學(xué)的調(diào)控資源。GRASSIUS 的禾草類轉(zhuǎn)錄因子數(shù)據(jù)集(The Grass Transcription Factor Database,GrassTFDB)整合了玉米轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)(MaizeTFDB)、水稻轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)(RiceTFDB)、高粱轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)(SorghumTFDB)和甘蔗轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)(CaneTFDB)()。GRASSIUS的豆科植物轉(zhuǎn)錄因子數(shù)據(jù)集(GrassTFDB)提供了豆科植物預(yù)測(cè)的轉(zhuǎn)錄因子編碼基因,這些基因來(lái)自豆科3個(gè)主要品種(大豆、益母草和截型苜蓿)的基因組注解()。這個(gè)數(shù)據(jù)庫(kù)是SoybeanTFDB()的擴(kuò)展版本,目的是整合豆科植物轉(zhuǎn)錄因子的知識(shí),并提供豆科植物的公共資源,并用于豆科植物、非豆科植物或其他植物轉(zhuǎn)錄因子的比較基因組學(xué)。
原文檢索
Mochida K & Shinozaki K. Genomics and bioinformatics resources for crop improvement. Plant Cell Physiol. 2010, 51(4):497-523.
謝兆輝、焦傳珍/編譯
本文編號(hào):32054
本文鏈接:http://www.sikaile.net/wenshubaike/arkj/32054.html