天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

效應(yīng)蛋白數(shù)據(jù)庫(kù)的構(gòu)建及預(yù)測(cè)方法研究

發(fā)布時(shí)間:2019-12-03 00:25
【摘要】:病原菌是一種能引起感染的微生物,在這個(gè)感染的過(guò)程中細(xì)菌會(huì)侵入到宿主細(xì)胞中產(chǎn)生和分泌效應(yīng)蛋白,這些效應(yīng)蛋白能夠參與或操控細(xì)胞進(jìn)程的各種重要活動(dòng)。目前,有九種分泌系統(tǒng)在革蘭氏陰性菌細(xì)胞中已被發(fā)現(xiàn)。但是并沒(méi)有針對(duì)效應(yīng)蛋白開(kāi)發(fā)的注釋信息數(shù)據(jù)庫(kù)以及對(duì)于效應(yīng)蛋白特征提取和預(yù)測(cè)的研究并不全面,因此構(gòu)建一個(gè)效應(yīng)蛋白數(shù)據(jù)庫(kù)以及借助機(jī)器學(xué)習(xí)算法和數(shù)據(jù)挖掘的相關(guān)技術(shù)對(duì)效應(yīng)蛋白序列進(jìn)行分析,從而能夠完成效應(yīng)蛋白的預(yù)測(cè)具有非常重要的意義。本研究主要針對(duì)目前細(xì)菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中效應(yīng)蛋白的數(shù)據(jù)庫(kù)以及效應(yīng)蛋白預(yù)測(cè)方法存在的不足之處,開(kāi)發(fā)出細(xì)菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中效應(yīng)蛋白的數(shù)據(jù)庫(kù)系統(tǒng)SecretEPDB和提出細(xì)菌Ⅳ型分泌系統(tǒng)中效應(yīng)蛋白的預(yù)測(cè)方法Bastion4。論文主要內(nèi)容如下:(1)細(xì)菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中效應(yīng)蛋白數(shù)據(jù)庫(kù)系統(tǒng)SecretEPDB的構(gòu)建。通過(guò)搜集細(xì)菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)效應(yīng)蛋白數(shù)據(jù),使用生物信息工具或在不同的公開(kāi)數(shù)據(jù)庫(kù)中根據(jù)效應(yīng)蛋白的序列提取其注釋信息。同時(shí)使用MySQL數(shù)據(jù)庫(kù)、Struts 2、Hibernate等計(jì)算機(jī)技術(shù)構(gòu)建SecretEPDB數(shù)據(jù)庫(kù)系統(tǒng)。該數(shù)據(jù)庫(kù)系統(tǒng)能夠?qū)θN效應(yīng)蛋白提供豐富的注釋信息,主要包括:蛋白質(zhì)基本信息、蛋白質(zhì)功能、蛋白質(zhì)二級(jí)結(jié)構(gòu)、Pfam區(qū)域、KEGG通路信息等。與目前其他效應(yīng)蛋白數(shù)據(jù)庫(kù)相比,SecretEPDB數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù)都是經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證的確定性效應(yīng)蛋白序列,并能提供每一條效應(yīng)蛋白多方面的注釋信息和相應(yīng)的統(tǒng)計(jì)分析工作。(2)細(xì)菌Ⅳ型分泌系統(tǒng)效應(yīng)蛋白的預(yù)測(cè)方法Bastion4的研究。該方法的構(gòu)建步驟為搜集細(xì)菌Ⅳ型分泌系統(tǒng)中效應(yīng)蛋白的序列并進(jìn)行數(shù)據(jù)預(yù)處理,計(jì)算并提取蛋白質(zhì)局部序列編碼特征、全局序列編碼特征、結(jié)構(gòu)描述編碼特征等的不同類(lèi)型特征,并使用GainRatio方法進(jìn)行特征選擇,結(jié)合隨機(jī)森林算法構(gòu)建預(yù)測(cè)模型,最后使用集成學(xué)習(xí)算法中多數(shù)投票機(jī)制對(duì)不同的模型進(jìn)行集成,得到細(xì)菌Ⅳ型分泌系統(tǒng)效應(yīng)蛋白的預(yù)測(cè)方法Bastion4。通過(guò)實(shí)驗(yàn)和案例分析證明:使用不同但是互補(bǔ)的蛋白質(zhì)特征能夠更好的提高預(yù)測(cè)性能;在基于單一特征的分類(lèi)器基礎(chǔ)上使用集成學(xué)習(xí)算法能夠更好的完成效應(yīng)蛋白的預(yù)測(cè)。相比于現(xiàn)有的兩個(gè)方法T4EffPred和T4SEpre,Bastion4對(duì)細(xì)菌Ⅳ型分泌系統(tǒng)中效應(yīng)蛋白的預(yù)測(cè)性能最優(yōu),F值高達(dá)94.2%。
【圖文】:

蛋白質(zhì)序列,格式,序列,學(xué)名


酸(Valine)和異亮氨酸(Isoleucine),疏水性相對(duì)弱殘基主要有和甲硫ethionine)、色氨酸(Tryptophan)、甘氨酸(Glycine)和丙氨酸(Alanine)。帶基主要有賴氨酸(Lysine)、精氨酸(Arginine);谷氨酸(Glutamate)、天冬spartate)則為帶負(fù)電的殘基。表 1-3 表示了組成蛋白質(zhì)一級(jí)結(jié)構(gòu)中常見(jiàn)氨基酸及表示形式。氨基酸組成的蛋白質(zhì)序列常用 fasta 格式的文本形式表示,如圖 1-1(A)即是于 NCBI 數(shù)據(jù)庫(kù)蛋白質(zhì)的 fasta 格式,fasta 格式是以“>”開(kāi)頭,接著是序列的gi|1069777805|gb|AOR81463.1|”,所有來(lái)源于 NCBI 的序列均有唯一的 gi 號(hào),是序列的標(biāo)識(shí)符以及序列說(shuō)明,在該條序列中,“gb|AOR81463.1|”則是表明該于 GenBank 的參考數(shù)據(jù)庫(kù),,接收號(hào)是“AOR81463.1”,緊隨其后是序列的描述序列的學(xué)名以及種類(lèi)。此外,圖 1-1(B)是來(lái)自于 UniProt 數(shù)據(jù)庫(kù)的蛋白質(zhì)序以“>”開(kāi)頭,序列標(biāo)識(shí)符是“sp”(也可能是“tr”),序列標(biāo)志還包括該蛋白Prot 數(shù)據(jù)庫(kù)的 ID 號(hào)、學(xué)名、種族信息(OS)、基因組(GN)等信息。換行后是氨基酸序列,每一個(gè)氨基酸的位點(diǎn)是使用代表某個(gè)氨基酸的字母來(lái)表示。A

序列,構(gòu)建過(guò)程,數(shù)據(jù)庫(kù)系統(tǒng)


或宿主細(xì)胞內(nèi)的系統(tǒng),越來(lái)越多的生物實(shí)驗(yàn)已經(jīng)證明效應(yīng)蛋白對(duì)細(xì)菌以及宿主有著重要的作用。因此,構(gòu)建效應(yīng)蛋白數(shù)據(jù)庫(kù)系統(tǒng),從而幫助研究者更為方便地獲取效白的信息就顯得尤為重要。本章通過(guò)搜集整理經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證的細(xì)菌Ⅲ型、Ⅳ型、Ⅵ泌系統(tǒng)(T3SS、T4SS、T6SS)的效應(yīng)蛋白數(shù)據(jù)(T3SE、T4SE、T6SE),使用生物工具或在不同的公開(kāi)數(shù)據(jù)庫(kù)中根據(jù)效應(yīng)蛋白的序列提取其注釋信息,同時(shí)使ySQL 數(shù)據(jù)庫(kù)、Struts 2、Hibernate 等計(jì)算機(jī)技術(shù)完成對(duì)細(xì)菌Ⅲ/Ⅳ/Ⅵ型分泌系統(tǒng)中蛋白數(shù)據(jù)庫(kù)系統(tǒng) SecretEPDB(Bacterial Secreted Effector Protein DataBase)的構(gòu)建。.1 方法概述與流程SecretEPDB 數(shù)據(jù)庫(kù)系統(tǒng)的構(gòu)建流程可分為三個(gè)主要步驟:數(shù)據(jù)搜集、注釋信息、構(gòu)建數(shù)據(jù)庫(kù)。第一步為數(shù)據(jù)搜集,本研究從 UniProt 數(shù)據(jù)庫(kù)、發(fā)表文獻(xiàn)的正樣本集、相關(guān)文獻(xiàn)中這三個(gè)方面搜集效應(yīng)蛋白的數(shù)據(jù),并對(duì)這些數(shù)據(jù)進(jìn)行去重操作,用建 SecretEPDB 的數(shù)據(jù)集。第二步是根據(jù)這些效應(yīng)蛋白的序列在不同的公開(kāi)數(shù)據(jù)庫(kù)取其注釋信息,或者是使用相應(yīng)的生物信息工具來(lái)預(yù)測(cè)其相關(guān)的注釋信息。第三步用MySQL數(shù)據(jù)庫(kù)將效應(yīng)蛋白的序列信息及其注釋信息存儲(chǔ),并使用Struts 2、Hibern計(jì)算機(jī)技術(shù)完成 SecretEPDB 的網(wǎng)頁(yè)設(shè)計(jì)與構(gòu)建。構(gòu)建過(guò)程如圖 3-1 所示。生物信息工具公開(kāi)數(shù)據(jù)庫(kù)
【學(xué)位授予單位】:西北農(nóng)林科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP311.13;R378

【相似文獻(xiàn)】

相關(guān)會(huì)議論文 前5條

1 曹鵬;張紅梅;趙學(xué)琳;李梅;常文瑞;;幾種植物致病菌丁香假單胞桿菌效應(yīng)蛋白的晶體學(xué)研究[A];第十一次中國(guó)生物物理學(xué)術(shù)大會(huì)暨第九屆全國(guó)會(huì)員代表大會(huì)摘要集[C];2009年

2 趙倩;薛曉波;劉之洋;蔡璐璐;馬文秀;鄒麗芳;鄒華松;陳功友;;水稻細(xì)菌性條斑病菌Ⅲ型分泌系統(tǒng)分泌的效應(yīng)蛋白的鑒定[A];中國(guó)植物病理學(xué)會(huì)2011年學(xué)術(shù)年會(huì)論文集[C];2011年

3 吳同壘;吳清民;;布魯氏菌Ⅳ型分泌系統(tǒng)效應(yīng)蛋白的研究進(jìn)展[A];中國(guó)畜牧獸醫(yī)學(xué)會(huì)家畜傳染病學(xué)分會(huì)第八屆全國(guó)會(huì)員代表大會(huì)暨第十五次學(xué)術(shù)研討會(huì)論文集[C];2013年

4 單衛(wèi)星;;植物病原卵菌RXLR效應(yīng)蛋白的跨膜轉(zhuǎn)運(yùn)機(jī)理研究[A];中國(guó)植物病理學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年

5 高月求;姚嫣;朱飛燕;;抑毒方對(duì)慢性乙型肝炎患者PBMC免疫效應(yīng)蛋白表達(dá)的干預(yù)研究[A];第十次浙江省中西醫(yī)結(jié)合肝病學(xué)術(shù)會(huì)議論文匯編[C];2008年

相關(guān)博士學(xué)位論文 前6條

1 傅盼翰;志賀氏菌效應(yīng)蛋白OspI催化泛素結(jié)合酶Ubc13脫酰胺化的分子機(jī)制[D];浙江大學(xué);2016年

2 張杰;細(xì)菌效應(yīng)蛋白致病機(jī)理和擬南芥抗性機(jī)制的研究[D];中國(guó)科學(xué)院研究生院(上海生命科學(xué)研究院);2007年

3 顧彪;植物病原卵菌和真菌效應(yīng)蛋白轉(zhuǎn)運(yùn)機(jī)制研究[D];西北農(nóng)林科技大學(xué);2012年

4 馮鋒;黃單胞菌效應(yīng)蛋白AvrAC調(diào)節(jié)植物先天免疫的分子機(jī)制[D];清華大學(xué);2012年

5 崔福浩;丁香假單胞效應(yīng)蛋白AvrRpt2抑制植物免疫分子機(jī)制的研究[D];中國(guó)農(nóng)業(yè)大學(xué);2013年

6 李?yuàn)?病原細(xì)菌效應(yīng)蛋白NIeB家族抑制死亡受體介導(dǎo)的細(xì)胞死亡機(jī)制的研究[D];中國(guó)農(nóng)業(yè)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 黃娟;宿主抵御病原菌入侵的新機(jī)制:病原菌效應(yīng)蛋白的谷胱甘肽化修飾[D];西南大學(xué);2015年

2 徐文婷;嗜吞噬細(xì)胞無(wú)形體四型分泌系統(tǒng)效應(yīng)蛋白系統(tǒng)性鑒定及其抗原性研究[D];蘇州大學(xué);2016年

3 李楚楚;副溶血弧菌T3SS2新效應(yīng)蛋白的鑒定及其功能的初步研究[D];浙江理工大學(xué);2016年

4 溫晶;獼猴桃潰瘍病菌Ⅲ型效應(yīng)蛋白的篩選及效應(yīng)蛋白HopX3功能的初步研究[D];西北農(nóng)林科技大學(xué);2016年

5 許強(qiáng);小麥條銹菌吸器效應(yīng)蛋白篩選及HASP268效應(yīng)蛋白靶標(biāo)鑒定[D];西北農(nóng)林科技大學(xué);2016年

6 趙海斌;小麥條銹菌吸器關(guān)鍵效應(yīng)蛋白三維結(jié)構(gòu)的研究[D];西北農(nóng)林科技大學(xué);2017年

7 伍海英;鸚鵡熱嗜衣原體Ⅲ型分泌系統(tǒng)效應(yīng)蛋白的預(yù)測(cè)、鑒定及特性的研究[D];南華大學(xué);2013年

8 陸敢;以釀酒酵母為替代宿主研究嗜肺軍團(tuán)菌效應(yīng)蛋白的功能[D];中山大學(xué);2011年

9 黎知青;預(yù)測(cè)的鸚鵡熱嗜衣原體Ⅲ型分泌系統(tǒng)效應(yīng)蛋白的定位及相關(guān)性質(zhì)的初步研究[D];南華大學(xué);2013年

10 何燕華;稻瘟菌新型效應(yīng)蛋白的篩選及功能初步分析[D];福建師范大學(xué);2014年



本文編號(hào):2568967

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2568967.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5d734***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com