天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于序列的RNA甲基化修飾位點(diǎn)預(yù)測研究

發(fā)布時間:2018-07-27 15:35
【摘要】:RNA的轉(zhuǎn)錄后修飾在生命體中普遍存在,并且在許多生物過程中扮演了重要的角色,而RNA的甲基化修飾則是RNA轉(zhuǎn)錄后修飾中一個重要的分支。RNA甲基化是指在RNA的某些核苷酸分子上發(fā)生甲基化修飾的現(xiàn)象,常見的包括N6-甲基腺苷、N1-甲基腺苷等。近年來的研究表明,RNA甲基化修飾可以影響RNA的轉(zhuǎn)錄、代謝、剪接和穩(wěn)定性;能與相關(guān)的蛋白質(zhì)結(jié)合,從而調(diào)控基因的表達(dá)。并且,RNA甲基化修飾與腫瘤、肥胖癥等疾病也有所關(guān)聯(lián)。因此,從RNA序列中精確地識別出RNA甲基化修飾位點(diǎn)是一項重要的任務(wù)。傳統(tǒng)的基于物理化學(xué)實(shí)驗(yàn)來識別RNA甲基化位點(diǎn)的方法成本高、耗時長且規(guī)模較小。近年來出現(xiàn)的高通量測序方法能進(jìn)行高效的、大規(guī)模的RNA甲基化位點(diǎn)識別,但其本質(zhì)仍然是基于生物化學(xué)實(shí)驗(yàn)的方法。因此,設(shè)計一種基于機(jī)器學(xué)習(xí)理論的RNA甲基化修飾位點(diǎn)預(yù)測方法,是十分必要的。本文對基于序列的RNA甲基化修飾位點(diǎn)預(yù)測問題進(jìn)行了深入研究,主要工作如下:(1)研究了 RNA的基本性質(zhì),并提出了一種新的RNA序列的特征提取方法。位置特異性偏好思想在蛋白質(zhì)修飾位點(diǎn)預(yù)測問題中得到了成功的應(yīng)用。受此啟發(fā),本文將位置特異性偏好思想應(yīng)用于RNA序列,提出了位置特異性核苷酸/二核苷酸偏好特征,用于RNA序列的特征提取。該思想利用統(tǒng)計方法,分別計算每種核苷酸在正負(fù)樣本集合的序列中每個位置的出現(xiàn)頻率,并且利用正負(fù)樣本集合之間的差異進(jìn)行特征編碼。實(shí)驗(yàn)結(jié)果表明,該特征提取方法能進(jìn)一步地提升N6-甲基腺苷位點(diǎn)預(yù)測的精度。(2)對基于序列的N6-甲基腺苷位點(diǎn)預(yù)測問題進(jìn)行了研究,并提出了名為TargetM6A的預(yù)測方法。TargetM6A方法利用所提出的位置特異性核苷酸/二核苷酸偏好特征,并結(jié)合傳統(tǒng)的核苷酸組成成分特征,來對RNA序列進(jìn)行特征提取;對提取出的特征使用增量特征選擇方法進(jìn)行特征篩選,選出更有判別力的特征成分子集;最終使用支持向量機(jī)算法訓(xùn)練預(yù)測模型。實(shí)驗(yàn)結(jié)果表明,相對于現(xiàn)有的基于序列的N6-甲基腺苷位點(diǎn)預(yù)測方法,本文提出的TargetM6A方法在基準(zhǔn)數(shù)據(jù)集上取得了更好的預(yù)測結(jié)果。(3)對基于序列的N1-甲基腺苷位點(diǎn)預(yù)測問題進(jìn)行了研究,并提出了名為TargetM1A的預(yù)測方法。針對最近新發(fā)布的N1-甲基腺苷實(shí)驗(yàn)數(shù)據(jù),進(jìn)行了數(shù)據(jù)的處理和采樣,構(gòu)建了 3個基于物種和6個基于組織細(xì)胞的N1-甲基腺苷位點(diǎn)的數(shù)據(jù)集。TargetM1A方法提取了數(shù)種基于RNA序列的特征,并使用極限隨機(jī)樹算法作為分類器。TargetM1A方法在基于物種和基于組織細(xì)胞的預(yù)測模型的交叉驗(yàn)證實(shí)驗(yàn)中都取得了不錯的性能;它對于現(xiàn)有的基于實(shí)驗(yàn)來研究N1-甲基腺苷位點(diǎn)的方法來說,是一個有益的補(bǔ)充工具。(4)對于所提出的TargetM6A和TargetM1A方法都提供了在線的預(yù)測服務(wù),供其他研究人員免費(fèi)地使用。
[Abstract]:Posttranscriptional modification of RNA is widespread in organisms and plays an important role in many biological processes. RNA methylation is an important branch of RNA posttranscriptional modification. RNA methylation refers to the methylation of RNA on some nucleotide molecules, including N6-methyladenosine N1-methyladenosine. Recent studies have shown that RNA methylation can affect the transcription, metabolism, splicing and stability of RNA, and can bind to related proteins to regulate gene expression. And RNA methylation is also associated with diseases such as cancer, obesity, and so on. Therefore, accurate identification of RNA methylation sites from RNA sequences is an important task. Traditional methods based on physicochemical experiments to identify RNA methylation sites are costly, time-consuming and small. In recent years, high-throughput sequencing methods can be used to identify RNA methylation sites on a large scale, but their essence is still based on biochemical experiments. Therefore, it is necessary to design a RNA methylation modification site prediction method based on machine learning theory. In this paper, the prediction of RNA methylation modification sites based on sequences is studied. The main work is as follows: (1) the basic properties of RNA are studied, and a new feature extraction method for RNA sequences is proposed. The idea of position specific preference has been successfully applied to the prediction of protein modified sites. Inspired by this, the idea of location-specific preference is applied to RNA sequences, and a location-specific nucleotide / dinucleotide preference feature is proposed for feature extraction of RNA sequences. Using statistical method, this idea calculates the occurrence frequency of each nucleotide in each position in the sequence of positive and negative sample sets, and encodes the features by using the difference between positive and negative samples. The experimental results show that this feature extraction method can further improve the accuracy of N6-methyladenosine site prediction. (2) Sequence-based prediction of N6-methyladenosine sites is studied. A prediction method called TargetM6A. TargetM6A is proposed to extract the RNA sequence by using the location-specific nucleotide / dinucleotide preference feature and combining with the traditional nucleotide component characteristics. Incremental feature selection method is used to screen the extracted features to select the more discriminant subset of feature components. Finally support vector machine algorithm is used to train the prediction model. The experimental results show that compared with the existing sequence-based prediction methods for N6-methyladenosine sites, The TargetM6A method proposed in this paper obtains better prediction results on the datum data set. (3) the prediction problem of N1-methyladenosine sites based on sequence is studied, and a prediction method called TargetM1A is proposed. According to the newly released experimental data of N1-methyladenosine, the data were processed and sampled. Three data sets based on N1-methyladenosine locus and six histiocyte-based data sets were constructed. TargetM1A method was used to extract several RNA sequence-based features. Using the LRT algorithm as the classifier. TargetM1A method has achieved good performance in the cross-validation experiments based on the prediction model based on species and tissue cells. It is a useful supplementary tool for the existing experiment-based methods to study N1-methyladenosine sites. (4) both the proposed TargetM6A and TargetM1A methods provide online predictive services for free use by other researchers.
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:Q811.4

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉靜;A Novel Vector for Abundant Expression of Antisense RNA, Triplex forming RNA and Ribozyme in vivo[J];High Technology Letters;2000年04期

2 魯慧英;Detection of hepatitis C virus RNA sequences in cholangiocarcinomas in Chinese and American patients[J];Chinese Medical Journal;2000年12期

3 梁小兵 ,萬國江 ,黃榮貴;Distribution and Variation of Ribonucleic Acid (RNA) and Protein and Its Hydrolysis Products in Lake Sediments[J];Chinese Journal of Geochemistry;2002年02期

4 Verheyden B ,徐其武;口服脊髓灰質(zhì)炎疫苗核殼和RNA的穩(wěn)定性[J];國外醫(yī)學(xué).預(yù)防.診斷.治療用生物制品分冊;2002年01期

5 CMBE譯文組;探索小RNA的功能[J];現(xiàn)代臨床醫(yī)學(xué)生物工程學(xué)雜志;2004年03期

6 沈維干;RNA interference and its current application in mammals[J];Chinese Medical Journal;2004年07期

7 孫娣;汪洋;張麗娟;閆玉清;;一種簡捷提取植物總RNA的方法[J];黑龍江醫(yī)藥;2005年06期

8 南海波;;小麥總RNA的提取[J];渤海大學(xué)學(xué)報(自然科學(xué)版);2006年01期

9 王冬來;;RNA干擾的成功與困惑[J];中國生物化學(xué)與分子生物學(xué)報;2008年06期

10 楊靜;;試驗(yàn)性的小RNA藥物可能引發(fā)失明[J];中國生物化學(xué)與分子生物學(xué)報;2009年05期

相關(guān)會議論文 前10條

1 金由辛;;面向21世紀(jì)的RNA研究[A];面向21世紀(jì)的科技進(jìn)步與社會經(jīng)濟(jì)發(fā)展(下冊)[C];1999年

2 ;第四屆RNA全國研討會大會報告日程安排[A];第四屆全國RNA進(jìn)展研討會論文集[C];2005年

3 ;Function of Transfer RNA Modifications in Plant Development[A];植物分子生物學(xué)與現(xiàn)代農(nóng)業(yè)——全國植物生物學(xué)研討會論文摘要集[C];2010年

4 王峰;張秋平;陳金湘;;棉花總RNA的快速提取方法[A];中國棉花學(xué)會2011年年會論文匯編[C];2011年

5 關(guān)力;陳本iY;iJ云虹;郭培芝;魏重琴;邱蘇吾;苗健;;關(guān)于動物}D~T中RNAn,定方法的研究[A];中國生理科學(xué)會學(xué)術(shù)會議論文摘要匯編(生物化學(xué))[C];1964年

6 夏海濱;;小RNA在免疫學(xué)領(lǐng)域中的應(yīng)用研究進(jìn)展[A];中國免疫學(xué)會第五屆全國代表大會暨學(xué)術(shù)會議論文摘要[C];2006年

7 ;The stability of hepatitis C virus RNA in various handling and storage conditions[A];中國輸血協(xié)會第四屆輸血大會論文集[C];2006年

8 郭德銀;;RNA干擾在病毒研究和控制中的應(yīng)用[A];2006中國微生物學(xué)會第九次全國會員代表大會暨學(xué)術(shù)年會論文摘要集[C];2006年

9 甘儀梅;楊業(yè)華;王學(xué)奎;曹燕;楊特武;;棉花總RNA快速提取[A];中國棉花學(xué)會2007年年會論文匯編[C];2007年

10 ;Identification and characterization of novel interactive partner proteins for PCBP1 that is a RNA-binding protein[A];中國優(yōu)生優(yōu)育協(xié)會第四屆全國學(xué)術(shù)論文報告會暨基因科學(xué)高峰論壇論文專輯[C];2008年

相關(guān)重要報紙文章 前10條

1 記者 馮衛(wèi)東;研究人員發(fā)現(xiàn)可破壞腫瘤抑制基因的小RNA[N];科技日報;2009年

2 記者 儲笑抒 通訊員 盛偉;人體微小RNA有望提前發(fā)出癌癥預(yù)警[N];南京日報;2011年

3 瀘州醫(yī)學(xué)院副教授、科普作家 周志遠(yuǎn);“大頭兒子”與環(huán)狀RNA[N];第一財經(jīng)日報;2014年

4 麥迪信;小分子RNA可能有大作用[N];醫(yī)藥經(jīng)濟(jì)報;2003年

5 董映璧;美發(fā)現(xiàn)基因調(diào)控可回應(yīng)“RNA世界”[N];科技日報;2006年

6 張忠霞;特制RNA輕推一下,就能“喚醒”基因[N];新華每日電訊;2007年

7 聶翠蓉;RNA:縱是配角也精彩[N];科技日報;2009年

8 馮衛(wèi)東;RNA干擾機(jī)制首次在人體中獲得證實(shí)[N];科技日報;2010年

9 馮衛(wèi)東 王小龍;英在地球早期環(huán)境模擬條件下合成類RNA[N];科技日報;2009年

10 記者 常麗君;新技術(shù)讓研究進(jìn)入單細(xì)胞內(nèi)RNA的世界[N];科技日報;2011年

相關(guān)博士學(xué)位論文 前10條

1 王趙瑋;昆蟲RNA病毒復(fù)制及昆蟲抗病毒天然免疫機(jī)制研究[D];武漢大學(xué);2014年

2 包純;一類新非編碼RNA的發(fā)現(xiàn)以及產(chǎn)生和功能的初探[D];華中師范大學(xué);2015年

3 李語麗;基于MeRIP-seq的水稻RNA m6A甲基化修飾的研究[D];中國科學(xué)院北京基因組研究所;2015年

4 熊瑜琳;miR-122靶位基因STAT3調(diào)控長鏈非編碼 RNA Lethe促進(jìn)HCV復(fù)制的機(jī)制研究[D];第三軍醫(yī)大學(xué);2015年

5 范春節(jié);高通量測序鑒定毛竹小RNA及其功能分析[D];中國林業(yè)科學(xué)研究院;2012年

6 王加強(qiáng);小鼠著床前胚胎特異ERV相關(guān)長非編碼RNA的定向篩選及功能研究[D];東北農(nóng)業(yè)大學(xué);2015年

7 王業(yè)偉;非編碼RNA SPIU的結(jié)構(gòu)和功能研究和p19INK4D在APL發(fā)病中的作用[D];上海交通大學(xué);2013年

8 鄒艷芬;子癇前期中非編碼RNA對滋養(yǎng)細(xì)胞功能的調(diào)控及機(jī)制探索[D];南京醫(yī)科大學(xué);2015年

9 朱喬;miR-10b在人肝細(xì)胞肝癌發(fā)生中的作用及其機(jī)制的初步探索[D];第四軍醫(yī)大學(xué);2015年

10 蔣俊鋒;長鏈非編碼RNA BACE1-AS促進(jìn)Aβ聚集及其調(diào)節(jié)BACE1和SERF1a的ceRNA機(jī)制研究[D];第二軍醫(yī)大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 陸聰兒;條紋斑竹鯊再生肝臟中差異RNA的研究[D];浙江理工大學(xué);2015年

2 張曉輝;小鼠幾種長鏈非編碼RNA基因功能的初步研究[D];昆明理工大學(xué);2015年

3 全弘揚(yáng);長鏈非編碼RNA在細(xì)胞內(nèi)質(zhì)網(wǎng)應(yīng)激反應(yīng)中的相關(guān)作用及機(jī)制研究[D];北京協(xié)和醫(yī)學(xué)院;2015年

4 胡亮;DDX19A識別PRRSV基因組RNA并激活NLRP3炎癥小體[D];中國農(nóng)業(yè)科學(xué)院;2015年

5 張帥兵;應(yīng)用RNA干擾技術(shù)對旋毛蟲Nudix水解酶基因功能的研究[D];鄭州大學(xué);2015年

6 鄭芳芳;肺癌RNA-Seq數(shù)據(jù)中RNA編輯事件的識別算法和系統(tǒng)分析[D];蘇州大學(xué);2015年

7 陳瑞東;長鏈非編碼RNA MEG3在胰腺癌發(fā)生發(fā)展中作用的實(shí)驗(yàn)研究[D];蘇州大學(xué);2015年

8 劉駿武;線蟲和水稻中環(huán)狀RNA的預(yù)測及分析[D];華中農(nóng)業(yè)大學(xué);2015年

9 李猷;利用RNA干擾技術(shù)提高番茄抗TMV侵染能力的研究[D];牡丹江師范學(xué)院;2015年

10 吳術(shù)盛;SVCV感染EPC細(xì)胞microRNA表達(dá)譜的初步研究[D];華中農(nóng)業(yè)大學(xué);2015年

,

本文編號:2148287

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/benkebiyelunwen/2148287.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c8a14***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com