基于機(jī)器學(xué)習(xí)方法預(yù)測(cè)環(huán)形RNA編碼蛋白的潛能
發(fā)布時(shí)間:2023-08-08 18:39
環(huán)形RNA是一類廣泛存在于真核細(xì)胞中的內(nèi)源性RNA分子,沒(méi)有5’末端帽子和3’末端polyA尾巴,以共價(jià)鍵連接形成封閉環(huán)狀結(jié)構(gòu).一直以來(lái),環(huán)形RNA被認(rèn)為是一類不能翻譯的非編碼RNA.然而近年來(lái)有研究報(bào)道,環(huán)形RNA能夠編碼蛋白質(zhì)從而調(diào)控重要的生命活動(dòng),引起了研究者們的注意.運(yùn)用機(jī)器學(xué)習(xí)的方法,基于環(huán)形RNA的序列與結(jié)構(gòu)特征,使用XGBoost、隨機(jī)森林和支持向量機(jī)組合而成的綜合分類模型,預(yù)測(cè)環(huán)形RNA編碼蛋白的潛能,平均預(yù)測(cè)準(zhǔn)確率達(dá)到86.66%,為實(shí)驗(yàn)研究人員提供可靠的參考,有助于發(fā)現(xiàn)更多可編碼蛋白的環(huán)形RNA.
【文章頁(yè)數(shù)】:9 頁(yè)
【文章目錄】:
1 環(huán)形RNA序列與結(jié)構(gòu)特征的計(jì)算
1.1 ORF的計(jì)算
1.2 IRES的預(yù)測(cè)
1.3 序列保守性的計(jì)算
1.4 m6A修飾的預(yù)測(cè)
1.5 其他特征的計(jì)算
2 預(yù)測(cè)模型的構(gòu)建
2.1 數(shù)據(jù)來(lái)源
2.2 特征篩選
3 模型性能的評(píng)估
3.1 邏輯回歸模型的性能評(píng)估
3.2 支持向量機(jī)模型的性能評(píng)估
3.3 隨機(jī)森林模型的性能評(píng)估
3.4 XGBoost模型的性能評(píng)估
3.5 小結(jié)與討論
4 結(jié)語(yǔ)
本文編號(hào):3840276
【文章頁(yè)數(shù)】:9 頁(yè)
【文章目錄】:
1 環(huán)形RNA序列與結(jié)構(gòu)特征的計(jì)算
1.1 ORF的計(jì)算
1.2 IRES的預(yù)測(cè)
1.3 序列保守性的計(jì)算
1.4 m6A修飾的預(yù)測(cè)
1.5 其他特征的計(jì)算
2 預(yù)測(cè)模型的構(gòu)建
2.1 數(shù)據(jù)來(lái)源
2.2 特征篩選
3 模型性能的評(píng)估
3.1 邏輯回歸模型的性能評(píng)估
3.2 支持向量機(jī)模型的性能評(píng)估
3.3 隨機(jī)森林模型的性能評(píng)估
3.4 XGBoost模型的性能評(píng)估
3.5 小結(jié)與討論
4 結(jié)語(yǔ)
本文編號(hào):3840276
本文鏈接:http://www.sikaile.net/projectlw/swxlw/3840276.html
最近更新
教材專著