必需基因理論預(yù)測的多種算法研究
發(fā)布時間:2025-02-07 19:36
研究必需基因?qū)τ跇?gòu)建最小基因集、發(fā)現(xiàn)潛在的藥物靶標(biāo)和廣譜抗菌藥物的研發(fā)有著非常重要的作用。由于這些基因?qū)τ跈C體生存、繁殖和發(fā)育有著不可替代的作用,許多科研工作者不遺余力去探尋必需基因識別的方法。從傳統(tǒng)的實驗技術(shù)到結(jié)合計算基因組學(xué)的理論識別方法,必需基因的識別逐漸成為基因組學(xué)研究領(lǐng)域的一個熱點。我們課題組曾經(jīng)提出過3款用于必需基因預(yù)測的在線服務(wù)工具,比如基于同源必需基因和物種進化距離的Geptop,根據(jù)基因名稱比較進行識別的CEG-Match,從DNA序列中提取序列組成特征去構(gòu)建人類必需基因預(yù)測模型的pheg。在本課題必需基因理論識別研究中,首先從Geptop算法得到啟發(fā),將同源必需性的特征與支持向量機(SVM)算法結(jié)合起來,以機器學(xué)習(xí)打分的機制去代替物種進化距離給出的特征權(quán)重,自動地去學(xué)習(xí)每個特征對區(qū)分必需基因和非必需基因的重要性度量。對于物種內(nèi)的必需基因預(yù)測,在選擇的25個細菌中,通過此方法得到的10-折交叉驗證的AUC值(受試者工作特征曲線下面積)最高達到0.9716。對于跨物種必需基因預(yù)測,我們則選擇在10-折交叉驗證中AUC值超過0.90且親緣關(guān)系距離待測物種最近的那個物種為模型...
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 必需基因簡介
1.2 必需基因研究背景和現(xiàn)狀
1.3 論文內(nèi)容提要
第二章 病原菌必需基因識別
2.1 引言
2.2 必需基因數(shù)據(jù)集構(gòu)建
2.3 特征提取
2.3.1 同源必需性比對
2.3.2 構(gòu)建特征矩陣
2.3.3 進化距離的計算
2.4 分類算法的選擇和使用
2.5 分類器設(shè)計和性能評估
2.5.1 N-折交叉驗證
2.5.2 跨物種必需基因預(yù)測
2.5.3 分類器性能評估
2.6 預(yù)測結(jié)果與分析
2.6.1 基因同源數(shù)目與物種間進化距離的分析
2.6.2 交叉驗證預(yù)測結(jié)果
2.6.3 跨物種預(yù)測結(jié)果
第三章 人類必需基因識別
3.1 引言
3.2 必需基因數(shù)據(jù)集構(gòu)建
3.3 標(biāo)準(zhǔn)基因名確定
3.4 特征提取和特征評價
3.4.1 蛋白質(zhì)-蛋白質(zhì)互作網(wǎng)絡(luò)的拓撲屬性
3.4.2 基因表達水平
3.4.3 GO功能注釋信息
3.4.4 特征評價
3.5 分類算法和性能評估
3.6 預(yù)測結(jié)果與分析
3.6.1 蛋白質(zhì)互作網(wǎng)絡(luò)拓撲屬性預(yù)測結(jié)果
3.6.2 基因表達水平預(yù)測結(jié)果
3.6.3 GO功能注釋預(yù)測結(jié)果
3.6.4 特征集合預(yù)測結(jié)果
3.6.5 特征評估和分析
第四章 總結(jié)和展望
4.1 全文總結(jié)
4.2 工作展望
致謝
參考文獻
附錄
攻讀碩士學(xué)位期間取得的成果
本文編號:4031195
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 必需基因簡介
1.2 必需基因研究背景和現(xiàn)狀
1.3 論文內(nèi)容提要
第二章 病原菌必需基因識別
2.1 引言
2.2 必需基因數(shù)據(jù)集構(gòu)建
2.3 特征提取
2.3.1 同源必需性比對
2.3.2 構(gòu)建特征矩陣
2.3.3 進化距離的計算
2.4 分類算法的選擇和使用
2.5 分類器設(shè)計和性能評估
2.5.1 N-折交叉驗證
2.5.2 跨物種必需基因預(yù)測
2.5.3 分類器性能評估
2.6 預(yù)測結(jié)果與分析
2.6.1 基因同源數(shù)目與物種間進化距離的分析
2.6.2 交叉驗證預(yù)測結(jié)果
2.6.3 跨物種預(yù)測結(jié)果
第三章 人類必需基因識別
3.1 引言
3.2 必需基因數(shù)據(jù)集構(gòu)建
3.3 標(biāo)準(zhǔn)基因名確定
3.4 特征提取和特征評價
3.4.1 蛋白質(zhì)-蛋白質(zhì)互作網(wǎng)絡(luò)的拓撲屬性
3.4.2 基因表達水平
3.4.3 GO功能注釋信息
3.4.4 特征評價
3.5 分類算法和性能評估
3.6 預(yù)測結(jié)果與分析
3.6.1 蛋白質(zhì)互作網(wǎng)絡(luò)拓撲屬性預(yù)測結(jié)果
3.6.2 基因表達水平預(yù)測結(jié)果
3.6.3 GO功能注釋預(yù)測結(jié)果
3.6.4 特征集合預(yù)測結(jié)果
3.6.5 特征評估和分析
第四章 總結(jié)和展望
4.1 全文總結(jié)
4.2 工作展望
致謝
參考文獻
附錄
攻讀碩士學(xué)位期間取得的成果
本文編號:4031195
本文鏈接:http://www.sikaile.net/kejilunwen/jiyingongcheng/4031195.html
最近更新
教材專著