天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 理工論文 > 生物學論文 >

基于基因本體降維的蛋白質(zhì)功能預測研究

發(fā)布時間:2024-05-06 20:33
  蛋白質(zhì)是活細胞生命活動中最主要的載體,執(zhí)行著生物體內(nèi)各種重要功能。對蛋白質(zhì)功能進行自動標注是生物信息學領(lǐng)域的關(guān)鍵問題,也是后基因組時代的核心問題之一。準確全面地對蛋白質(zhì)進行功能標注,不僅能幫助人們正確理解生命機理,而且對疾病分析、藥物研發(fā)、農(nóng)作物促產(chǎn)等研究領(lǐng)域都有著極大的促進作用;虮倔w(Gene Ontology,GO)是一種在蛋白質(zhì)功能預測中被廣泛使用的功能標注數(shù)據(jù)庫。本體中包含多于45000個功能標簽術(shù)語,但是一個蛋白質(zhì)僅被其中的幾個或者幾十個功能標簽標注,且這些標簽間存在復雜的結(jié)構(gòu)關(guān)系,給蛋白質(zhì)功能預測工作帶來了巨大挑戰(zhàn)。本文結(jié)合基因本體建模及其降維學習,進行蛋白質(zhì)功能預測研究,主要工作如下:(1)提出一種基于基因本體圖哈希的蛋白質(zhì)功能預測方法(HashGO)。該方法首先利用基因本體圖結(jié)構(gòu)定義功能標簽間的分類相似度,然后將該相似度結(jié)合到圖哈希技術(shù)中并優(yōu)化一系列哈希函數(shù),再以二進制的形式編碼大規(guī)模的功能標簽術(shù)語。其次,利用這些哈希函數(shù)將蛋白質(zhì)-功能標簽關(guān)聯(lián)矩陣映射到低維哈?臻g,基于海明距離計算蛋白質(zhì)之間的語義相似度。最后,HashGO基于語義近鄰蛋白質(zhì)的功能預測蛋白質(zhì)功能。在...

【文章頁數(shù)】:73 頁

【學位級別】:碩士

【部分圖文】:

基于基因本體降維的蛋白質(zhì)功能預測研究



圖1-1本文中蛋白質(zhì)功能預測動機圖但是在巨大的功能標簽空間中,一個蛋白質(zhì)僅被當中的幾個或者幾十個標注,大量的功能標注信息是缺失的,這一現(xiàn)象給蛋白質(zhì)預測工作帶來一定的挑戰(zhàn)。而蛋白質(zhì)功能標注信息對蛋白質(zhì)機理的解析,疾病機理分析與調(diào)控,相關(guān)藥物的研發(fā),生物能源開發(fā)等具有極大的指導作....


基于基因本體降維的蛋白質(zhì)功能預測研究



基因本體的層次結(jié)構(gòu)可以被用來顯著地提高蛋白質(zhì)功能預測的精度,F(xiàn)有的功能標簽壓縮方法要不在壓縮前隱式地或部分地利用功能標簽間的關(guān)聯(lián)關(guān)系,要不就是便于后期處理將基因本體的有向無環(huán)圖結(jié)構(gòu)變成無向結(jié)構(gòu)。鑒于此,這些方法不能很好地服從GO層次結(jié)構(gòu),導致預測性能受損。為了解決這些基于本體....


基于基因本體降維的蛋白質(zhì)功能預測研究



在統(tǒng)計差異性檢驗中,涉及的p值是某方法相較于其他方法間的差異性概率值,如果p值小于0.05,我們就說該方法具有顯著性差異性。本文,我們在所有物種和所用度量上使用符號秩檢驗去統(tǒng)計HPHash和其他方法中的預測差異性,p值比10-9還要小。此外,我們也統(tǒng)計Hash....


基于基因本體降維的蛋白質(zhì)功能預測研究



西南大學碩士學位論文支上分別涉及的功能標簽數(shù)為13150、3618和1668,當d被設(shè)置為5或者10時,哈希編碼的長度210log1668是不滿足所有功能標簽的編碼位數(shù)。碰撞可能會導致哈希沖突,從而會影響蛋白質(zhì)功能預測的結(jié)果。圖4-1記錄了在人類數(shù)據(jù)....



本文編號:3966309

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/projectlw/swxlw/3966309.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c8339***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com