蛋白質亞細胞定位中的特征表達與降維算法研究
發(fā)布時間:2023-03-11 18:39
隨著后基因組時代的進入,作為蛋白質組學的一項分支,蛋白質亞細胞定位研究的熱度與日俱增。蛋白質亞細胞定位研究中,基于蛋白質氨基酸序列的特征表達在定位預測階段扮演著重要角色;很大程度上,它決定了亞細胞定位結果的好壞。提取蛋白質特征表達以后,通常會面臨“小樣本,高維數(shù)”的問題;因此,為了降低計算開銷、減少數(shù)據(jù)噪聲及增強小樣本數(shù)據(jù)集的魯棒性,使用降維算法處理高維特征表達是必要的。基于此,本文對蛋白質亞細胞定位中的特征表達與降維算法進行了深入研究與分析。本文的主要工作及創(chuàng)新之處概括如下:1.蛋白質有4種基本的、分類性能依次遞增的單特征表達:氨基酸組成(AAC)、二肽組成(DipC)、偽氨基酸組成(PseAAC)和位置特異性得分矩陣(PSSM)。為了提高蛋白質亞細胞定位預測準確率,構造信息量豐富的特征表達是有效的方法之一。為此,本文新提出了一種先加權后相加的特征融合模型,通過融合多種單特征表達以形成新型復合特征。實驗結果表明該復合特征表達所包含信息量大于被融和的單特征表達。其次,本文基于PSSM提出了一種新特征表達——相關性位置特異性得分矩陣(CoPSSM),經(jīng)實驗驗證,CoPSSM的分類性能優(yōu)于...
【文章頁數(shù)】:90 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 引言
1.2 本文研究背景及意義
1.3 蛋白質亞細胞定位的研究現(xiàn)狀
1.4 本文的研究內(nèi)容與創(chuàng)新點
1.5 本文的組織結構
第二章 蛋白質亞細胞定位的特征表達分析與分類技術
2.1 蛋白質氨基酸序列的特征表達方法
2.1.1 基于氨基酸組成(AAC)的特征表達
2.1.2 基于二肽組成(DipC)的特征表達
2.1.3 基于偽氨基酸組成(PseAAC)的特征表達
2.1.4 基于位置特異性得分矩陣(PSSM)的特征表達
2.1.5 基于偽位置特異性得分矩陣(PsePSSM)的特征表達
2.2 蛋白質亞細胞定位的分類算法
2.3 蛋白質亞細胞定位分類模型的檢驗方法與性能評估指標
2.3.1 分類模型的檢驗方法
2.3.2 分類模型性能評估指標
第三章 基于核技巧的非線性降維算法
3.1 核技巧的基本思想
3.2 常用的核函數(shù)
3.3 核主成分分析(Kernel Principal Component Analysis, KPCA)
3.4 核線性判別分析(Kernel Linear Discriminant Analysis,KLDA)
第四章 基于復合特征表達與核線性判別分析( KLDA)的蛋白質亞細胞定位預測
4.1 引言
4.2 融合特征表達模型
4.3 實驗結果及分析
4.3.1 數(shù)據(jù)集
4.3.2 不同特征表達的總體預測識別率
4.3.3 基于PseAACPSSM與KLDA的蛋白質亞細胞定位預測
4.3.4 基于PseAACPSSM與KLDA的分類性能評估指標分析
4.3.5 對比實驗結果分析
4.4 本章小結
第五章 基于復合核函數(shù)二重降維算法的蛋白質亞細胞定位預測
5.1 引言
5.2 融合核函數(shù)模型
5.3 實驗結果及分析
5.3.1 數(shù)據(jù)集
5.3.2 整體預測識別率
5.3.3 各類別預測識別率
5.3.4 對比實驗結果分析
5.4 本章小結
第六章 基于半監(jiān)督式核主成分分析(KPCA)的蛋白質亞細胞定位預測
6.1 引言
6.2 半監(jiān)督式KPCA模型
6.3 實驗結果及分析
6.3.1 數(shù)據(jù)集
6.3.2 總體預測識別率
6.3.3 各類別預測識別率
6.3.4 分類性能評估指標分析
6.3.5 對比實驗結果分析
6.4 本章小結
第七章 基于二分貪心遺傳算法(DGGA)搜索核參數(shù)的蛋白質亞細胞定位預測
7.1 引言
7.2 二分貪心遺傳算法(DGGA)
7.3 實驗結果及分析
7.3.1 數(shù)據(jù)集
7.3.2 基于DGGA與KLDA整體降維的實驗結果分析
7.3.3 基于相關性位置特異性得分矩陣(CoPSSM)與核線性判別分析(KLDA)的蛋白質亞細胞定位預測
7.3.3.1 相關性位置特異性得分矩陣(CoPSSM)
7.3.3.2 CoPSSM的分類性能分析
7.3.3.3 CoPSSM基于結合判別準則的KLDA與DGGA分類性能
7.3.4 對比實驗結果分析
7.4 本章小結
第八章 總結與展望
8.1 全文工作總結
8.2 未來工作展望
參考文獻
攻讀碩士學位期間發(fā)表的學術論文與參與的科研項目
發(fā)表的學術論文
參與的科研項目
致謝
本文編號:3760037
【文章頁數(shù)】:90 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 引言
1.2 本文研究背景及意義
1.3 蛋白質亞細胞定位的研究現(xiàn)狀
1.4 本文的研究內(nèi)容與創(chuàng)新點
1.5 本文的組織結構
第二章 蛋白質亞細胞定位的特征表達分析與分類技術
2.1 蛋白質氨基酸序列的特征表達方法
2.1.1 基于氨基酸組成(AAC)的特征表達
2.1.2 基于二肽組成(DipC)的特征表達
2.1.3 基于偽氨基酸組成(PseAAC)的特征表達
2.1.4 基于位置特異性得分矩陣(PSSM)的特征表達
2.1.5 基于偽位置特異性得分矩陣(PsePSSM)的特征表達
2.2 蛋白質亞細胞定位的分類算法
2.3 蛋白質亞細胞定位分類模型的檢驗方法與性能評估指標
2.3.1 分類模型的檢驗方法
2.3.2 分類模型性能評估指標
第三章 基于核技巧的非線性降維算法
3.1 核技巧的基本思想
3.2 常用的核函數(shù)
3.3 核主成分分析(Kernel Principal Component Analysis, KPCA)
3.4 核線性判別分析(Kernel Linear Discriminant Analysis,KLDA)
第四章 基于復合特征表達與核線性判別分析( KLDA)的蛋白質亞細胞定位預測
4.1 引言
4.2 融合特征表達模型
4.3 實驗結果及分析
4.3.1 數(shù)據(jù)集
4.3.2 不同特征表達的總體預測識別率
4.3.3 基于PseAACPSSM與KLDA的蛋白質亞細胞定位預測
4.3.4 基于PseAACPSSM與KLDA的分類性能評估指標分析
4.3.5 對比實驗結果分析
4.4 本章小結
第五章 基于復合核函數(shù)二重降維算法的蛋白質亞細胞定位預測
5.1 引言
5.2 融合核函數(shù)模型
5.3 實驗結果及分析
5.3.1 數(shù)據(jù)集
5.3.2 整體預測識別率
5.3.3 各類別預測識別率
5.3.4 對比實驗結果分析
5.4 本章小結
第六章 基于半監(jiān)督式核主成分分析(KPCA)的蛋白質亞細胞定位預測
6.1 引言
6.2 半監(jiān)督式KPCA模型
6.3 實驗結果及分析
6.3.1 數(shù)據(jù)集
6.3.2 總體預測識別率
6.3.3 各類別預測識別率
6.3.4 分類性能評估指標分析
6.3.5 對比實驗結果分析
6.4 本章小結
第七章 基于二分貪心遺傳算法(DGGA)搜索核參數(shù)的蛋白質亞細胞定位預測
7.1 引言
7.2 二分貪心遺傳算法(DGGA)
7.3 實驗結果及分析
7.3.1 數(shù)據(jù)集
7.3.2 基于DGGA與KLDA整體降維的實驗結果分析
7.3.3 基于相關性位置特異性得分矩陣(CoPSSM)與核線性判別分析(KLDA)的蛋白質亞細胞定位預測
7.3.3.1 相關性位置特異性得分矩陣(CoPSSM)
7.3.3.2 CoPSSM的分類性能分析
7.3.3.3 CoPSSM基于結合判別準則的KLDA與DGGA分類性能
7.3.4 對比實驗結果分析
7.4 本章小結
第八章 總結與展望
8.1 全文工作總結
8.2 未來工作展望
參考文獻
攻讀碩士學位期間發(fā)表的學術論文與參與的科研項目
發(fā)表的學術論文
參與的科研項目
致謝
本文編號:3760037
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3760037.html
最近更新
教材專著