蛋白質(zhì)熱穩(wěn)定性分類預測系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2017-08-03 09:36
本文關(guān)鍵詞:蛋白質(zhì)熱穩(wěn)定性分類預測系統(tǒng)的設(shè)計與實現(xiàn)
更多相關(guān)文章: 蛋白質(zhì)熱穩(wěn)定性 數(shù)據(jù)分類預測 特征選擇 支持向量機 Adaboost
【摘要】:蛋白質(zhì)是生命活動的主要物質(zhì)承擔者和重要的生物催化劑,在工業(yè)生產(chǎn)中有著較大的應(yīng)用潛力和良好的發(fā)展前景。然而,大部分蛋白質(zhì)都是常溫蛋白質(zhì),不能滿足工業(yè)生產(chǎn)中熱處理的要求,其較低的熱穩(wěn)定性嚴重制約了它們在工業(yè)生產(chǎn)中的應(yīng)用。通過模式識別方法研究蛋白質(zhì)熱穩(wěn)定性機制進而提升其熱穩(wěn)定性一直是計算生物學和蛋白質(zhì)工程研究領(lǐng)域中的一個重要方向。開發(fā)一個能有效預測蛋白質(zhì)熱穩(wěn)定性分類的系統(tǒng)將有助于研究者探索蛋白質(zhì)的熱穩(wěn)定性機制。本系統(tǒng)的主要功能是對蛋白質(zhì)序列的熱穩(wěn)定性分類進行預測并通過分類模型分析出與熱穩(wěn)定性有重要關(guān)聯(lián)的特征。系統(tǒng)提供了大量蛋白質(zhì)序列作為訓練分類模型的數(shù)據(jù)集,為用戶提供了序列特征計算、特征選擇、分類模型建立、蛋白質(zhì)熱穩(wěn)定性預測、預測結(jié)果分析和數(shù)據(jù)文件導出等功能。用戶通過系統(tǒng)得出的結(jié)果可以為改造蛋白質(zhì)序列結(jié)構(gòu),提升蛋白質(zhì)熱穩(wěn)定性的實驗提供理論支持。系統(tǒng)在MyEclipse平臺的基礎(chǔ)上,使用Java語言開發(fā),運用Spring MVC框架進行系統(tǒng)架構(gòu),采用MySQL對數(shù)據(jù)進行存儲,實現(xiàn)了數(shù)據(jù)準備模塊、數(shù)據(jù)分類預測模塊、預測結(jié)果分析模塊和系統(tǒng)管理模塊。在數(shù)據(jù)準備模塊中,系統(tǒng)根據(jù)蛋白質(zhì)序列計算430維序列特征并使用信息增益、信息增益率和Relief特征選擇算法對特征集進行降維。在數(shù)據(jù)分類預測模塊中,系統(tǒng)使用Adaboost算法建立組合分類模型。其中,組合分類模型中的基分類器由支持向量機算法訓練得出。經(jīng)過系統(tǒng)測試,系統(tǒng)能夠較為精確的預測未知熱穩(wěn)定性分類的蛋白質(zhì)序列并能分析出與蛋白質(zhì)熱穩(wěn)定性有重要關(guān)聯(lián)的特征,在功能和性能上都滿足用戶的需求,達到了預期的設(shè)計效果。
【關(guān)鍵詞】:蛋白質(zhì)熱穩(wěn)定性 數(shù)據(jù)分類預測 特征選擇 支持向量機 Adaboost
【學位授予單位】:遼寧大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:O629.73
【目錄】:
- 摘要4-5
- ABSTRACT5-13
- 引言13-17
- 0.1 系統(tǒng)開發(fā)背景及意義13-14
- 0.2 研究現(xiàn)狀14-15
- 0.3 主要研究內(nèi)容及組織結(jié)構(gòu)15-17
- 0.3.1 主要研究內(nèi)容15
- 0.3.2 本文的組織結(jié)構(gòu)15-17
- 第1章 相關(guān)技術(shù)介紹17-27
- 1.1 MySQL數(shù)據(jù)庫17-18
- 1.2 Tomcat服務(wù)器18
- 1.3 Spring MVC框架18-19
- 1.4 特征選擇19-22
- 1.4.1 信息增益19-20
- 1.4.2 信息增益率20-21
- 1.4.3 Relief21-22
- 1.5 支持向量機22-25
- 1.5.1 最優(yōu)分類面22
- 1.5.2 線性可分22-23
- 1.5.3 非線性可分23-25
- 1.6 Adaboost25-26
- 1.7 本章小結(jié)26-27
- 第2章 系統(tǒng)需求分析27-39
- 2.1 功能性需求27-37
- 2.1.1 數(shù)據(jù)字典28-30
- 2.1.2 數(shù)據(jù)準備30-31
- 2.1.3 數(shù)據(jù)分類預測31-33
- 2.1.4 預測結(jié)果分析33-36
- 2.1.5 系統(tǒng)管理36-37
- 2.2 非功能性需求37-38
- 2.3 本章小結(jié)38-39
- 第3章 系統(tǒng)設(shè)計39-57
- 3.1 系統(tǒng)架構(gòu)設(shè)計39-40
- 3.2 系統(tǒng)模塊設(shè)計40-51
- 3.2.1 數(shù)據(jù)準備模塊40-43
- 3.2.2 數(shù)據(jù)分類預測模塊43-46
- 3.2.3 預測結(jié)果分析模塊46-49
- 3.2.4 系統(tǒng)管理模塊49-51
- 3.3 系統(tǒng)數(shù)據(jù)庫設(shè)計51-56
- 3.3.1 數(shù)據(jù)關(guān)系設(shè)計51-52
- 3.3.2 數(shù)據(jù)表設(shè)計52-56
- 3.4 系統(tǒng)部署56
- 3.5 本章小結(jié)56-57
- 第4章 系統(tǒng)關(guān)鍵技術(shù)實現(xiàn)57-71
- 4.1 序列特征計算57-61
- 4.1.1 數(shù)據(jù)集構(gòu)建57-58
- 4.1.2 序列特征計算58-61
- 4.2 特征選擇的實現(xiàn)61-64
- 4.3 支持向量機模型的實現(xiàn)和數(shù)據(jù)不平衡問題的處理64-68
- 4.3.1 支持向量機分類模型的實現(xiàn)64-66
- 4.3.2 數(shù)據(jù)不平衡問題的處理66-67
- 4.3.3 支持向量機與其他模式識別算法的對比67-68
- 4.4 Adaboost組合分類器的實現(xiàn)68-70
- 4.5 本章小結(jié)70-71
- 第5章 系統(tǒng)測試71-77
- 5.1 測試原理及測試環(huán)境71-72
- 5.1.1 測試原理71-72
- 5.1.2 測試環(huán)境72
- 5.2 測試用例72-76
- 5.2.1 功能測試72-74
- 5.2.2 模型預測精度測試74-75
- 5.2.3 性能測試75-76
- 5.2.4 穩(wěn)定性測試76
- 5.3 測試結(jié)果76
- 5.4 本章小結(jié)76-77
- 第6章 總結(jié)與展望77-79
- 6.1 總結(jié)77
- 6.2 展望77-79
- 致謝79-80
- 參考文獻80-83
- 攻讀學位期間發(fā)表的學術(shù)論文及參加科研情況83
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 汪洪橋;孫富春;蔡艷寧;陳寧;丁林閣;;多核學習方法[J];自動化學報;2010年08期
2 鄒志文,朱金偉;數(shù)據(jù)挖掘算法研究與綜述[J];計算機工程與設(shè)計;2005年09期
3 景濤,白成剛,胡慶培,蔡開元;構(gòu)件軟件的測試問題綜述[J];計算機工程與應(yīng)用;2002年24期
,本文編號:613690
本文鏈接:http://www.sikaile.net/kejilunwen/huaxue/613690.html
最近更新
教材專著