天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 化學(xué)論文 >

基于t-SNE的氨基酸聚類分析

發(fā)布時(shí)間:2017-10-10 10:49

  本文關(guān)鍵詞:基于t-SNE的氨基酸聚類分析


  更多相關(guān)文章: 氨基酸 MFCC t-SNE 聚類 降維


【摘要】:生物大分子模擬在生物研究領(lǐng)域中具有重要作用。如今,量子化學(xué)計(jì)算和分子動(dòng)力學(xué)模擬在生物分子理論計(jì)算領(lǐng)域廣為應(yīng)用。對(duì)于分子力學(xué)來(lái)說(shuō),力場(chǎng)的構(gòu)建尤為重要;诜肿恿(chǎng),可以展開(kāi)蒙特卡洛計(jì)算以及分子動(dòng)力學(xué)模擬。分子力場(chǎng)的構(gòu)建需要使用大量的分子構(gòu)象、能量、電荷分布等物理化學(xué)信息。本文工作即是為了構(gòu)建蛋白質(zhì)力場(chǎng)而進(jìn)行大規(guī)模模擬計(jì)算并聚類分析進(jìn)而得到一套具有代表性且具有一定可用性的數(shù)據(jù)集。在蛋白質(zhì)選取方面,考慮到蛋白質(zhì)的生物環(huán)境,對(duì)蛋白質(zhì)多種復(fù)合物進(jìn)行選擇以保證其一般性。然后進(jìn)行動(dòng)力學(xué)模擬得到蛋白質(zhì)軌跡,并借鑒MFCC分塊法思想從中提取出大量的氨基酸構(gòu)象。在對(duì)氨基酸提取的過(guò)程當(dāng)中,采用了獨(dú)特的氨基酸片段兩端處理辦法。經(jīng)過(guò)分塊處理,初步提取出20種氨基酸的構(gòu)象、能量、電荷分布等信息以構(gòu)成原始數(shù)據(jù)集。原始數(shù)據(jù)集信息量龐大,數(shù)據(jù)重復(fù)性較高,每種特征量所占權(quán)重各有不同。為了將氨基酸原始數(shù)據(jù)集簡(jiǎn)化,同時(shí)又不失其采樣數(shù)據(jù)的全面性,由此引用一種新的聚類方法,即t-SNE分布耦合降維算法。通過(guò)構(gòu)建低維空間數(shù)據(jù),同時(shí)最小化在低維空間中的數(shù)據(jù)分布與高維空間中的數(shù)據(jù)分布之間的Kullback-Leisler差異,得到其在低維空間(可視的二維或三維空間)中的降維數(shù)據(jù),使得其氨基酸聚類相比于常用的K-均值聚類更加具有卓越的分析效果,以便于對(duì)原始數(shù)據(jù)集進(jìn)行有效合理地提取和利用。在構(gòu)建力場(chǎng),快速得到生物蛋白質(zhì)分子精確的物理化學(xué)性質(zhì)等方面具有重要意義。
【關(guān)鍵詞】:氨基酸 MFCC t-SNE 聚類 降維
【學(xué)位授予單位】:遼寧師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:O629.7
【目錄】:
  • 摘要4-5
  • Abstract5-8
  • 第一章 引言8-18
  • 1.1 分子模擬8-12
  • 1.1.1 分子力場(chǎng)8-10
  • 1.1.2 分子動(dòng)力學(xué)模擬10-11
  • 1.1.3 分子力學(xué)的局限性11-12
  • 1.2 量子化學(xué)計(jì)算12-16
  • 1.2.1 量子化學(xué)簡(jiǎn)介12-13
  • 1.2.2 玻恩-奧本海默近似13
  • 1.2.3 中心場(chǎng)近似13-14
  • 1.2.4 基組14
  • 1.2.5 量子化學(xué)的線性規(guī)模計(jì)算方法14-16
  • 1.2.6 結(jié)合MFCC的氨基酸聚類分析16
  • 1.3 機(jī)器學(xué)習(xí)與聚類分析16-18
  • 1.3.1 機(jī)器學(xué)習(xí)簡(jiǎn)介16-17
  • 1.3.2 主成分分析法17
  • 1.3.3 K-均值法17
  • 1.3.4 t-SNE聚類法17-18
  • 第二章 氨基酸構(gòu)象數(shù)據(jù)庫(kù)的建立18-37
  • 2.1 蛋白質(zhì)復(fù)合物在GROMACS下的動(dòng)力學(xué)模擬18-27
  • 2.1.1 蛋白質(zhì)的選取18-20
  • 2.1.2 預(yù)處理工作20-21
  • 2.1.3 構(gòu)象能量?jī)?yōu)化21-24
  • 2.1.4 NVT系綜下的模擬24
  • 2.1.5 NPT系綜下的模擬24
  • 2.1.6 GROMACS動(dòng)力學(xué)模擬24
  • 2.1.7 MD結(jié)果數(shù)據(jù)分析24-27
  • 2.2 MFCC分塊操作27-34
  • 2.2.1 MFCC分塊法簡(jiǎn)介27-28
  • 2.2.2 本文對(duì)MFCC分塊法思想的應(yīng)用28-33
  • 2.2.3 對(duì)四種蛋白質(zhì)的分割與提取33-34
  • 2.3 Gaussian量子化學(xué)計(jì)算34
  • 2.4 氨基酸原始特征數(shù)據(jù)的建立34-37
  • 2.4.1 操作過(guò)程簡(jiǎn)介34-36
  • 2.4.2 原始特征數(shù)據(jù)建立的意義36-37
  • 第三章 基于t-SNE的分子構(gòu)象聚類37-46
  • 3.1 t-SNE聚類方法簡(jiǎn)述37-40
  • 3.2 氨基酸原始數(shù)據(jù)基于t-SNE的降維處理過(guò)程40-41
  • 3.3 t-SNE聚類方法的應(yīng)用效果討論41-46
  • 3.3.1 聚類效果可視化41-45
  • 3.3.2 t-SNE與其它聚類方法的效果比較45-46
  • 結(jié)論46-48
  • 參考 文獻(xiàn)48-51
  • 附錄A 相關(guān)代碼示例51-54
  • 攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況54-55
  • 致謝55

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 陳華豪;;聚類分析[J];林業(yè)勘查設(shè)計(jì);1981年02期

2 劉昆元;;聚類分析法及其在分析化學(xué)中的應(yīng)用[J];分析化學(xué);1985年09期

3 計(jì)維濃,楊君明;太湖流域主要糧食作物和有關(guān)土壤中若干元素的聚類分析[J];農(nóng)業(yè)環(huán)境科學(xué)學(xué)報(bào);1986年06期

4 許慶華;聚類分析在磷塊巖風(fēng)化礦判別中的應(yīng)用[J];化工礦山技術(shù);1991年03期

5 陳燕國(guó);蔡少華;;應(yīng)用聚類分析對(duì)水庫(kù)營(yíng)養(yǎng)類型分類和0—1高指標(biāo)判別方法[J];湖泊科學(xué);1993年03期

6 袁建美;聚類分析法在學(xué)生成績(jī)?cè)u(píng)估中的應(yīng)用[J];石油大學(xué)學(xué)報(bào)(自然科學(xué)版);1998年01期

7 黃盛初,周心權(quán),趙愛(ài)國(guó);安全生產(chǎn)發(fā)展規(guī)律聚類分析[J];中國(guó)煤炭;2005年11期

8 何永政;我國(guó)不同省區(qū)棉花色特征的聚類分析[J];中國(guó)纖檢;2005年02期

9 陳淑君;陡河水污染研究——聚類分析—最短距離法在水污染研究中的應(yīng)用[J];環(huán)境科學(xué)叢刊;1984年08期

10 葉茂華;胡繼岳;陸啟芳;;應(yīng)用電子計(jì)算機(jī)對(duì)水質(zhì)檢驗(yàn)指標(biāo)的聚類分析[J];環(huán)境科學(xué)動(dòng)態(tài);1985年07期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 梅翠;;我國(guó)各地區(qū)居民收入差距及其對(duì)消費(fèi)的制約[A];中國(guó)現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)第12屆學(xué)術(shù)年會(huì)論文集[C];2005年

2 李均立;傅國(guó)華;;海南各縣(市)經(jīng)濟(jì)實(shí)力的聚類分析[A];中國(guó)現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)第12屆學(xué)術(shù)年會(huì)論文集[C];2005年

3 劉黃金;曹林峰;;南京服務(wù)業(yè)發(fā)展的聚類分析[A];江蘇省現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)第十次學(xué)術(shù)年會(huì)論文集[C];2006年

4 肖靜;楊澤峰;徐辰武;;微陣列表達(dá)譜監(jiān)督聚類分析方法的比較研究[A];江蘇省遺傳學(xué)會(huì)第七屆代表大會(huì)暨學(xué)術(shù)研討會(huì)論文摘要匯編[C];2006年

5 路愛(ài)峰;崔玉杰;;滬市電力上市公司經(jīng)營(yíng)業(yè)績(jī)的聚類分析[A];中國(guó)數(shù)學(xué)力學(xué)物理學(xué)高新技術(shù)交叉研究學(xué)會(huì)第十二屆學(xué)術(shù)年會(huì)論文集[C];2008年

6 陳國(guó)華;廖小蓮;夏君;;證券投資分析的聚類分析方法[A];中國(guó)企業(yè)運(yùn)籌學(xué)[2011(1)][C];2011年

7 張紅衛(wèi);隗金水;;聚類分析評(píng)價(jià)與測(cè)量效度關(guān)系探討[A];第九屆全國(guó)體育科學(xué)大會(huì)論文摘要匯編(4)[C];2011年

8 牛東曉;乞建勛;;網(wǎng)絡(luò)資源平衡問(wèn)題的聚類分析優(yōu)化遺傳算法研究[A];2001年中國(guó)管理科學(xué)學(xué)術(shù)會(huì)議論文集[C];2001年

9 詹原瑞;彭書(shū)杰;李如一;;基于聚類分析的企業(yè)信用等級(jí)評(píng)價(jià)方法[A];西部開(kāi)發(fā)與系統(tǒng)工程——中國(guó)系統(tǒng)工程學(xué)會(huì)第12屆年會(huì)論文集[C];2002年

10 鄒曉玫;修春波;;基于聚類分析的犯罪率相關(guān)因素的研究[A];當(dāng)代法學(xué)論壇(二○一○年第3輯)[C];2010年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條

1 張建萍;基于計(jì)算智能技術(shù)的聚類分析研究與應(yīng)用[D];山東師范大學(xué);2014年

2 李成安;分布式環(huán)境下聚類分析新方法的研究[D];浙江大學(xué);2006年

3 楊旭杰;基于統(tǒng)計(jì)方法模型分析的中藥復(fù)方專利保護(hù)研究[D];北京中醫(yī)藥大學(xué);2012年

4 李寶玲;王裕頤教授學(xué)術(shù)思想與臨床經(jīng)驗(yàn)總結(jié)及治療眩暈證治規(guī)律研究[D];北京中醫(yī)藥大學(xué);2012年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 李元俊;大學(xué)生就業(yè)能力培養(yǎng)與社會(huì)需求的匹配性研究[D];山東建筑大學(xué);2015年

2 馮雪冰;基于模糊理論的EM算法在聚類分析的應(yīng)用研究[D];中國(guó)地質(zhì)大學(xué)(北京);2015年

3 黃銀;行業(yè)地區(qū)發(fā)展水平的聚類分析[D];蘇州大學(xué);2015年

4 郭俊峰;聚類分析下的股票投資價(jià)值挖掘研究[D];大連海事大學(xué);2015年

5 張旭;考慮風(fēng)電接入不確定性的節(jié)點(diǎn)特性建模研究[D];山東大學(xué);2015年

6 褚旭;我國(guó)各省市CDM項(xiàng)目聚類分析及影響因素研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2015年

7 劉鑫琳;VAGUE集理論及其在聚類分析中的應(yīng)用[D];廣西大學(xué);2015年

8 周穎;基于蟻群算法的聚類分析在學(xué)生成績(jī)中的研究[D];南昌大學(xué);2015年

9 邢蕊;以聚類分析為基礎(chǔ)的我國(guó)證券公司效率研究[D];山西大學(xué);2015年

10 王帥宇;K-Means算法在用戶細(xì)分方面的應(yīng)用研究[D];北京理工大學(xué);2015年



本文編號(hào):1005947

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/huaxue/1005947.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2bd20***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com