基于R語言的蛋白質(zhì)序列可視化工具開發(fā)
發(fā)布時(shí)間:2020-12-12 10:46
生物研究者通過訪問數(shù)據(jù)庫(kù)可獲得大量的序列數(shù)據(jù)集和序列突變,這些數(shù)據(jù)的可視化使研究人員更加直觀地研究這些變異在人類疾病中所具有的潛在作用。然而當(dāng)?shù)鞍踪|(zhì)上的功能元件相距過密時(shí),目前已有的可視化軟件很難分辨出其具體位置,因而無法獲得有效信息。本文基于R語言開發(fā)的蛋白質(zhì)序列可視化工具實(shí)現(xiàn)了在蛋白質(zhì)水平上對(duì)氨基酸變化的可視化,該軟件不僅繪出在蛋白質(zhì)水平上氨基酸變化的圖像,還可完成結(jié)構(gòu)域、突變位點(diǎn)等功能元件的自動(dòng)布線,從而更加清晰地觀察蛋白質(zhì)中的變異以及是否在特定的結(jié)構(gòu)域中分布著有害突變等信息,從而揭示出某些疾病的患病機(jī)理。論文主要工作如下:(1)數(shù)據(jù)預(yù)處理。自動(dòng)下載UniProt數(shù)據(jù)庫(kù)中人類的蛋白質(zhì)數(shù)據(jù),并對(duì)下載的數(shù)據(jù)進(jìn)行預(yù)處理。(2)本文提出蛋白質(zhì)二維結(jié)構(gòu)圖的自動(dòng)布線算法,并依該算法繪制蛋白質(zhì)二維結(jié)構(gòu)彩色示意圖。本算法實(shí)現(xiàn)了當(dāng)?shù)鞍踪|(zhì)各功能元件相距過密時(shí),對(duì)其實(shí)際位置自動(dòng)布線且不重合的功能,快速而清晰地繪制出蛋白質(zhì)二維結(jié)構(gòu)彩色示意圖,并通過文本文件控制蛋白質(zhì)的名稱及樣式等。(3)對(duì)蛋白質(zhì)序列進(jìn)行保守性分析。讀取FASTA文件中不同物種的蛋白質(zhì)序列,對(duì)其進(jìn)行保守性分析,并通過文本文件設(shè)置是否對(duì)其用...
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 論文結(jié)構(gòu)及主要內(nèi)容
第2章 生物學(xué)意義及開發(fā)平臺(tái)
2.1 可視化工具的生物學(xué)意義
2.1.1 蛋白質(zhì)二維結(jié)構(gòu)圖概述
2.1.2 蛋白質(zhì)功能位點(diǎn)
2.1.3 蛋白質(zhì)結(jié)構(gòu)域
2.1.4 多序列比對(duì)與保守性分析
2.2 開發(fā)環(huán)境及工具介紹
2.2.1 R語言簡(jiǎn)介
2.2.2 R語言的特點(diǎn)
2.3 本設(shè)計(jì)應(yīng)用模塊
2.3.1 XML模塊
2.3.2 plyr模塊
2.3.3 plotrix模塊
2.3.4 seqinr模塊
2.4 本章小結(jié)
第3章 一種繪制蛋白質(zhì)二維結(jié)構(gòu)圖的自動(dòng)布線方法
3.1 功能元件名稱重疊問題
3.2 蛋白質(zhì)數(shù)據(jù)處理
3.3 判斷功能元件名稱是否重疊
3.4 功能元件橫坐標(biāo)位置的確定
3.5 名稱標(biāo)注線的確定
3.6 本章小結(jié)
第4章 蛋白質(zhì)序列可視化工具的設(shè)計(jì)與開發(fā)
4.1 總體設(shè)計(jì)方案
4.2 下載蛋白質(zhì)數(shù)據(jù)
4.2.1 生成蛋白質(zhì)數(shù)據(jù)的網(wǎng)址
4.2.2 下載蛋白質(zhì)序列長(zhǎng)度數(shù)據(jù)
4.2.3 下載蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)
4.2.4 下載蛋白質(zhì)位點(diǎn)數(shù)據(jù)
4.3 蛋白質(zhì)主體圖設(shè)計(jì)方案
4.4 結(jié)構(gòu)域圖的設(shè)計(jì)方案
4.4.1 結(jié)構(gòu)域橫向間隔的確定方法
4.4.2 結(jié)構(gòu)域標(biāo)注線長(zhǎng)度的確定方法
4.4.3 繪制結(jié)構(gòu)域及名稱
4.5 功能位點(diǎn)圖的設(shè)計(jì)方案
4.6 突變點(diǎn)圖設(shè)計(jì)方案
4.6.1 突變點(diǎn)橫向間隔的確定方法
4.6.2 突變點(diǎn)的縱向成串排列
4.6.3 繪制突變點(diǎn)
4.7 保守性分析
4.8 局部放大功能
4.9 系統(tǒng)輸出
4.10 軟件在Windows和Ubuntu環(huán)境中兼容
4.11 軟件打包
4.12 本章小結(jié)
第5章 總結(jié)與展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)組學(xué)相關(guān)技術(shù)在骨關(guān)節(jié)炎研究中的應(yīng)用與進(jìn)展[J]. 潘丁,雷光華. 中國(guó)組織工程研究. 2014(24)
[2]生物信息學(xué)相關(guān)數(shù)據(jù)庫(kù)的應(yīng)用[J]. 趙蘇蘇,賴仁勝. 醫(yī)學(xué)信息學(xué)雜志. 2011(12)
[3]真核生物mRNA選擇性剪接發(fā)生的相關(guān)因素[J]. 董娜,張芳燕,張鵬,周興濤. 科技經(jīng)濟(jì)市場(chǎng). 2011(04)
[4]結(jié)構(gòu)域蛋白質(zhì)組學(xué)研究進(jìn)展[J]. 李英娜,高友鶴,崔蓮仙. 基礎(chǔ)醫(yī)學(xué)與臨床. 2003(02)
[5]生物信息學(xué)在預(yù)測(cè)未知蛋白結(jié)構(gòu)與功能中的應(yīng)用[J]. 常愛英,王明義. 醫(yī)學(xué)檢驗(yàn)與臨床. 2013 (02)
碩士論文
[1]pMGA1.2與ApoA-Ⅰ相互作用的功能結(jié)構(gòu)域研究[D]. 胡明明.華中農(nóng)業(yè)大學(xué) 2014
本文編號(hào):2912407
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 論文結(jié)構(gòu)及主要內(nèi)容
第2章 生物學(xué)意義及開發(fā)平臺(tái)
2.1 可視化工具的生物學(xué)意義
2.1.1 蛋白質(zhì)二維結(jié)構(gòu)圖概述
2.1.2 蛋白質(zhì)功能位點(diǎn)
2.1.3 蛋白質(zhì)結(jié)構(gòu)域
2.1.4 多序列比對(duì)與保守性分析
2.2 開發(fā)環(huán)境及工具介紹
2.2.1 R語言簡(jiǎn)介
2.2.2 R語言的特點(diǎn)
2.3 本設(shè)計(jì)應(yīng)用模塊
2.3.1 XML模塊
2.3.2 plyr模塊
2.3.3 plotrix模塊
2.3.4 seqinr模塊
2.4 本章小結(jié)
第3章 一種繪制蛋白質(zhì)二維結(jié)構(gòu)圖的自動(dòng)布線方法
3.1 功能元件名稱重疊問題
3.2 蛋白質(zhì)數(shù)據(jù)處理
3.3 判斷功能元件名稱是否重疊
3.4 功能元件橫坐標(biāo)位置的確定
3.5 名稱標(biāo)注線的確定
3.6 本章小結(jié)
第4章 蛋白質(zhì)序列可視化工具的設(shè)計(jì)與開發(fā)
4.1 總體設(shè)計(jì)方案
4.2 下載蛋白質(zhì)數(shù)據(jù)
4.2.1 生成蛋白質(zhì)數(shù)據(jù)的網(wǎng)址
4.2.2 下載蛋白質(zhì)序列長(zhǎng)度數(shù)據(jù)
4.2.3 下載蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)
4.2.4 下載蛋白質(zhì)位點(diǎn)數(shù)據(jù)
4.3 蛋白質(zhì)主體圖設(shè)計(jì)方案
4.4 結(jié)構(gòu)域圖的設(shè)計(jì)方案
4.4.1 結(jié)構(gòu)域橫向間隔的確定方法
4.4.2 結(jié)構(gòu)域標(biāo)注線長(zhǎng)度的確定方法
4.4.3 繪制結(jié)構(gòu)域及名稱
4.5 功能位點(diǎn)圖的設(shè)計(jì)方案
4.6 突變點(diǎn)圖設(shè)計(jì)方案
4.6.1 突變點(diǎn)橫向間隔的確定方法
4.6.2 突變點(diǎn)的縱向成串排列
4.6.3 繪制突變點(diǎn)
4.7 保守性分析
4.8 局部放大功能
4.9 系統(tǒng)輸出
4.10 軟件在Windows和Ubuntu環(huán)境中兼容
4.11 軟件打包
4.12 本章小結(jié)
第5章 總結(jié)與展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介
【參考文獻(xiàn)】:
期刊論文
[1]蛋白質(zhì)組學(xué)相關(guān)技術(shù)在骨關(guān)節(jié)炎研究中的應(yīng)用與進(jìn)展[J]. 潘丁,雷光華. 中國(guó)組織工程研究. 2014(24)
[2]生物信息學(xué)相關(guān)數(shù)據(jù)庫(kù)的應(yīng)用[J]. 趙蘇蘇,賴仁勝. 醫(yī)學(xué)信息學(xué)雜志. 2011(12)
[3]真核生物mRNA選擇性剪接發(fā)生的相關(guān)因素[J]. 董娜,張芳燕,張鵬,周興濤. 科技經(jīng)濟(jì)市場(chǎng). 2011(04)
[4]結(jié)構(gòu)域蛋白質(zhì)組學(xué)研究進(jìn)展[J]. 李英娜,高友鶴,崔蓮仙. 基礎(chǔ)醫(yī)學(xué)與臨床. 2003(02)
[5]生物信息學(xué)在預(yù)測(cè)未知蛋白結(jié)構(gòu)與功能中的應(yīng)用[J]. 常愛英,王明義. 醫(yī)學(xué)檢驗(yàn)與臨床. 2013 (02)
碩士論文
[1]pMGA1.2與ApoA-Ⅰ相互作用的功能結(jié)構(gòu)域研究[D]. 胡明明.華中農(nóng)業(yè)大學(xué) 2014
本文編號(hào):2912407
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2912407.html
最近更新
教材專著