并行計算在生物信息學(xué)中的運用和實現(xiàn)
發(fā)布時間:2022-01-27 14:12
生物信息學(xué)是多門學(xué)科相互交叉而形成的一門新興學(xué)科,是當(dāng)今生命科學(xué)和自然科學(xué)的核心領(lǐng)域和最具活力的前沿領(lǐng)域之一。使用計算機系統(tǒng)進行科學(xué)計算和模擬已經(jīng)成為現(xiàn)代生物研究最重要的方法之一。在生物信息學(xué)中,DNA序列的比對、拼接和基因表達數(shù)據(jù)的聚類分析是最常見也是重要的內(nèi)容,它們數(shù)據(jù)量多、計算量大,對計算機的處理速度等性能要求較高。雖然高性能并行計算機能夠滿足大規(guī)模計算的需要,但其價格昂貴,使用成本高。本文提出使用PC機構(gòu)建局域網(wǎng)絡(luò),開發(fā)并使用并行化的生物信息學(xué)軟件。本文提出了一種可擴展的架構(gòu)模式BioMpi。在深入分析現(xiàn)有的phrap軟件的前提下,針對并行計算環(huán)境,提出一種新的并行算法并實現(xiàn)了基于BioMpi架構(gòu)下的并行拼接軟件mpiphrap。本文還針對mpiblast和HMMER這2款并行化的軟件,給出了并行化接口并移植于BioMpi架構(gòu)下。最后,分別針對基于BioMpi架構(gòu)下mpiphrap、mpiblast和HMMER這3款軟件進行了測試,并給出了在單節(jié)點和多節(jié)點運行環(huán)境的情況下的測試結(jié)果。試驗數(shù)據(jù)...
【文章來源】:南京林業(yè)大學(xué)江蘇省
【文章頁數(shù)】:50 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
第一章 緒論
1.1 課題背景
1.2 國內(nèi)外生物并行軟件的研究現(xiàn)狀
1.2.1 并行計算的研究進展
1.2.2 phrap 研究進展
1.2.3 BLAST 研究進展
1.2.4 HMMER 的研究進展
1.3 本課題的研究意義和主要內(nèi)容
1.3.1 本課題的研究意義
1.3.2 本課題的主要研究工作
第二章 并行軟件架構(gòu)體系Bio_Mpi 的開發(fā)
2.1 開發(fā)語言介紹
2.1.1 MPI 簡介
2.1.2 通信域
2.1.3 MPI 調(diào)用接口
2.1.4 MPI 并行編程模式
2.1.5 MPI 通信模式
2.2 模型設(shè)計
2.3 Bio_Mpi 架構(gòu)圖
2.4 Bio_Mpi 的開發(fā)
2.4.1 主節(jié)點的初始化串行處理過程
2.4.2 各節(jié)點的并行處理過程
2.4.3 主節(jié)點匯總處理過程
2.5 mpiphrap 的開發(fā)
2.5.1 mpiphrap 的并行思想
2.5.2 mpiphrap 的并行算法
第三章 并行軟件架構(gòu)體系Bio_Mpi 的測試
3.1 Bio_Mpi 的測試環(huán)境
3.2 mpiphrap 的測試
3.2.1 楊樹的mpiphrap 測試
3.2.2 芝麻的mpiphrap 測試
3.3 mpiblast 的測試
3.3.1 測試使用的軟件版本
3.3.2 Swiss_Prot 數(shù)據(jù)庫的測試
3.3.3 env_nr 數(shù)據(jù)庫的測試
3.4 HMMER 的測試
3.4.1 hmmbuild 的測試
3.4.2 hmmsearch 的測試
第四章 結(jié)束語
參考文獻
附錄A Fedora 操作系統(tǒng)中的設(shè)置
1 Fedora 的準(zhǔn)備工作
2 創(chuàng)建NFS 服務(wù)
2.1 服務(wù)器的設(shè)置
2.2 客戶機的設(shè)置
3 創(chuàng)建SSH 信任連接
4 安裝MPICH2
5 環(huán)境測試
6 編寫程序并運行
7 卸載環(huán)境
附錄B 安裝mpiblast
1 下載和解壓
2 安裝ncbi
3 安裝mpiblast
4 mpiblast 環(huán)境設(shè)置
附錄C 安裝HMMER3
1 安裝hmmer
詳細(xì)摘要
【參考文獻】:
期刊論文
[1]基于HMM的基因識別并行計算[J]. 王棟,李靖,武華北,宋婷. 計算機與信息技術(shù). 2007(10)
[2]基于HMM的基因識別并行計算[J]. 王棟,李靖,武華北,宋婷. 計算機與信息技術(shù). 2007 (10)
[3]基于曙光4000A的BLAST并行算法[J]. 譚光明,徐琳,周幼英,馮圣中,孫凝暉. 計算機工程. 2006(10)
[4]基于SSE2的Smith-Waterman算法[J]. 戴正華,張慶丹,徐琳,譚光明,馮圣中. 計算機工程與應(yīng)用. 2006(11)
[5]一種SMP機群下程序并行化模式的設(shè)計與應(yīng)用[J]. 劉瑋. 微電子學(xué)與計算機. 2005(11)
[6]基于隱馬爾可夫模型的多重序列分析[J]. 羅澤舉,朱思銘,何淼. 中山大學(xué)學(xué)報(自然科學(xué)版). 2005(02)
[7]Linux環(huán)境下MPI并行編程與算法實現(xiàn)研究[J]. 曾志峰. 航空計算技術(shù). 2004(02)
[8]基因序列分析軟件Hmmpfam的可擴展并行性能優(yōu)化[J]. 陳軍,趙文輝,莫則堯,李曉梅. 軟件學(xué)報. 2004(02)
[9]序列拼裝程序的并行化研究與實現(xiàn)[J]. 蔡立志,童維勤,廖文昭. 計算機工程與應(yīng)用. 2003(14)
[10]隱馬爾可夫模型用于蛋白質(zhì)序列分析[J]. 吳曉明,宋長新,王波,程敬之. 生物醫(yī)學(xué)工程學(xué)雜志. 2002(03)
本文編號:3612627
【文章來源】:南京林業(yè)大學(xué)江蘇省
【文章頁數(shù)】:50 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
第一章 緒論
1.1 課題背景
1.2 國內(nèi)外生物并行軟件的研究現(xiàn)狀
1.2.1 并行計算的研究進展
1.2.2 phrap 研究進展
1.2.3 BLAST 研究進展
1.2.4 HMMER 的研究進展
1.3 本課題的研究意義和主要內(nèi)容
1.3.1 本課題的研究意義
1.3.2 本課題的主要研究工作
第二章 并行軟件架構(gòu)體系Bio_Mpi 的開發(fā)
2.1 開發(fā)語言介紹
2.1.1 MPI 簡介
2.1.2 通信域
2.1.3 MPI 調(diào)用接口
2.1.4 MPI 并行編程模式
2.1.5 MPI 通信模式
2.2 模型設(shè)計
2.3 Bio_Mpi 架構(gòu)圖
2.4 Bio_Mpi 的開發(fā)
2.4.1 主節(jié)點的初始化串行處理過程
2.4.2 各節(jié)點的并行處理過程
2.4.3 主節(jié)點匯總處理過程
2.5 mpiphrap 的開發(fā)
2.5.1 mpiphrap 的并行思想
2.5.2 mpiphrap 的并行算法
第三章 并行軟件架構(gòu)體系Bio_Mpi 的測試
3.1 Bio_Mpi 的測試環(huán)境
3.2 mpiphrap 的測試
3.2.1 楊樹的mpiphrap 測試
3.2.2 芝麻的mpiphrap 測試
3.3 mpiblast 的測試
3.3.1 測試使用的軟件版本
3.3.2 Swiss_Prot 數(shù)據(jù)庫的測試
3.3.3 env_nr 數(shù)據(jù)庫的測試
3.4 HMMER 的測試
3.4.1 hmmbuild 的測試
3.4.2 hmmsearch 的測試
第四章 結(jié)束語
參考文獻
附錄A Fedora 操作系統(tǒng)中的設(shè)置
1 Fedora 的準(zhǔn)備工作
2 創(chuàng)建NFS 服務(wù)
2.1 服務(wù)器的設(shè)置
2.2 客戶機的設(shè)置
3 創(chuàng)建SSH 信任連接
4 安裝MPICH2
5 環(huán)境測試
6 編寫程序并運行
7 卸載環(huán)境
附錄B 安裝mpiblast
1 下載和解壓
2 安裝ncbi
3 安裝mpiblast
4 mpiblast 環(huán)境設(shè)置
附錄C 安裝HMMER3
1 安裝hmmer
詳細(xì)摘要
【參考文獻】:
期刊論文
[1]基于HMM的基因識別并行計算[J]. 王棟,李靖,武華北,宋婷. 計算機與信息技術(shù). 2007(10)
[2]基于HMM的基因識別并行計算[J]. 王棟,李靖,武華北,宋婷. 計算機與信息技術(shù). 2007 (10)
[3]基于曙光4000A的BLAST并行算法[J]. 譚光明,徐琳,周幼英,馮圣中,孫凝暉. 計算機工程. 2006(10)
[4]基于SSE2的Smith-Waterman算法[J]. 戴正華,張慶丹,徐琳,譚光明,馮圣中. 計算機工程與應(yīng)用. 2006(11)
[5]一種SMP機群下程序并行化模式的設(shè)計與應(yīng)用[J]. 劉瑋. 微電子學(xué)與計算機. 2005(11)
[6]基于隱馬爾可夫模型的多重序列分析[J]. 羅澤舉,朱思銘,何淼. 中山大學(xué)學(xué)報(自然科學(xué)版). 2005(02)
[7]Linux環(huán)境下MPI并行編程與算法實現(xiàn)研究[J]. 曾志峰. 航空計算技術(shù). 2004(02)
[8]基因序列分析軟件Hmmpfam的可擴展并行性能優(yōu)化[J]. 陳軍,趙文輝,莫則堯,李曉梅. 軟件學(xué)報. 2004(02)
[9]序列拼裝程序的并行化研究與實現(xiàn)[J]. 蔡立志,童維勤,廖文昭. 計算機工程與應(yīng)用. 2003(14)
[10]隱馬爾可夫模型用于蛋白質(zhì)序列分析[J]. 吳曉明,宋長新,王波,程敬之. 生物醫(yī)學(xué)工程學(xué)雜志. 2002(03)
本文編號:3612627
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/3612627.html
最近更新
教材專著