混合異構架構上的生物大數(shù)據(jù)并行計算研究
發(fā)布時間:2020-12-16 18:47
本文主要的研究內(nèi)容是生物大數(shù)據(jù)在多種高性能異構計算架構下的并行計算方法,主要解決了三方面的挑戰(zhàn):(ⅰ)在有限的內(nèi)存空間中對大規(guī)模數(shù)據(jù)集執(zhí)行計算的方法,(ⅱ)基于異構計算的多層級的算法并行化設計方法和(ⅲ)對不同架構計算設備的硬件抽象建模方法。在這三方面的研究中,抽象硬件模型是最重要的貢獻,提供了一個良好的抽象硬件底層,將框架設計和具體硬件分離,簡化了軟件框架,可以使軟件框架快速擴展覆蓋多種硬件架構,并能夠以簡便抽象的方式控制內(nèi)存布局。同時提供了一個簡化的硬件視角,抽象出影響性能的關鍵因素,進而在此基礎上設計效率更高的并行方法。由于高通量測序技術的快速進展,在過去的十年中,生物序列數(shù)據(jù)的數(shù)量出現(xiàn)了爆炸性增長。生物學家存在分析和理解這些數(shù)據(jù)的強烈需求,因為基因序列決定了蛋白質(zhì)的生物結構以及功能。但是,生物數(shù)據(jù)的可用性并不隨著數(shù)據(jù)庫的膨脹而增加。事實上,目前生物數(shù)據(jù)庫的數(shù)據(jù)量如此之大以至于傳統(tǒng)的數(shù)據(jù)分析方法已不足以快速執(zhí)行涉及多種數(shù)據(jù)類型的生命科學查詢。另一方面,近年來的計算力增長主要體現(xiàn)在新興體系結構上,如GPU,Xeon Phi和基于Alpha指令集的國產(chǎn)申威眾核處理器上。新興體系結構呈...
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:134 頁
【學位級別】:博士
【部分圖文】:
圖3.1比對沿著一組序列推進的示愆閣
??圖3.1比對沿著一組序列推進的示愆閣。坫兩個序列之問的斷點空14殘祜填充,川紅??色農(nóng)示。??據(jù)庫序列組的方式。在圖3.1中,我們首先對數(shù)據(jù)庫序列填充,使其填充后的長度??為4的倍數(shù),這樣可以減少底層代碼中的執(zhí)行路徑分支,從而提升計算效率。將??填充后的序列16條為一組,寫人到二維的16通道的內(nèi)存緩沖區(qū)中,以適應Xeon??Phi上512位VPU的16個通道。在將二維緩沖區(qū)序列化寫入內(nèi)存的過程中,來??自不同序列的字符被寫人相鄰的內(nèi)存地址,使得計算設備在并行讀取多條序列的??過程中能夠提高高速緩存命中率。另外,考慮到主機端的CPU所使用的SSE指??令集同樣能夠?qū)⒚恳粋向量劃分成16個通道執(zhí)行計算,該二維緩存對于CPU和??Xeon?Phi而言是通用的。值得注意的是
這里私叫是查詢序列,它的長度為g/e?。dZw叫是數(shù)據(jù)庫主序列,辦/en是它的長??度。其中的■B/ocfe&ad方法即為塊搜索方法,見算法3.2。Shuffle方法被用來高??效地構建分數(shù)譜,以便于計算函數(shù)高效訪問得分矩陣[94],它的工作過程如圖3.3。??圖3.4展示了組搜索方法的整體計算過程,我們在本章中稱之為單遍方法。??由于Xeon?Phi上的寄存器/緩存資源有限,我們將分配給Xeon?Phi的序列組??進一步劃分為一組連續(xù)的區(qū)塊(見圖3.1)。在比對計算過程中,沿著該區(qū)塊的同??一行的]6個殘基將以細粒度并行方式與查詢序列進行比對計算。這個過程一直??持續(xù)到序列組內(nèi)的所有區(qū)塊均掃描完畢。圖3.1示意了沿著二維16通道序列組的??推進計算的方式。我們還發(fā)現(xiàn),在移動到下一個查詢殘基之前,計算數(shù)據(jù)庫序列??緩沖區(qū)中的四個連續(xù)殘基可以提高捜索效率。所以我們已經(jīng)使每個區(qū)塊由64個??(16x4)殘基組成。特別的,當二維緩存中的某一條序列結束時,當前通道中會??出現(xiàn)一個斷點。在這種情況下,首先序列記錄當前序列中的分數(shù),然后重置該通??道對應的迅
【參考文獻】:
期刊論文
[1]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
本文編號:2920613
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:134 頁
【學位級別】:博士
【部分圖文】:
圖3.1比對沿著一組序列推進的示愆閣
??圖3.1比對沿著一組序列推進的示愆閣。坫兩個序列之問的斷點空14殘祜填充,川紅??色農(nóng)示。??據(jù)庫序列組的方式。在圖3.1中,我們首先對數(shù)據(jù)庫序列填充,使其填充后的長度??為4的倍數(shù),這樣可以減少底層代碼中的執(zhí)行路徑分支,從而提升計算效率。將??填充后的序列16條為一組,寫人到二維的16通道的內(nèi)存緩沖區(qū)中,以適應Xeon??Phi上512位VPU的16個通道。在將二維緩沖區(qū)序列化寫入內(nèi)存的過程中,來??自不同序列的字符被寫人相鄰的內(nèi)存地址,使得計算設備在并行讀取多條序列的??過程中能夠提高高速緩存命中率。另外,考慮到主機端的CPU所使用的SSE指??令集同樣能夠?qū)⒚恳粋向量劃分成16個通道執(zhí)行計算,該二維緩存對于CPU和??Xeon?Phi而言是通用的。值得注意的是
這里私叫是查詢序列,它的長度為g/e?。dZw叫是數(shù)據(jù)庫主序列,辦/en是它的長??度。其中的■B/ocfe&ad方法即為塊搜索方法,見算法3.2。Shuffle方法被用來高??效地構建分數(shù)譜,以便于計算函數(shù)高效訪問得分矩陣[94],它的工作過程如圖3.3。??圖3.4展示了組搜索方法的整體計算過程,我們在本章中稱之為單遍方法。??由于Xeon?Phi上的寄存器/緩存資源有限,我們將分配給Xeon?Phi的序列組??進一步劃分為一組連續(xù)的區(qū)塊(見圖3.1)。在比對計算過程中,沿著該區(qū)塊的同??一行的]6個殘基將以細粒度并行方式與查詢序列進行比對計算。這個過程一直??持續(xù)到序列組內(nèi)的所有區(qū)塊均掃描完畢。圖3.1示意了沿著二維16通道序列組的??推進計算的方式。我們還發(fā)現(xiàn),在移動到下一個查詢殘基之前,計算數(shù)據(jù)庫序列??緩沖區(qū)中的四個連續(xù)殘基可以提高捜索效率。所以我們已經(jīng)使每個區(qū)塊由64個??(16x4)殘基組成。特別的,當二維緩存中的某一條序列結束時,當前通道中會??出現(xiàn)一個斷點。在這種情況下,首先序列記錄當前序列中的分數(shù),然后重置該通??道對應的迅
【參考文獻】:
期刊論文
[1]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
本文編號:2920613
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2920613.html
最近更新
教材專著