面向眾核處理器的大整數(shù)乘法研究
發(fā)布時(shí)間:2021-03-19 21:45
算數(shù)運(yùn)算一直是人類科學(xué)發(fā)展過程中非常重要的研究領(lǐng)域,很多科學(xué)問題的解決依賴于準(zhǔn)確、快速的算術(shù)運(yùn)算。在計(jì)算機(jī)上,算數(shù)運(yùn)算是實(shí)現(xiàn)各種應(yīng)用的基礎(chǔ),尤其大整數(shù)的乘法運(yùn)算在密碼算法、科學(xué)計(jì)算中有著廣泛的應(yīng)用。目前,計(jì)算機(jī)體系結(jié)構(gòu)開始向多核、眾核結(jié)構(gòu)發(fā)展,眾核處理器已經(jīng)開始在高性能計(jì)算等領(lǐng)域普遍使用。研究如何在眾核處理器上高效實(shí)現(xiàn)大整數(shù)乘法,對發(fā)揮現(xiàn)代眾核處理器性能優(yōu)勢,求解更大規(guī)模問題具有重要意義;谟(jì)算機(jī)體系結(jié)構(gòu)的發(fā)展變化,以及現(xiàn)實(shí)應(yīng)用中對高效大整數(shù)乘法需求不斷的提升,本文對眾核處理上的大整數(shù)乘法進(jìn)行了研究,主要工作和創(chuàng)新有:(1)對筆算乘法和Comba乘法等基本乘法算法的并行性進(jìn)行研究,并提出多種實(shí)現(xiàn)高效并行Comba乘法的改進(jìn)方法,以及給出了在SW26010眾核處理器實(shí)現(xiàn)并行Comba乘法的具體方法。(2)對Karatsuba乘法等分治類乘法的并行性進(jìn)行研究,并提出面向眾核處理器的Karatsuba乘法的改進(jìn)方法,以及研究了在SW26010眾核處理器實(shí)現(xiàn)并行Karatsuba乘法的方法。(3)對FFT乘法進(jìn)行分析與研究,提出在SW26010眾核處理器實(shí)現(xiàn)高效并行FFT乘法的方法,實(shí)現(xiàn)過程...
【文章來源】:鄭州大學(xué)河南省 211工程院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 引言
1.1 課題背景
1.2 研究意義
1.3 論文主要工作
1.4 論文結(jié)構(gòu)
2 研究基礎(chǔ)
2.1 基本概念
2.2 數(shù)學(xué)基礎(chǔ)
2.2.1 多項(xiàng)式表示
2.2.2 多項(xiàng)式乘法
2.3 大整數(shù)乘法
2.3.1 基本乘法
2.3.2 分治乘法
2.3.3 FFT乘法
2.4 大整數(shù)運(yùn)算庫
2.5 SW26010眾核處理器
2.6 本章小結(jié)
3 Comba乘法的改進(jìn)及眾核并行化
3.1 基本乘法分析
3.1.1 筆算乘法分析
3.1.2 Comba乘法分析
3.2 Comba乘法改進(jìn)
3.2.1 任務(wù)劃分策略
3.2.2 改進(jìn)的Comba算法
3.3 并行Comba算法在SW眾核處理器上的實(shí)現(xiàn)
3.4 本章小結(jié)
4 Karatsuba乘法的改進(jìn)及眾核并行化
4.1 分治乘法
4.1.1 Karatsuba乘法
4.1.2 Toom-Cook乘法
4.2 Karatsuba乘法分析
4.3 Karatsuba乘法的改進(jìn)
4.4 改進(jìn)Karatsuba乘法的并行實(shí)現(xiàn)
4.5 本章小結(jié)
5 FFT乘法的眾核并行化
5.1 快速傅里葉變換
5.2 FFT乘法原理
5.3 FFT乘法的眾核并行化實(shí)現(xiàn)
5.3.1 FFT乘法眾核并行化實(shí)現(xiàn)思路
5.3.2 復(fù)數(shù)運(yùn)算的向量化
5.3.3 寄存器通信
5.4 本章小結(jié)
6 大整數(shù)乘法系統(tǒng)構(gòu)造及測試
6.1 乘法算法測試與分析
6.2 面向SW26010的大整數(shù)乘法系統(tǒng)
6.3 本章小結(jié)
7 結(jié)論
7.1 工作總結(jié)
7.2 展望與計(jì)劃
參考文獻(xiàn)
個(gè)人簡歷及發(fā)表論文情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于Intel MIC架構(gòu)的3D有限差分算法優(yōu)化[J]. 郝鑫,郭紹忠. 計(jì)算機(jī)科學(xué). 2017(05)
[2]以深度學(xué)習(xí)為目標(biāo),NVIDIA發(fā)布首款Volta架構(gòu)GPU[J]. 寒意. 華東科技. 2017(05)
[3]大整數(shù)Comba和Karatsuba乘法的多核并行化研究[J]. 蔣麗娟,劉芳芳,趙玉文,楊超,蔡穎. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(11)
[4]高性能計(jì)算的發(fā)展[J]. 臧大偉,曹政,孫凝暉. 科技導(dǎo)報(bào). 2016(14)
[5]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
[6]一種面向高性能計(jì)算的自主眾核處理器結(jié)構(gòu)[J]. 鄭方,許勇,李宏亮,謝向輝,陳左寧. 中國科學(xué):信息科學(xué). 2015(04)
[7]SIMD自動(dòng)向量化編譯優(yōu)化概述[J]. 高偉,趙榮彩,韓林,龐建民,丁銳. 軟件學(xué)報(bào). 2015(06)
[8]基于CUDA的快速大整數(shù)乘法[J]. 許亮,王震. 計(jì)算機(jī)工程與應(yīng)用. 2013(16)
[9]PPAT:一種Pthread并行程序線程性能分析工具[J]. 溫莎莎,劉軼,劉弢宋,平李,博錢,德沛. 計(jì)算機(jī)應(yīng)用與軟件. 2012(11)
[10]一種改進(jìn)的二分查找算法[J]. 鄒國霞,何南. 軟件導(dǎo)刊. 2010(03)
碩士論文
[1]基于MIC加速部件的長整數(shù)基礎(chǔ)計(jì)算[D]. 趙明祥.華南理工大學(xué) 2016
[2]基于MPI和Linux機(jī)群環(huán)境的FFT算法的并行設(shè)計(jì)與實(shí)現(xiàn)[D]. 盧可佩.曲阜師范大學(xué) 2015
[3]基于ElGamal算法的多級匿名通信系統(tǒng)[D]. 許尚妹.西安電子科技大學(xué) 2014
[4]基于多核多線程的FFT算法和堆排序算法的并行優(yōu)化和實(shí)現(xiàn)[D]. 徐金棒.鄭州大學(xué) 2011
[5]公鑰密碼體制中強(qiáng)素?cái)?shù)生成算法與大數(shù)乘法的研究[D]. 蔡剛.中南民族大學(xué) 2009
[6]RSA公鑰密碼算法的快速實(shí)現(xiàn)[D]. 王安.山東大學(xué) 2008
本文編號:3090278
【文章來源】:鄭州大學(xué)河南省 211工程院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 引言
1.1 課題背景
1.2 研究意義
1.3 論文主要工作
1.4 論文結(jié)構(gòu)
2 研究基礎(chǔ)
2.1 基本概念
2.2 數(shù)學(xué)基礎(chǔ)
2.2.1 多項(xiàng)式表示
2.2.2 多項(xiàng)式乘法
2.3 大整數(shù)乘法
2.3.1 基本乘法
2.3.2 分治乘法
2.3.3 FFT乘法
2.4 大整數(shù)運(yùn)算庫
2.5 SW26010眾核處理器
2.6 本章小結(jié)
3 Comba乘法的改進(jìn)及眾核并行化
3.1 基本乘法分析
3.1.1 筆算乘法分析
3.1.2 Comba乘法分析
3.2 Comba乘法改進(jìn)
3.2.1 任務(wù)劃分策略
3.2.2 改進(jìn)的Comba算法
3.3 并行Comba算法在SW眾核處理器上的實(shí)現(xiàn)
3.4 本章小結(jié)
4 Karatsuba乘法的改進(jìn)及眾核并行化
4.1 分治乘法
4.1.1 Karatsuba乘法
4.1.2 Toom-Cook乘法
4.2 Karatsuba乘法分析
4.3 Karatsuba乘法的改進(jìn)
4.4 改進(jìn)Karatsuba乘法的并行實(shí)現(xiàn)
4.5 本章小結(jié)
5 FFT乘法的眾核并行化
5.1 快速傅里葉變換
5.2 FFT乘法原理
5.3 FFT乘法的眾核并行化實(shí)現(xiàn)
5.3.1 FFT乘法眾核并行化實(shí)現(xiàn)思路
5.3.2 復(fù)數(shù)運(yùn)算的向量化
5.3.3 寄存器通信
5.4 本章小結(jié)
6 大整數(shù)乘法系統(tǒng)構(gòu)造及測試
6.1 乘法算法測試與分析
6.2 面向SW26010的大整數(shù)乘法系統(tǒng)
6.3 本章小結(jié)
7 結(jié)論
7.1 工作總結(jié)
7.2 展望與計(jì)劃
參考文獻(xiàn)
個(gè)人簡歷及發(fā)表論文情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于Intel MIC架構(gòu)的3D有限差分算法優(yōu)化[J]. 郝鑫,郭紹忠. 計(jì)算機(jī)科學(xué). 2017(05)
[2]以深度學(xué)習(xí)為目標(biāo),NVIDIA發(fā)布首款Volta架構(gòu)GPU[J]. 寒意. 華東科技. 2017(05)
[3]大整數(shù)Comba和Karatsuba乘法的多核并行化研究[J]. 蔣麗娟,劉芳芳,趙玉文,楊超,蔡穎. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(11)
[4]高性能計(jì)算的發(fā)展[J]. 臧大偉,曹政,孫凝暉. 科技導(dǎo)報(bào). 2016(14)
[5]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
[6]一種面向高性能計(jì)算的自主眾核處理器結(jié)構(gòu)[J]. 鄭方,許勇,李宏亮,謝向輝,陳左寧. 中國科學(xué):信息科學(xué). 2015(04)
[7]SIMD自動(dòng)向量化編譯優(yōu)化概述[J]. 高偉,趙榮彩,韓林,龐建民,丁銳. 軟件學(xué)報(bào). 2015(06)
[8]基于CUDA的快速大整數(shù)乘法[J]. 許亮,王震. 計(jì)算機(jī)工程與應(yīng)用. 2013(16)
[9]PPAT:一種Pthread并行程序線程性能分析工具[J]. 溫莎莎,劉軼,劉弢宋,平李,博錢,德沛. 計(jì)算機(jī)應(yīng)用與軟件. 2012(11)
[10]一種改進(jìn)的二分查找算法[J]. 鄒國霞,何南. 軟件導(dǎo)刊. 2010(03)
碩士論文
[1]基于MIC加速部件的長整數(shù)基礎(chǔ)計(jì)算[D]. 趙明祥.華南理工大學(xué) 2016
[2]基于MPI和Linux機(jī)群環(huán)境的FFT算法的并行設(shè)計(jì)與實(shí)現(xiàn)[D]. 盧可佩.曲阜師范大學(xué) 2015
[3]基于ElGamal算法的多級匿名通信系統(tǒng)[D]. 許尚妹.西安電子科技大學(xué) 2014
[4]基于多核多線程的FFT算法和堆排序算法的并行優(yōu)化和實(shí)現(xiàn)[D]. 徐金棒.鄭州大學(xué) 2011
[5]公鑰密碼體制中強(qiáng)素?cái)?shù)生成算法與大數(shù)乘法的研究[D]. 蔡剛.中南民族大學(xué) 2009
[6]RSA公鑰密碼算法的快速實(shí)現(xiàn)[D]. 王安.山東大學(xué) 2008
本文編號:3090278
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/3090278.html
最近更新
教材專著