選擇稀疏矩陣乘法最優(yōu)存儲格式的研究
【圖文】:
模桑粒劍危危?(Ndiags×M).(1)我們對這2個參數(shù)在子矩陣集DIA_mats上測試其SpMV性能(如圖3、圖4所示).1)對角線條數(shù)(Ndiags):DIA-SpMV中寫Y的次數(shù)為Ndiags,隨著對角線條數(shù)增多,對向量Y的重復(fù)讀寫次數(shù)增加,對SpMV性能造成影響.圖3給出了Ndiags與DIA-SpMV性能的關(guān)系.圖3中Fig.3TheinfluenceofNdiagsonDIA-SpMV.圖3Ndiags對DIA-SpMV性能的影響Fig.4TheinfluenceofER_DIAonDIA-SpMV.圖4ER_DIA對DIA格式SpMV性能的影響橫坐標為Ndiags的數(shù)目,分為9個取值區(qū)間;縱坐標為矩陣所占比例.其中“GOOD”指DIA為最優(yōu)格式的矩陣所占比例,可知所有的GOOD矩陣集合即表3中的“good_DIA_mats”;而“BAD”指DIA未能獲得最好性能的矩陣比例.從圖3看出,當對角線條數(shù)大于300時,DIA格式基本在絕大多數(shù)矩陣上不再獲得最高性能.結(jié)論1.當稀疏矩陣的對角線條數(shù)較少時,SpMV使用DIA格式具有性能優(yōu)勢.2)DIA格式中非零元所占比例(ER_DIA):即使一條對角線上只有一個非零元,DIA格式也需要存儲整條對角線,,包含存儲額外的零元素.大量的補零操作降低了非零元所占比例,增加了SpMV的額外計算,從而影響其性能.ER_DIA與DIA-SpMV的性能如
能(如圖3、圖4所示).1)對角線條數(shù)(Ndiags):DIA-SpMV中寫Y的次數(shù)為Ndiags,隨著對角線條數(shù)增多,對向量Y的重復(fù)讀寫次數(shù)增加,對SpMV性能造成影響.圖3給出了Ndiags與DIA-SpMV性能的關(guān)系.圖3中Fig.3TheinfluenceofNdiagsonDIA-SpMV.圖3Ndiags對DIA-SpMV性能的影響Fig.4TheinfluenceofER_DIAonDIA-SpMV.圖4ER_DIA對DIA格式SpMV性能的影響橫坐標為Ndiags的數(shù)目,分為9個取值區(qū)間;縱坐標為矩陣所占比例.其中“GOOD”指DIA為最優(yōu)格式的矩陣所占比例,可知所有的GOOD矩陣集合即表3中的“good_DIA_mats”;而“BAD”指DIA未能獲得最好性能的矩陣比例.從圖3看出,當對角線條數(shù)大于300時,DIA格式基本在絕大多數(shù)矩陣上不再獲得最高性能.結(jié)論1.當稀疏矩陣的對角線條數(shù)較少時,SpMV使用DIA格式具有性能優(yōu)勢.2)DIA格式中非零元所占比例(ER_DIA):即使一條對角線上只有一個非零元,DIA格式也需要存儲整條對角線,包含存儲額外的零元素.大量的補零操作降低了非零元所占比例,增加了SpMV的額外計算,從而影響其性能.ER_DIA與DIA-SpMV的性能如圖4所示.可知,當矩陣中非零元所占比例過。ǎ迹玻埃ィ⿻r,DIA格式的SpMV不會取得較好的性能.結(jié)論
【作者單位】: 計算機體系結(jié)構(gòu)國家重點實驗室(中國科學(xué)院計算技術(shù)研究所);中國科學(xué)院大學(xué);
【基金】:國家自然科學(xué)基金項目(61272134,61033009,61003062,60925009) 國家“九七三”重點基礎(chǔ)研究發(fā)展計劃基金項目(2011CB302502,2012CB316502)
【分類號】:TP333;TP311.1
【參考文獻】
相關(guān)期刊論文 前1條
1 宋慶增;顧軍華;;稀疏矩陣向量乘的FPGA設(shè)計與實現(xiàn)[J];計算機工程;2011年23期
【共引文獻】
相關(guān)期刊論文 前1條
1 彭宇;仲雪潔;王少軍;;基于FPGA線性方程組的存儲優(yōu)化設(shè)計[J];計算機工程;2013年04期
相關(guān)博士學(xué)位論文 前2條
1 陳銳;CSAMT三維交錯采樣有限差分數(shù)值模擬并行算法研究[D];中國地質(zhì)大學(xué)(北京);2012年
2 張芡;大規(guī)模稀疏線性系統(tǒng)的稀疏近似逆預(yù)處理技術(shù)[D];清華大學(xué);2013年
【二級參考文獻】
相關(guān)期刊論文 前1條
1 張承暢;嚴單貴;楊力生;齊懷龍;楊宏;;基于XCF32P的多FPGA配置方案[J];計算機工程;2010年15期
【相似文獻】
相關(guān)期刊論文 前10條
1 王敏;;稀疏矩陣快速轉(zhuǎn)置算法的分析與優(yōu)化[J];計算機應(yīng)用與軟件;2010年08期
2 田翔;周凡;陳耀武;劉莉;陳耀;;基于FPGA的實時雙精度浮點矩陣乘法器設(shè)計[J];浙江大學(xué)學(xué)報(工學(xué)版);2008年09期
3 袁娥;張云泉;孫相征;;RAM(h)模型下SpMV存儲訪問復(fù)雜度的分析[J];計算機工程與設(shè)計;2009年03期
4 盧s
本文編號:2520436
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2520436.html