HEVC關鍵模塊并行算法的設計與基于GPU的實現(xiàn)
本文選題:HEVC + 幀間預測; 參考:《大連理工大學》2016年碩士論文
【摘要】:近年來隨著高清和超高清視頻的發(fā)展,視頻應用的多樣性和高分辨率給以往的視頻編碼標準帶來了極大的挑戰(zhàn)。為了能夠滿足視頻應用的需求,2013年國際電信聯(lián)盟(ITU-T)的視頻編碼專家組和國際標準化組織(ISO/IEC)的移動視頻專家組通力合作,發(fā)布了最新一代的視頻編碼標準——HEVC。相對于H.264/AVC,在相同圖像質量的前提下,平均可以減少50%的碼率。HEVC在獲得出色視頻壓縮性能的同時其超高的計算復雜度制約了HEVC的廣泛應用。為此有必要提高HEVC的編碼效率。GPU大量的運算單元非常適合通用并行計算。NVIDIA公司于2007年推出的全新通用并行計算架構(CUDA)采用類C語言為實現(xiàn)大規(guī)?刹⑿械臄(shù)據(jù)任務提供了良好的計算平臺。利用GPU的眾核特性并行實現(xiàn)視頻編碼算法已經(jīng)成為加速視頻編碼的有效解決方式。本文重點針對HEVC幀間預測和環(huán)路濾波的關鍵模塊進行并行算法的設計,并在CUDA平臺上編程實現(xiàn)。針對分像素插值,本文設計了一種高效的分像素插值并行算法;針對運動估計環(huán)節(jié),本文分別設計了基于梯狀并行的整像素和分像素運動搜索算法;針對DCT變換和IDCT變換,本文設計了一種基于蝶形運算的多層級并行算法;針對量化和反量化模塊進行并行算法的設計;本文設計了一種全并行的去方塊濾波算法;針對樣點自適應補償模塊,對邊界補償和邊帶補償分別設計了像素分類和信息統(tǒng)計、補償值求取的并行算法,設計了基于對角結構的參數(shù)融合并行算法,設計了全并行的濾波補償算法。本文在CPU+GPU異構平臺上用CUDA語言編程實現(xiàn)了所有設計的并行算法。實驗結果表明,對于1080P的高清視頻序列,在保證圖像重構質量的前提下,與原始串行算法相比,本文設計的并行算法能夠取得20倍以上的加速比,能夠有效提高幀間回路的編碼效率。
[Abstract]:In recent years, with the development of high-definition and ultra-high-definition video, the diversity and high resolution of video applications have brought great challenges to the previous video coding standards. In order to meet the needs of video applications, the Video coding expert Group of the International Telecommunication Union (ITU) in 2013 and the Mobile Video expert Group of ISO / IEC of the International Organization for Standardization (ISO / IEC) jointly issued the latest generation of video coding standard, HEVC. Compared with H.264 / AVC, with the same image quality, the average bit rate can be reduced by 50%. HEVC can achieve excellent video compression performance and its high computational complexity restricts the wide application of HEVC. Therefore, it is necessary to improve the coding efficiency of HEVC. GPU with a large number of computing units is very suitable for general parallel computing. NVIDIA introduced a new universal parallel computing architecture in 2007. It provides a good computing platform. Parallel implementation of video coding algorithm based on GPU's multikernel characteristics has become an effective solution to accelerate video coding. This paper focuses on the design of parallel algorithms for the key modules of inter-frame prediction and loop filtering in HEVC, and implements them on the CUDA platform. For sub-pixel interpolation, this paper designs an efficient sub-pixel interpolation parallel algorithm; for motion estimation, this paper designs the whole pixel and sub-pixel motion search algorithm based on ladder parallel; for DCT transform and IDCT transform, In this paper, we design a multi-level parallel algorithm based on butterfly operation; design a parallel algorithm for quantization and inverse quantization module; design a fully parallel de-block filter algorithm; For boundary compensation and sideband compensation, the parallel algorithms of pixel classification and information statistics, compensation value calculation, parameter fusion parallel algorithm based on diagonal structure and full-parallel filtering compensation algorithm are designed respectively. In this paper, all the parallel algorithms are implemented on CPU GPU heterogeneous platform with CUDA programming language. The experimental results show that the parallel algorithm designed in this paper can achieve a speedup ratio of more than 20 times compared with the original serial algorithm under the premise of guaranteeing the image reconstruction quality for 1080P high-definition video sequences. It can effectively improve the coding efficiency of the inter-frame loop.
【學位授予單位】:大連理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN919.81
【相似文獻】
相關期刊論文 前10條
1 徐云;孫廣中;鄭啟龍;吳俊敏;陳國良;;“并行算法”課程的教學與探討[J];教育與現(xiàn)代化;2008年04期
2 陳國良;孫廣中;徐云;呂敏;;并行算法研究方法學[J];計算機學報;2008年09期
3 羅貴章;陳忠偉;;并行算法綜述[J];計算機光盤軟件與應用;2013年15期
4 謝鐵柱;吳功廣;;多項式幾種并行算法的比較與優(yōu)化[J];計算機工程與科學;1981年01期
5 李曉梅 ,胡慶豐;并行算法的發(fā)展與展望[J];計算機工程與科學;1991年03期
6 童麗,王正明,曾泳泓;自變量選擇及其并行算法[J];數(shù)值計算與計算機應用;2001年03期
7 陳國良;昔日王榭堂前燕,飛入尋常百姓家淺談并行算法[J];新電腦;2002年12期
8 李曉梅;《可擴展并行算法的設計與分析》簡介[J];裝備指揮技術學院學報;2003年02期
9 吳磊,蘆東昕,方馬;并行算法中的指針轉移技術分析[J];計算機工程;2003年22期
10 雷英杰,霍紅衛(wèi);典型并行算法的實現(xiàn)性能分析[J];空軍工程大學學報(自然科學版);2003年05期
相關會議論文 前10條
1 姚向東;;并行算法到并行結構的映射[A];中國工程物理研究院科技年報(2001)[C];2001年
2 高華;苗世光;;城市小區(qū)尺度模式并行算法研究[A];中國氣象學會2006年年會“中尺度天氣動力學、數(shù)值模擬和預測”分會場論文集[C];2006年
3 王志成;吳頌平;;多塊結構網(wǎng)格并行算法研究[A];北京力學會第20屆學術年會論文集[C];2014年
4 焦龍;郭亞紅;紀守領;李金寶;;基于多核計算機的分子動力學并行算法的實現(xiàn)[A];黑龍江省計算機學會2009年學術交流年會論文集[C];2010年
5 張衡;張武;;三維拋物型初邊值問題的塊三對角可擴展并行算法[A];2007年全國開放式分布與并行計算機學術會議論文集(上冊)[C];2007年
6 王雷章;張愛武;劉曉萌;;三維建模中平面分割并行算法的設計與實現(xiàn)[A];中國系統(tǒng)仿真學會第五次全國會員代表大會暨2006年全國學術年會論文集[C];2006年
7 毛韶陽;李肯立;;一種基因數(shù)據(jù)的聚類并行算法研究[A];2007年全國開放式分布與并行計算機學術會議論文集(上冊)[C];2007年
8 左墨;藺小林;;電力系統(tǒng)暫態(tài)穩(wěn)定并行算法的進展[A];第二屆中國水利水電巖土力學與工程學術討論會論文集(二)[C];2008年
9 樊洪明;李先庭;趙彬;任鴻澤;;有限元分布式并行算法研究[A];全國暖通空調制冷2002年學術年會論文集[C];2002年
10 侯有政;張方;;基于CUDA的動載荷頻域識別的并行算法研究[A];第十屆全國振動理論及應用學術會議論文集(2011)上冊[C];2011年
相關重要報紙文章 前4條
1 ;并行算法研究進展[N];中國計算機報;2004年
2 新華社記者 奚啟新 本報通訊員 李汛 記者 喻國英;精彩人生[N];光明日報;2005年
3 新華社記者 奚啟新 本報記者 廖文根;三次選擇 無怨無悔[N];人民日報;2005年
4 清華大學計算機系 薛巍;電網(wǎng)仿真考驗高性能計算[N];計算機世界;2006年
相關博士學位論文 前10條
1 任立波;稠密顆粒兩相流的CFD-DEM耦合并行算法及數(shù)值模擬[D];山東大學;2015年
2 李雪寶;太陽望遠鏡海量數(shù)據(jù)并行處理技術研究[D];中國科學院研究生院(云南天文臺);2015年
3 馬欣榮;微分動力學方程的快速與并行算法研究[D];西安電子科技大學;2015年
4 張艷;分布并行算法設計、分析與實現(xiàn)[D];電子科技大學;2001年
5 杜云飛;容錯并行算法的研究與分析[D];國防科學技術大學;2008年
6 潘斌;幾何定理機器證明并行算法研究[D];中國科學院研究生院(成都計算機應用研究所);2006年
7 駱志剛;典型結構大型線性方程組的分布式并行算法研究[D];中國人民解放軍國防科學技術大學;2000年
8 何霞輝;基于非穩(wěn)態(tài)不可壓縮流的可擴張并行算法研究[D];湖南大學;2013年
9 戚晶晶;熱物性反問題高效并行算法研究[D];武漢理工大學;2013年
10 張愛清;可擴展數(shù)據(jù)驅動并行算法研究及應用[D];中國工程物理研究院;2009年
相關碩士學位論文 前10條
1 陳權;基于分布式集群的多攝像頭的目標檢測和跟蹤的并行算法[D];南京理工大學;2015年
2 馬煥煥;一類近場動力學問題的并行算法[D];山東大學;2015年
3 朱曉丹;一種神經(jīng)動力學優(yōu)化系統(tǒng)的并行算法設計[D];大連理工大學;2015年
4 張源;新一代視頻編碼技術的并行算法設計與實現(xiàn)[D];大連理工大學;2015年
5 董蕾;基于GPU的圖像壓縮感知算法并行化研究[D];電子科技大學;2015年
6 蔣昭炎;基于圖像的大場景三維重建并行算法研究[D];東北大學;2013年
7 馮杰;基于MIC架構的遙感圖像增強類算法并行化研究[D];電子科技大學;2015年
8 鄭全剛;并行生物序列算法設計與優(yōu)化[D];山東大學;2016年
9 周蘭花;基于異構計算的電磁仿真并行算法研究[D];湖南大學;2016年
10 李劍威;共形組合激發(fā)參數(shù)并行算法研究[D];西南石油大學;2016年
,本文編號:1836831
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1836831.html