基于DCT域的系數(shù)分級預判與視覺優(yōu)化算法研究
本文選題:H.264 + 零值量化DCT系數(shù) ; 參考:《江西理工大學》2015年碩士論文
【摘要】:隨著信息時代的發(fā)展,高清晰度的視頻越來越受人們的青睞,視頻編碼技術也顯得日益重要。H.264/AVC是VCEG和MPEG兩大國際組織聯(lián)合推出的視頻編碼標準,也是目前最流行的視頻標準之一。該標準吸收了以往視頻標準的優(yōu)點,同時引進了多種先進的編碼技術,使得其編碼效率比以往標準至少提高了一倍以上。然而與此同時,也帶來了大量的復雜編碼運算量。因此,針對H.264/AVC視頻編碼算法進行性能優(yōu)化,在保證編碼質量的前提下降低編碼的復雜度具有重要的現(xiàn)實意義和應用價值。本文圍繞H.264/AVC標準中DCT域的編碼算法,主要做了以下內容的研究工作:(1)針對運動補償后的殘差塊經過4×4整數(shù)離散余弦變換(DCT)及量化過程后出現(xiàn)大量的零值量化系數(shù)(ZQDCT)而導致的冗余計算問題,在分析提取出最佳全零塊判決閾值的基礎上,結合高斯分布模型和DCT系數(shù)能量“Z”形分布特性,提出了基于該新閾值的零值量化系數(shù)分級預判算法,在殘差塊DCT變換之前按分級模式預判出ZQDCT,從而跳過其變換量化操作。實驗結果表明,與標準算法相比,該算法明顯降低了編碼數(shù)據量,同時減少了最高達42%的離散余弦變換(DCT)、量化(Q)、反量化(IQ)以及離散余弦反變換(IDCT)過程計算時間。(2)結合人類視覺系統(tǒng)特性,將基于DCT域的恰可察覺失真(JND)模型應用于H.264標準算法中。由于人眼是視頻圖像的最終接收者,其對于DCT系數(shù)中低頻分量具有更大的敏感性,而高頻部分可能含有較多的視覺冗余系數(shù)。JND表示人眼不能察覺的最大圖像失真,反映了圖像中不可感知的視覺冗余信息。算法根據不同的4×4 DCT變換塊計算出相應的JND閾值,對每個變換后的DCT系數(shù)進行過濾,其中對應位置比JND閾值小的DCT系數(shù)直接舍棄,從而去除視頻圖像中存在的主觀視覺冗余。同時對舍棄后相應的DCT系數(shù)跳過其量化等操作,節(jié)省運算量。實驗仿真結果表明,該JND模型能節(jié)省編碼碼率,同時對視頻圖像質量并不影響,對視頻編碼中的視覺冗余優(yōu)化取得了良好的效果。本文通過對H.264標準中的DCT變換與量化過程的研究,利用分級預判算法將ZQDCT系數(shù)進行提前預判并跳過其DCT部分的編碼,節(jié)省了運算量;另外從人類視覺系統(tǒng)的角度,對DCT域的視覺冗余進行了分析并提出算法進行過濾相關冗余系數(shù),優(yōu)化了編碼的視頻圖像質量。
[Abstract]:With the development of the information age, high definition video is becoming more and more popular. Video coding technology is becoming more and more important..H.264/AVC is the video coding standard combined by two international organizations of VCEG and MPEG. It is also one of the most popular video standards at present. The advanced coding technology makes the coding efficiency more than twice as much as the previous standard. At the same time, it also brings a lot of complex coding operations. Therefore, it is of great practical significance to optimize the performance of the H.264/AVC video coding algorithm and reduce the complexity of the low coding in the premise of guaranteeing the quality of the coding. Based on the coding algorithm of the DCT domain in the H.264/AVC standard, the main research work is done in the following aspects: (1) the optimal total zero is extracted from the 4 x 4 integer discrete cosine transform (DCT) after the motion compensation and a large number of zero quantization coefficients (ZQDCT) after the quantization process. On the basis of block decision threshold, combining the Gauss distribution model and the "Z" distribution characteristic of DCT coefficient energy, a zero quantizing coefficient classification algorithm based on the new threshold is proposed. The ZQDCT is prejudged by the hierarchical mode before the DCT transformation of the residual block, and the transform quantization operation is skipped. The experimental results show that the algorithm is compared with the standard algorithm. It reduces the amount of coded data, and reduces the maximum 42% of discrete cosine transform (DCT), quantization (Q), inverse quantization (IQ) and discrete cosine inverse transform (IDCT) process computing time. (2) the exact perceptible distortion (JND) model based on the DCT domain is applied to the H.264 standard algorithm based on the characteristics of the human visual system. The human eye is a video map. The final receiver of the image is more sensitive to the low frequency component of the DCT coefficient, and the high frequency part may contain more visual redundancy.JND to represent the maximum image distortion that the human eye can't detect. It reflects the unperceived visual redundancy information in the image. The algorithm calculates the corresponding JND threshold based on the different 4 x 4 DCT transform blocks. Value, filtering the DCT coefficients after each transformation, in which the DCT coefficients with smaller corresponding positions than the JND threshold are abandoned directly, thus the subjective visual redundancy in the video image is removed. At the same time, the corresponding DCT coefficients skip their quantization and other operations to save the computation. The experimental simulation results show that the JND model can save the code rate and same code rate. It does not affect the quality of video image, and has good effect on visual redundancy optimization in video coding. Through the study of DCT transformation and quantization in the H.264 standard, the ZQDCT coefficient is prejudged in advance and skipped the coding of the DCT part by the hierarchical prejudgement algorithm, and the computation is saved. In addition, the human visual system is also obtained. From the point of view of the system, the visual redundancy in the DCT domain is analyzed, and the algorithm is proposed to filter the related redundancy coefficient and optimize the quality of the encoded video image.
【學位授予單位】:江西理工大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN919.81
【相似文獻】
相關期刊論文 前10條
1 Patrick Neeley;;從擁有數(shù)據,到預判需求 這就是大數(shù)據的威力[J];英才;2013年05期
2 周麗峰;;新聞預判:避免同質化的“孫子兵法”[J];新聞戰(zhàn)線;2010年11期
3 韓松;;在國際背景下預判兩會熱點[J];中國記者;2011年03期
4 Patrick Neeley;;從擁有數(shù)據,到預判需求 這就是大數(shù)據的威力。[J];中國經濟和信息化;2012年24期
5 ;2014年廣電六大發(fā)展趨勢預判[J];電視工程;2014年01期
6 胡家耀;;競爭情報運作過程全剖析[J];中國畜牧業(yè);2013年24期
7 林洪相;;典型的發(fā)現(xiàn)和預判[J];中國報業(yè);2013年14期
8 鄭巖;;對大學生山難報道的反思[J];當代傳播;2013年01期
9 劉海鵬;;預判新聞 生產思想 提升報媒競爭力——從《齊魯晚報》國慶報道談新聞預判手段的運用[J];青年記者;2010年03期
10 曲雅鑠;張旭升;;跟蹤采訪要做好“四手準備”[J];新聞傳播;2007年01期
相關會議論文 前1條
1 金亞虹;陳新;;先兆信息對短角球運動模式識別和防守預判績效的影響[A];第九屆全國體育科學大會論文摘要匯編(2)[C];2011年
相關重要報紙文章 前10條
1 記者 周武英;機構對今年全球經濟預判略有分歧[N];經濟參考報;2014年
2 記者 汪曼莉;預判:下半年我省經濟繼續(xù)回升向好[N];陜西日報;2014年
3 馬薪婷;選擇性相信基金四季度預判[N];證券日報;2012年
4 劉毅 王治梅;早預判 強管理 快轉型[N];中國城鄉(xiāng)金融報;2013年
5 十一屆全國政協(xié)經濟委員會副主任 國家能源委員會專家咨詢委員會主任 張國寶 本報記者 肖薔 整理;全球能源走勢的三點預判[N];中國能源報;2013年
6 中國出版?zhèn)髅缴虉笥浾?劉志偉;引進版權 作者潛力如何預判[N];中國出版?zhèn)髅缴虉?2013年
7 本報記者 曹淑彥;多數(shù)基金預判經濟弱復蘇[N];中國證券報;2013年
8 本報記者 洪蕾;保險業(yè)大數(shù)據:從風險預判到風險解釋[N];中國電腦教育報;2013年
9 本報記者 肖紅;讓行業(yè)預判引領市政基礎設施建設[N];中國建設報;2006年
10 本報記者 張曉敏 本報通訊員 戴偉東;天津二中院 預判預防抓“小”防“早”[N];人民法院報;2011年
相關碩士學位論文 前8條
1 溫子星;預測性姿勢調節(jié)對人體站立受擾后姿勢響應影響的研究[D];上海體育學院;2016年
2 周莉莉;模擬預判訓練對網球專項學生接發(fā)球預判能力的影響[D];北京體育大學;2016年
3 趙文剛;乒乓球專項大學生發(fā)球預判的眼動特征研究[D];成都體育學院;2016年
4 曾鵬程;基于DCT域的系數(shù)分級預判與視覺優(yōu)化算法研究[D];江西理工大學;2015年
5 孫琳娜;案卷移送與法官預判之防止[D];蘇州大學;2014年
6 郭明濤;不同水平女排運動員在預判任務中視覺搜索特征的研究[D];上海體育學院;2010年
7 袁向躍;不同實驗材料下男子網球運動員接發(fā)球預判的眼動研究[D];天津體育學院;2012年
8 姚遠;碰撞預判系統(tǒng)中車輛的圖像雷達聯(lián)合識別方法[D];清華大學;2013年
,本文編號:1828563
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/1828563.html