基于內容分析的圖像視頻編碼研究

發(fā)布時間：2018-08-30 18:38

【摘要】：數字圖像視頻的壓縮技術已經研究超過二十年,并取得了巨大的成功。然而,多年的開發(fā)使得以“預測-變換”為主的傳統(tǒng)編碼框架越來越接近其性能極限。我們有必要從新的角度分析并理解數字圖像視覺內容,開發(fā)新的編碼壓縮方法。最近十年中,計算機視覺領域的快速發(fā)展啟發(fā)我們可以從視覺內容分析出發(fā),發(fā)掘圖像的視覺相關性,改進圖像視頻編碼性能。在本論文中,我們重點研究視覺內容分析技術與圖像視頻編碼技術的結合,借助視覺內容分析技術對圖像間視覺相關性進行分析,消除圖像和視頻中不同層面的視覺冗余,從而提高圖像視頻的編碼效率。本論文的主要貢獻可以總結為三個部分的工作。在第一部分工作中,我們提出了一種基于視覺模式分析的圖像編碼方法。該方法通過先驗視覺模式描述圖像低頻和高頻之間的視覺相關性,并由此自適應地在編碼端丟棄圖像中的某些高頻視覺冗余,改善編碼性能。同時在解碼端,根據視覺模式包含的先驗信息估計并恢復丟失的高頻細節(jié),改善圖像重建質量。此外,我們進一步地將基于視覺模式的分析技術擴展至可伸縮視頻編碼應用,提出了一種新的基于視覺模式分析的層間預測方法。該方法借助視覺模式的搜索和映射,同時發(fā)掘可伸縮視頻序列在時域和空域的視覺相關性,分別生成兩個高質量的層間預測信號,改善可伸縮視頻編碼性能。此外,我們還采用了基于參數分析的預測方法,通過分析基本層已編碼的信息(比如HEVC編碼中的四叉樹信息)來實現復雜度較低的層間預測。我們的方法通過結合多種內容分析機制,同時提供了多環(huán)路和單環(huán)路的系統(tǒng)實現,在編碼性能和復雜度之間取得更好的平衡。在第二部分的工作中,我們提出了一種基于圖像特征的高效圖像編碼方法。該方法通過圖像局部特征匹配建立起更緊密的圖像局部視覺聯系,再配合像素層面的相關性分析,更有效地消除視覺冗余。具體地說,我們利用多尺度小波變換和SIFT特征提取,首先將輸入圖像分解為全局信息和子帶內局部信息,并進行編碼壓縮。全局信息是對輸入圖像的基本描述,包含有限的視覺冗余；而子帶內局部信息則是從不同的小波子帶中提取的SIFT局部特征。在解碼端,我們利用解碼的SIFT特征從云端圖像數據庫中,檢索出一組視覺相似的圖像片。然后,結合基于視覺模式的分析和映射,將這些相似圖像片中的信息與解碼的全局信息融合起來,重建目標圖像。根據子帶內SIFT特征建立的視覺聯系,我們利用基于視覺模式的映射從最低頻的子帶開始,由低頻至高頻,依次將視覺相似圖像片內的信息融合進入對應的子帶,恢復圖像不同頻帶內的局部細節(jié),直到圖像完整重建。我們的方法通過結合局部特征分析技術和視覺模式分析的優(yōu)點,取得更高效的圖像編碼性能。在第三部分的工作中,我們提出一種基于圖像特征全局相似度分析的圖像集整體優(yōu)化編碼方法。根據圖像局部特征的整體統(tǒng)計特性,我們定義特征距離來分析圖像與圖像間的全局相似度。在此基礎上,我們將圖像集聚類為若干個相關性更強的子集,并將每個子集中圖像間的關系描述為一個加權有向圖。圖中每個節(jié)點代表一幅圖像,每一條邊由特征距離加權。通過尋找該有向圖的最小權值生成樹,可以得到具有最小預測代價的優(yōu)化編碼結構。為了進一步增強圖與圖之間的相關性,我們提出了一種全新的基于特征的圖像間三步預測方法。首先,我們利用SIFT特征匹配和多模型幾何運動估計,消除不同區(qū)域的幾何形變。其次,我們引入光度變換消除圖像間由于光照變化帶來的差異。最后,我們利用基于塊的運動補償機制生成局部優(yōu)化的預測信號。我們提出的基于圖像特征的方法充分利用多種內容分析技術的優(yōu)點�；谔卣鞯娜址治黾夹g有效地確定了優(yōu)化編碼結構；基于局部特征匹配的圖像變換增強了圖像與圖像間的區(qū)域相關性；基于像素的運動補償生成了更精確的預測信號。因此,我們的方法有效地發(fā)掘了相關圖像間的視覺冗余,提高了圖像集整體編碼的效率,同時為進一步研究大數據和云存儲環(huán)境中的大尺度圖像視頻編碼提供了新的思路。
[Abstract]:Digital image and video compression technology has been studied for more than 20 years and has achieved great success. However, many years of development have made the traditional coding framework based on "prediction-transformation" approach its performance limit more and more. The rapid development of computer vision in the last decade has inspired us to explore the visual correlation of images and improve the performance of image video coding based on visual content analysis.
In this paper, we focus on the combination of visual content analysis technology and image video coding technology. We use visual content analysis technology to analyze the visual correlation between images, eliminate visual redundancy at different levels in images and videos, so as to improve the coding efficiency of images and videos. Part of the work.
In the first part of our work, we propose an image coding method based on visual pattern analysis. This method describes the visual correlation between low and high frequencies of an image by a priori visual pattern, and thus adaptively discards some high frequency visual redundancy in the image at the coding end to improve the coding performance. In addition, we extend the analysis technique based on visual pattern to the application of scalable video coding, and propose a novel inter-layer prediction method based on visual pattern analysis. By mapping, the visual correlation of scalable video sequences in time domain and space domain is explored, and two high-quality inter-layer predictive signals are generated to improve the performance of scalable video coding. Our approach achieves a better balance between coding performance and complexity by combining multiple content analysis mechanisms and providing a multi-loop and single-loop system implementation.
In the second part of the work, we propose an efficient image coding method based on image features. This method establishes a closer local visual relationship through image local feature matching, and then combines the correlation analysis of pixel level to eliminate visual redundancy more effectively. Specifically, we use multi-scale wavelet transform. In SIFT feature extraction, the input image is decomposed into global information and local information in sub-band, and then encoded and compressed. SIFT features are used to retrieve a set of image slices with similar vision from cloud image database. Then, combined with the analysis and mapping based on visual pattern, the information in these similar image slices is fused with the decoded global information to reconstruct the target image. This method combines the advantages of local feature analysis and visual pattern analysis to achieve higher efficiency. Image coding performance.
In the third part, we propose an image set global optimization coding method based on global similarity analysis of image features. According to the global statistical characteristics of local features, we define feature distance to analyze the global similarity between images. On this basis, we cluster image sets into several correlations. Each node in the graph represents an image and each edge is weighted by the feature distance. By searching for the minimum weight spanning tree of the directed graph, the optimal coding structure with the minimum prediction cost can be obtained. In order to further enhance the graph and the graph. Firstly, we use SIFT feature matching and multi-model geometric motion estimation to eliminate geometric deformation in different regions. Secondly, we introduce photometric transformation to eliminate the difference between images caused by illumination changes. Motion compensation mechanism generates locally optimized predictive signals. The proposed image feature-based method makes full use of the advantages of various content analysis techniques. Feature-based global analysis techniques effectively determine the optimal coding structure; and image transformation based on local feature matching enhances the regional correlation between images and images. Therefore, our method effectively exploits the visual redundancy between related images, improves the overall coding efficiency of the image set, and provides a new idea for further research on large-scale image video coding in large data and cloud storage environment.
【學位授予單位】：中國科學技術大學
【學位級別】：博士
【學位授予年份】：2014
【分類號】：TN919.81

【相似文獻】

相關期刊論文前10條

1 汪濱,王有德;擴散泵振動對SEM的影響與消除振動[J];真空科學與技術;1990年01期

2 王俊一,王乘,孫濤;小波變換閾值選取的博弈與圖像邊緣點檢測[J];微機發(fā)展;2005年04期

3 李東旭;;Delphi實現圖像邊緣檢測[J];電腦編程技巧與維護;2009年S1期

4 周顥,戚飛虎;一種新的圖像邊緣檢測算法[J];計算機工程;2003年18期

5 周舒;;基于數學形態(tài)學的圖像邊緣檢測研究[J];科教文匯(上旬刊);2008年08期

6 曾友州;胡瑩;曾偉一;鄭曉霞;;提取數字圖像邊緣的算法比較[J];成都航空職業(yè)技術學院學報;2009年04期

7 黃炯;圖像邊緣處理[J];電視字幕.特技與動畫;2000年09期

8 張玉明,許曼;B超圖像邊緣增強技術的實現方法[J];電子技術;1997年09期

9 劉剛;韓建棟;;一種新的基于梯度的2*圖像插值算法[J];紅外技術;2006年06期

10 胡德明;;一種基于模糊梯度算法的圖像邊緣檢測方法[J];武漢理工大學學報(信息與管理工程版);2006年07期

相關會議論文前10條

1 黃曉山;;數字圖像處理及其在醫(yī)學上的應用[A];2009年浙江省醫(yī)學工程學術年會論文匯編[C];2009年

2 薛玉涵;錢亮;鞠浩;;基于模糊噪聲配套圖像的去運動模糊方法[A];全國第三屆信號和智能信息處理與應用學術交流會�？痆C];2009年

3 陳春寧;田睿;王毅楠;;基于色差插值的BAYER格式圖像色彩復原實現[A];第九屆全國信息獲取與處理學術會議論文集Ⅰ[C];2011年

4 羅強;任慶利;;基于局部IFS理論提取圖像邊緣[A];第十二屆全國圖象圖形學學術會議論文集[C];2005年

5 徐慶偉;劉洲峰;李春雷;;一種基于小波變換的圖像邊緣檢測算法[A];第十四屆全國圖象圖形學學術會議論文集[C];2008年

6 蔣奇;高瑞;王雷;;管道漏磁場影響因素的研究[A];2005中國控制與決策學術年會論文集（下）[C];2005年

7 陸成剛;陳剛;張但;閔春燕;;圖像邊緣的優(yōu)化模型[A];'2002系統(tǒng)仿真技術及其應用學術論文集（第四卷）[C];2002年

8 盧漢明;高德俊;;基于多尺度變換相結合的圖像增強算法[A];第二屆“測繪科學前沿技術論壇”論文精選[C];2010年

9 項昱暉;江開勇;夏濤;;基于動態(tài)域值的鞋幫圖像邊緣提取方法[A];2005年中國機械工程學會年會第11屆全國特種加工學術會議專輯[C];2005年

10 項昱暉;江開勇;夏濤;;基于動態(tài)域值的鞋幫圖像邊緣提取方法[A];2005年中國機械工程學會年會論文集第11屆全國特種加工學術會議專輯[C];2005年

相關重要報紙文章前10條

1 ;B超術語解釋[N];農村醫(yī)藥報（漢）;2008年

2 ;用三星數碼DigimaxMaster軟件處理照片[N];科技日報;2007年

3 陜西瞿貴榮;彩電特殊故障檢修五例[N];電子報;2007年

4 于亮、阿鯤;技術“掃”天下[N];中國計算機報;2002年

5 晶瑩;三星新推精細大屏等離子顯示器[N];中國質量報;2005年

6 馬駿睿皓月;制作版畫效果圖片[N];中國攝影報;2007年

7 ;天敏隨心錄電視盒[N];中國電腦教育報;2004年

8 ;體驗決定一切[N];中國計算機報;2003年

9 秦風;S9500——務實者的選擇[N];中國攝影報;2006年

10 芝麻糊;掃描的一些相關技術 (1)[N];中國電腦教育報;2002年

相關博士學位論文前10條

1 韓永華;農田圖像的統(tǒng)計迭代分割方法研究[D];浙江大學;2011年

2 陳少波;SAR圖像相干斑抑制算法研究[D];華中科技大學;2010年

3 陳玫玫;手指靜脈圖像的去噪與分割算法研究[D];吉林大學;2010年

4 陳國忠;SAR圖像紋斑噪聲抑制算法研究[D];上海交通大學;2008年

5 康文煒;冠狀動脈造影圖像的分割方法研究[D];吉林大學;2010年

6 邢坤;基于可見光遙感圖像的典型目標識別關鍵技術研究及其系統(tǒng)實現[D];哈爾濱工業(yè)大學;2010年

7 邢坤;基于可見光遙感圖像的典型目標識別關鍵技術研究及其系統(tǒng)實現[D];哈爾濱工業(yè)大學;2010年

8 李小兵;MRI圖像腦腫瘤分割與EEG腦癲癇檢測的研究[D];大連理工大學;2010年

9 王繼陽;基于高分辨率航空遙感立體圖像的建筑物三維重建技術研究[D];國防科學技術大學;2009年

10 閆子飛;面向中醫(yī)舌診的舌下靜脈特征獲取與分析[D];哈爾濱工業(yè)大學;2010年

相關碩士學位論文前10條

1 王珊;X射線冠脈造影圖像的血管分割方法研究[D];蘭州大學;2012年

2 高星星;基于稀疏分解的SAR圖像抑制斑點噪聲算法的研究[D];天津理工大學;2011年

3 陳益新;基于DM6467的工件表面質量圖像高速采集與處理技術研究[D];杭州電子科技大學;2012年

4 李富城;多極化SAR圖像地物分類技術研究[D];解放軍信息工程大學;2009年

5 關輝;基于Directionlet變換的SAR圖像噪聲抑制及邊緣檢測[D];西安電子科技大學;2010年

6 陳國強;準雙曲面齒輪接觸圖像齒形輪廓和接觸斑點的二維重構[D];河南理工大學;2010年

7 滕揚;基于改進的BP神經網絡肺部CT圖像的結節(jié)識別[D];吉林大學;2011年

8 李動節(jié);嵌入式圖像壓縮編解碼研究[D];鄭州大學;2011年

9 王百超;圖像PDE濾波和盲恢復技術的理論研究及其在IVUS圖像處理中的應用[D];山東大學;2011年

10 鎖艷;基于分水嶺的SAR溢油圖像快速分割算法研究[D];大連海事大學;2012年

，

本文編號：2213954

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/wltx/2213954.html

上一篇：FMT-TDMA衛(wèi)星通信體制關鍵技術研究
下一篇：基于置信傳播的WSN節(jié)點定位方法研究

論文發(fā)表

·知網|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于內容分析的圖像視頻編碼研究