基于內容分析的圖像視頻編碼研究
[Abstract]:Digital image and video compression technology has been studied for more than 20 years and has achieved great success. However, many years of development have made the traditional coding framework based on "prediction-transformation" approach its performance limit more and more. The rapid development of computer vision in the last decade has inspired us to explore the visual correlation of images and improve the performance of image video coding based on visual content analysis.
In this paper, we focus on the combination of visual content analysis technology and image video coding technology. We use visual content analysis technology to analyze the visual correlation between images, eliminate visual redundancy at different levels in images and videos, so as to improve the coding efficiency of images and videos. Part of the work.
In the first part of our work, we propose an image coding method based on visual pattern analysis. This method describes the visual correlation between low and high frequencies of an image by a priori visual pattern, and thus adaptively discards some high frequency visual redundancy in the image at the coding end to improve the coding performance. In addition, we extend the analysis technique based on visual pattern to the application of scalable video coding, and propose a novel inter-layer prediction method based on visual pattern analysis. By mapping, the visual correlation of scalable video sequences in time domain and space domain is explored, and two high-quality inter-layer predictive signals are generated to improve the performance of scalable video coding. Our approach achieves a better balance between coding performance and complexity by combining multiple content analysis mechanisms and providing a multi-loop and single-loop system implementation.
In the second part of the work, we propose an efficient image coding method based on image features. This method establishes a closer local visual relationship through image local feature matching, and then combines the correlation analysis of pixel level to eliminate visual redundancy more effectively. Specifically, we use multi-scale wavelet transform. In SIFT feature extraction, the input image is decomposed into global information and local information in sub-band, and then encoded and compressed. SIFT features are used to retrieve a set of image slices with similar vision from cloud image database. Then, combined with the analysis and mapping based on visual pattern, the information in these similar image slices is fused with the decoded global information to reconstruct the target image. This method combines the advantages of local feature analysis and visual pattern analysis to achieve higher efficiency. Image coding performance.
In the third part, we propose an image set global optimization coding method based on global similarity analysis of image features. According to the global statistical characteristics of local features, we define feature distance to analyze the global similarity between images. On this basis, we cluster image sets into several correlations. Each node in the graph represents an image and each edge is weighted by the feature distance. By searching for the minimum weight spanning tree of the directed graph, the optimal coding structure with the minimum prediction cost can be obtained. In order to further enhance the graph and the graph. Firstly, we use SIFT feature matching and multi-model geometric motion estimation to eliminate geometric deformation in different regions. Secondly, we introduce photometric transformation to eliminate the difference between images caused by illumination changes. Motion compensation mechanism generates locally optimized predictive signals. The proposed image feature-based method makes full use of the advantages of various content analysis techniques. Feature-based global analysis techniques effectively determine the optimal coding structure; and image transformation based on local feature matching enhances the regional correlation between images and images. Therefore, our method effectively exploits the visual redundancy between related images, improves the overall coding efficiency of the image set, and provides a new idea for further research on large-scale image video coding in large data and cloud storage environment.
【學位授予單位】:中國科學技術大學
【學位級別】:博士
【學位授予年份】:2014
【分類號】:TN919.81
【相似文獻】
相關期刊論文 前10條
1 汪濱,王有德;擴散泵振動對SEM的影響與消除振動[J];真空科學與技術;1990年01期
2 王俊一,王乘,孫濤;小波變換閾值選取的博弈與圖像邊緣點檢測[J];微機發(fā)展;2005年04期
3 李東旭;;Delphi實現圖像邊緣檢測[J];電腦編程技巧與維護;2009年S1期
4 周顥,戚飛虎;一種新的圖像邊緣檢測算法[J];計算機工程;2003年18期
5 周舒;;基于數學形態(tài)學的圖像邊緣檢測研究[J];科教文匯(上旬刊);2008年08期
6 曾友州;胡瑩;曾偉一;鄭曉霞;;提取數字圖像邊緣的算法比較[J];成都航空職業(yè)技術學院學報;2009年04期
7 黃炯;圖像邊緣處理[J];電視字幕.特技與動畫;2000年09期
8 張玉明,許曼;B超圖像邊緣增強技術的實現方法[J];電子技術;1997年09期
9 劉剛;韓建棟;;一種新的基于梯度的2*圖像插值算法[J];紅外技術;2006年06期
10 胡德明;;一種基于模糊梯度算法的圖像邊緣檢測方法[J];武漢理工大學學報(信息與管理工程版);2006年07期
相關會議論文 前10條
1 黃曉山;;數字圖像處理及其在醫(yī)學上的應用[A];2009年浙江省醫(yī)學工程學術年會論文匯編[C];2009年
2 薛玉涵;錢亮;鞠浩;;基于模糊噪聲配套圖像的去運動模糊方法[A];全國第三屆信號和智能信息處理與應用學術交流會?痆C];2009年
3 陳春寧;田睿;王毅楠;;基于色差插值的BAYER格式圖像色彩復原實現[A];第九屆全國信息獲取與處理學術會議論文集Ⅰ[C];2011年
4 羅強;任慶利;;基于局部IFS理論提取圖像邊緣[A];第十二屆全國圖象圖形學學術會議論文集[C];2005年
5 徐慶偉;劉洲峰;李春雷;;一種基于小波變換的圖像邊緣檢測算法[A];第十四屆全國圖象圖形學學術會議論文集[C];2008年
6 蔣奇;高瑞;王雷;;管道漏磁場影響因素的研究[A];2005中國控制與決策學術年會論文集(下)[C];2005年
7 陸成剛;陳剛;張但;閔春燕;;圖像邊緣的優(yōu)化模型[A];'2002系統(tǒng)仿真技術及其應用學術論文集(第四卷)[C];2002年
8 盧漢明;高德俊;;基于多尺度變換相結合的圖像增強算法[A];第二屆“測繪科學前沿技術論壇”論文精選[C];2010年
9 項昱暉;江開勇;夏濤;;基于動態(tài)域值的鞋幫圖像邊緣提取方法[A];2005年中國機械工程學會年會第11屆全國特種加工學術會議專輯[C];2005年
10 項昱暉;江開勇;夏濤;;基于動態(tài)域值的鞋幫圖像邊緣提取方法[A];2005年中國機械工程學會年會論文集第11屆全國特種加工學術會議專輯[C];2005年
相關重要報紙文章 前10條
1 ;B超術語解釋[N];農村醫(yī)藥報(漢);2008年
2 ;用三星數碼DigimaxMaster軟件處理照片[N];科技日報;2007年
3 陜西 瞿貴榮;彩電特殊故障檢修五例[N];電子報;2007年
4 于亮、阿鯤;技術“掃”天下[N];中國計算機報;2002年
5 晶 瑩;三星新推精細大屏等離子顯示器[N];中國質量報;2005年
6 馬駿睿 皓月;制作版畫效果圖片[N];中國攝影報;2007年
7 ;天敏隨心錄電視盒[N];中國電腦教育報;2004年
8 ;體驗決定一切[N];中國計算機報;2003年
9 秦風;S9500——務實者的選擇[N];中國攝影報;2006年
10 芝麻糊;掃描的一些相關技術 (1)[N];中國電腦教育報;2002年
相關博士學位論文 前10條
1 韓永華;農田圖像的統(tǒng)計迭代分割方法研究[D];浙江大學;2011年
2 陳少波;SAR圖像相干斑抑制算法研究[D];華中科技大學;2010年
3 陳玫玫;手指靜脈圖像的去噪與分割算法研究[D];吉林大學;2010年
4 陳國忠;SAR圖像紋斑噪聲抑制算法研究[D];上海交通大學;2008年
5 康文煒;冠狀動脈造影圖像的分割方法研究[D];吉林大學;2010年
6 邢坤;基于可見光遙感圖像的典型目標識別關鍵技術研究及其系統(tǒng)實現[D];哈爾濱工業(yè)大學;2010年
7 邢坤;基于可見光遙感圖像的典型目標識別關鍵技術研究及其系統(tǒng)實現[D];哈爾濱工業(yè)大學;2010年
8 李小兵;MRI圖像腦腫瘤分割與EEG腦癲癇檢測的研究[D];大連理工大學;2010年
9 王繼陽;基于高分辨率航空遙感立體圖像的建筑物三維重建技術研究[D];國防科學技術大學;2009年
10 閆子飛;面向中醫(yī)舌診的舌下靜脈特征獲取與分析[D];哈爾濱工業(yè)大學;2010年
相關碩士學位論文 前10條
1 王珊;X射線冠脈造影圖像的血管分割方法研究[D];蘭州大學;2012年
2 高星星;基于稀疏分解的SAR圖像抑制斑點噪聲算法的研究[D];天津理工大學;2011年
3 陳益新;基于DM6467的工件表面質量圖像高速采集與處理技術研究[D];杭州電子科技大學;2012年
4 李富城;多極化SAR圖像地物分類技術研究[D];解放軍信息工程大學;2009年
5 關輝;基于Directionlet變換的SAR圖像噪聲抑制及邊緣檢測[D];西安電子科技大學;2010年
6 陳國強;準雙曲面齒輪接觸圖像齒形輪廓和接觸斑點的二維重構[D];河南理工大學;2010年
7 滕揚;基于改進的BP神經網絡肺部CT圖像的結節(jié)識別[D];吉林大學;2011年
8 李動節(jié);嵌入式圖像壓縮編解碼研究[D];鄭州大學;2011年
9 王百超;圖像PDE濾波和盲恢復技術的理論研究及其在IVUS圖像處理中的應用[D];山東大學;2011年
10 鎖艷;基于分水嶺的SAR溢油圖像快速分割算法研究[D];大連海事大學;2012年
,本文編號:2213954
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2213954.html