三維視頻壓縮、傳輸、渲染相關(guān)技術(shù)的研究
本文關(guān)鍵詞:三維視頻壓縮、傳輸、渲染相關(guān)技術(shù)的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:作為計(jì)算機(jī)視覺、圖形學(xué)以及多媒體技術(shù)的一種融合,三維視頻技術(shù)正在快速發(fā)展并被廣泛應(yīng)用。不同于傳統(tǒng)的計(jì)算機(jī)圖形學(xué)技術(shù),三維視頻提供給人們的三維視覺體驗(yàn)是基于采集到真實(shí)世界的視頻信號(hào),并通過視角合成和渲染等技術(shù)達(dá)到的。近幾年,隨著傳感器技術(shù)等相關(guān)領(lǐng)域的發(fā)展,三維視頻處理技術(shù)得到了快速的發(fā)展,越來越多的視頻渲染方法被設(shè)計(jì)出來以提高三維視覺體驗(yàn)。本論文針對(duì)基于圖像渲染框架的三維視頻、深度信息的處理、壓縮和渲染等問題做出了相關(guān)研究。由于深度信息被廣泛應(yīng)用于三維視頻渲染中,越來越多深度傳感器被設(shè)計(jì)出來以更低的成本和更高的精度來采集深度信息。Kinect作為一種低成本深度傳感器便被廣泛應(yīng)用于三維視頻渲染中。因此,本論文首先提出了一種Kinect深度信息的修復(fù)算法,修復(fù)Kinect深度圖像中缺失的信息,抑制圖像中的失真和噪聲,提高Kinect深度圖像的質(zhì)量,進(jìn)而提高相應(yīng)后續(xù)處理的性能。在許多應(yīng)用場(chǎng)景中,深度信息和紋理信息需要傳輸?shù)竭h(yuǎn)端進(jìn)行處理,如何提高深度信息的壓縮性能,直接影響著整個(gè)系統(tǒng)的性能。本論文針對(duì)Kinect深度信息特殊的數(shù)據(jù)性質(zhì),設(shè)計(jì)了一個(gè)Kinect深度視頻壓縮算法來有效的進(jìn)行數(shù)據(jù)壓縮。我們首先設(shè)計(jì)了自適應(yīng)的雙邊濾波器來去除Kinect深度圖像中的噪聲,修復(fù)因?yàn)樵肼暥黄茐牡臄?shù)據(jù)相關(guān)性。在傳統(tǒng)的視頻編碼之前,我們引入2D+T預(yù)測(cè)模塊來去除數(shù)據(jù)在時(shí)間域上的冗余。我們利用生成的三維物體表面參考圖像來區(qū)分動(dòng)態(tài)區(qū)域和靜態(tài)區(qū)域。其中動(dòng)態(tài)區(qū)域利用傳統(tǒng)編碼器進(jìn)行壓縮,而靜態(tài)區(qū)域則跳過壓縮,在解碼端利用三維參考平面恢復(fù)重建。考慮到高動(dòng)態(tài)深度信息正在替代傳統(tǒng)的8比特深度信息,被廣泛的應(yīng)用于許多三維視頻處理中,在本論文中,我們針對(duì)高動(dòng)態(tài)范圍的深度圖像和視頻設(shè)計(jì)了一種基于分層的編碼壓縮算法。在該算法中,高動(dòng)態(tài)范圍的深度圖像在位深度平面上被分為高數(shù)據(jù)位層和低數(shù)據(jù)位層。其中,高數(shù)據(jù)位層深度圖像代表了深度信息的大致變化規(guī)律,具有突出的邊緣,因此,我們?cè)O(shè)計(jì)了像素域的編碼方法來壓縮本層信息。低數(shù)據(jù)位層深度圖像包含深度信息的細(xì)微變化,我們利用傳統(tǒng)的基于變換的壓縮算法來進(jìn)行壓縮。低層數(shù)據(jù)的動(dòng)態(tài)范圍保證在8比特內(nèi),現(xiàn)有的圖像和視頻編碼器均可被集成進(jìn)來。作為三維視頻的一種流行方式,任意視角視頻被廣泛的使用。人們希望在移動(dòng)終端上觀看三維視頻。但是,由于實(shí)時(shí)傳輸和渲染多路紋理視頻和深度視頻對(duì)于帶寬和計(jì)算資源的要求是無(wú)線信道和移動(dòng)設(shè)備所無(wú)法承受的。因此,為了實(shí)現(xiàn)在移動(dòng)端觀看三維視頻,我們提出了基于云計(jì)算框架的移動(dòng)端任意視角視頻渲染框架。在該框架中,我們根據(jù)用戶的請(qǐng)求,在云端合成新視角的視頻,并傳輸?shù)揭苿?dòng)端。為了降低系統(tǒng)的交互延時(shí),提高視頻質(zhì)量,我們提出了渲染分配和碼率分配算法來進(jìn)一步優(yōu)化用戶的觀看體驗(yàn)。
【關(guān)鍵詞】:三維視頻 深度傳感器 深度圖像修復(fù) 深度信息壓縮 任意視角視頻渲染
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.41
【目錄】:
- 摘要5-7
- ABSTRACT7-18
- 第一章 緒論18-24
- 1.1 研究背景18-21
- 1.2 研究工作概述21-23
- 1.3 內(nèi)容組織23-24
- 第二章 Kinect深度圖像的修復(fù)24-38
- 2.1 Kinect深度圖像的生成原理25-26
- 2.2 Kinect深度圖像的數(shù)據(jù)特征26-28
- 2.3 深度圖像的修復(fù)28-35
- 2.3.1 相關(guān)工作及背景介紹28-30
- 2.3.2 深度圖像的劃分30-31
- 2.3.3 平滑區(qū)域的修復(fù)31-33
- 2.3.4 邊緣區(qū)域的修復(fù)33-34
- 2.3.5 實(shí)驗(yàn)結(jié)果34-35
- 2.4 本章總結(jié)35-37
- 2.5 未來工作37-38
- 第三章 基于2D+T預(yù)測(cè)的Kinect深度序列的壓縮38-58
- 3.1 相關(guān)工作38-41
- 3.1.1 基于點(diǎn)云數(shù)據(jù)形式的深度圖像壓縮38-40
- 3.1.2 基于圖像數(shù)據(jù)形式的深度圖像壓縮40-41
- 3.2 Kinect深度圖像的誤差模型41-42
- 3.3 Kinect深度序列壓縮算法框架42-43
- 3.4 Kinect深度圖像的改進(jìn)43-47
- 3.4.1 自適應(yīng)雙邊濾波43-46
- 3.4.2 像素填補(bǔ)46-47
- 3.5 2D+T預(yù)測(cè)算法47-51
- 3.5.1 2D+T預(yù)測(cè)參考幀的生成47-50
- 3.5.2 視頻編碼中的2D+T預(yù)測(cè)50-51
- 3.6 實(shí)驗(yàn)結(jié)果51-57
- 3.6.1 編碼性能和編碼復(fù)雜度52-56
- 3.6.2 3D重建性能比較56-57
- 3.7 本章小結(jié)57-58
- 第四章 高動(dòng)態(tài)范圍深度圖像和序列的壓縮58-84
- 4.1 相關(guān)工作58-59
- 4.2 數(shù)據(jù)特征分析59-61
- 4.3 算法框架61-63
- 4.4 分層壓縮算法63-68
- 4.4.1 MSB層壓縮算法63-67
- 4.4.2 LSB層壓縮算法67-68
- 4.5 編碼性能優(yōu)化68-73
- 4.6 實(shí)驗(yàn)結(jié)果73-83
- 4.6.1 MSB層量化性能74-75
- 4.6.2 整體編碼性能75-82
- 4.6.3 識(shí)別性能82-83
- 4.7 本章總結(jié)83-84
- 第五章 移動(dòng)終端低延時(shí)高質(zhì)量任意視角視頻的合成84-100
- 5.1 相關(guān)工作84-85
- 5.2 算法框架85-86
- 5.3 渲染分配86-92
- 5.3.1 視角切換時(shí)延87-88
- 5.3.2 3D warping算法88-90
- 5.3.3 參考視角選擇90-92
- 5.4 碼率分配92-95
- 5.4.1 問題描述92-93
- 5.4.2 率失真模型93-94
- 5.4.3 碼率分配算法94-95
- 5.5 實(shí)驗(yàn)結(jié)果95-98
- 5.6 本章總結(jié)98-100
- 第六章 論文總結(jié)及工作展望100-102
- 參考文獻(xiàn)102-110
- 致謝110-112
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果112-114
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 趙翠蓮;施曉磊;榮堅(jiān);范志堅(jiān);;基于坐標(biāo)軸投影勘察的深度圖像樹型分割[J];光學(xué)精密工程;2011年06期
2 許小艷;廖曉峰;劉然;易琳;張小云;;基于深度圖像繪制的視圖合成[J];系統(tǒng)仿真學(xué)報(bào);2011年10期
3 江文婷;龔小謹(jǐn);劉濟(jì)林;;顏色指導(dǎo)的深度圖像升采樣算法的對(duì)比性研究[J];杭州電子科技大學(xué)學(xué)報(bào);2014年01期
4 張濤,平西建,柳葆芳,邵美珍;一種深度圖像中的表面曲率估計(jì)算法[J];數(shù)據(jù)采集與處理;2001年01期
5 謝凱,湯曉安,郝建新,蔡宣平;一種基于多幅深度圖像的混合建模方法[J];小型微型計(jì)算機(jī)系統(tǒng);2003年01期
6 婁嘉鵬,李德華,吳險(xiǎn)峰,薛雷;深度圖像的平滑[J];計(jì)算機(jī)與數(shù)字工程;2003年01期
7 代明睿;張曉鵬;李紅軍;;基于高噪聲深度圖像的樹木模型重建[J];中國(guó)體視學(xué)與圖像分析;2010年02期
8 杜霄鵬;郝建平;李星新;楊俊;;基于單一深度圖像的人體姿態(tài)實(shí)時(shí)識(shí)別技術(shù)研究[J];計(jì)算機(jī)與現(xiàn)代化;2012年04期
9 羅莎莎;郭太良;;一種二維圖像序列的深度圖像生成方法[J];計(jì)算機(jī)與現(xiàn)代化;2012年05期
10 林鵬;張超;李竹良;趙宇明;;基于深度圖像學(xué)習(xí)的人體部位識(shí)別[J];計(jì)算機(jī)工程;2012年16期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 孫曉蘭;趙惠潔;祝世平;;基于深度圖像的邊緣檢測(cè)方法研究[A];2004全國(guó)光學(xué)與光電子學(xué)學(xué)術(shù)研討會(huì)、2005全國(guó)光學(xué)與光電子學(xué)學(xué)術(shù)研討會(huì)、廣西光學(xué)學(xué)會(huì)成立20周年年會(huì)論文集[C];2005年
2 徐秀英;劉卓;王博亮;;一種基于三角函數(shù)的深度圖像曲面擬合方法[A];第十二屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2005年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 深圳商報(bào)記者 徐明天 實(shí)習(xí)生 桂馨;電視機(jī)可借助電力線上網(wǎng)[N];深圳商報(bào);2010年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 苗丹;三維視頻壓縮、傳輸、渲染相關(guān)技術(shù)的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2015年
2 李世飛;基于深度圖像的三維目標(biāo)識(shí)別技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
3 丁雅斌;隱式表達(dá)三維模型流水線的關(guān)鍵技術(shù)研究[D];天津大學(xué);2007年
4 許小艷;多視點(diǎn)視頻中的視圖合成[D];重慶大學(xué);2011年
5 丁益洪;立體足跡三維曲面分割與識(shí)別[D];解放軍信息工程大學(xué);2005年
6 譚筠;結(jié)構(gòu)化環(huán)境下基于信息融合的道路場(chǎng)景感知技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 楊艷;基于深度圖像的三維重建方法研究[D];北京建筑大學(xué);2015年
2 王國(guó)強(qiáng);基于深度圖像的人體部位識(shí)別及動(dòng)作識(shí)別[D];華南理工大學(xué);2015年
3 龐云沖;基于機(jī)器學(xué)習(xí)思想的深度圖像遮擋邊界檢測(cè)方法研究[D];燕山大學(xué);2015年
4 張博文;基于深度圖的駕駛員頭部姿態(tài)分析[D];大連海事大學(xué);2015年
5 張?jiān)汽?基于深度圖像的玉米品種識(shí)別研究[D];河北農(nóng)業(yè)大學(xué);2015年
6 斯曉華;高效低復(fù)雜度三維視頻編碼技術(shù)研究[D];上海大學(xué);2015年
7 楊炳偉;基于深度圖像的三維重建研究[D];北京建筑大學(xué);2015年
8 崔穎;基于Kinect的人群識(shí)別與跟蹤系統(tǒng)[D];復(fù)旦大學(xué);2013年
9 羅浩;RGB-D視覺內(nèi)容理解及其應(yīng)用[D];華北電力大學(xué);2015年
10 周穎;深度圖像的獲取及其處理[D];西安電子科技大學(xué);2008年
本文關(guān)鍵詞:三維視頻壓縮、傳輸、渲染相關(guān)技術(shù)的研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):255718
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/255718.html