面向高動(dòng)態(tài)范圍視頻的高效編碼算法研究
發(fā)布時(shí)間:2021-06-26 05:36
隨著視頻技術(shù)的發(fā)展,高動(dòng)態(tài)范圍視頻給視頻的采集、壓縮、傳輸?shù)葞砭薮筇魬?zhàn)。高動(dòng)態(tài)范圍視頻是一種新類型的視頻,已有的編碼器并未針對(duì)其特性降低編碼復(fù)雜度。同時(shí),大部分顯示器無法支持高動(dòng)態(tài)范圍視頻,因此視頻的傳輸系統(tǒng)需要提供高動(dòng)態(tài)范圍視頻和低動(dòng)態(tài)范圍版本的視頻?煞旨(jí)編碼框架可以同時(shí)編碼高動(dòng)態(tài)范圍視頻和相應(yīng)的低動(dòng)態(tài)范圍視頻,但是編碼的復(fù)雜度則增加了一倍。高動(dòng)態(tài)范圍視頻采用了新的數(shù)據(jù)格式,比特深度超過了8比特。然而,大部分視頻的色度信息極為集中,導(dǎo)致色度分量在使用碼字表示時(shí)僅使用了可用碼字的一部分。使用更多可用碼字記錄色度分量,便能更精細(xì)地用保留原始視頻的色度信息。我們對(duì)高動(dòng)態(tài)范圍視頻的壓縮技術(shù)進(jìn)行了研究,主要研究成果如下:1、在可分級(jí)框架中,提出了一種高動(dòng)態(tài)范圍視頻的快速編碼算法。首先,研究了低動(dòng)態(tài)范圍視頻和高動(dòng)態(tài)范圍視頻的生成過程及其視頻內(nèi)容的特性。然后,分析了幀內(nèi)模式編碼下高動(dòng)態(tài)范圍視頻和低動(dòng)態(tài)范圍視頻的最優(yōu)編碼單元?jiǎng)澐纸Y(jié)果之間的相關(guān)性。最終,提出了利用高動(dòng)態(tài)范圍視頻的相鄰編碼單元信息和同一位置的低動(dòng)態(tài)范圍視頻編碼單元信息來確定當(dāng)前編碼單元深度范圍的算法。同時(shí),還提出了一種基于支持向量機(jī)...
【文章來源】:上海大學(xué)上海市 211工程院校
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
多層編碼框架
范圍視頻由于其逼真的視覺體驗(yàn),在市場和日常生活中越來越引起人們的關(guān)注。(a) (b)圖2-1 高動(dòng)態(tài)范圍圖片(a) 多曝光合成的高動(dòng)態(tài)范圍照片 (b) 計(jì)算機(jī)生成的高動(dòng)態(tài)范圍照片為了獲取一張高動(dòng)態(tài)范圍的照片,往往需要拍攝一系列不同曝光時(shí)間的照片[26][27]。當(dāng)曝光時(shí)間較短時(shí),照片能夠記錄明亮區(qū)域的細(xì)節(jié)。隨著曝光時(shí)間的增加,照片能夠記錄黑暗的區(qū)域中的細(xì)節(jié)。利用一系列不同曝光時(shí)間的照片,便能得到各個(gè)明暗區(qū)域中的細(xì)節(jié),將各個(gè)區(qū)域的細(xì)節(jié)盡可能融合到一張照片里則能生成一張高動(dòng)態(tài)范圍的圖像。除了以上提到的方法,高動(dòng)態(tài)范圍的圖片也可以使用計(jì)算機(jī)合成。圖 2-1 展示了兩張不同的高動(dòng)態(tài)范圍圖片。在圖 2-1(a)中,不論是街道兩旁明亮的建筑還是陰影中的物體,人眼都能看見豐富的紋理。在圖 2-1(b)中,可以看見巖漿兩側(cè)的形狀和紋理。由圖 2-1 可知
圖 2-2 基于四叉樹的循環(huán)分層結(jié)構(gòu)CU 是 HEVC 編碼器中進(jìn)行幀內(nèi)預(yù)測、幀間預(yù)測等處理的基本單元,最大U 尺寸為 ,最小的 CU 尺寸為 t t。當(dāng)視頻內(nèi)容變化相對(duì)平穩(wěn)時(shí)器會(huì)使用大尺寸的編碼單元。當(dāng)視頻紋理復(fù)雜或者幀間內(nèi)容變化較大時(shí),器會(huì)采用較小的編碼單元,從而提高編碼器的預(yù)測效率,降低殘差,盡可保持了圖像細(xì)節(jié)。CU 一共支持四種不同的尺寸,且每種 CU 的尺寸對(duì)應(yīng)的的劃分深度, 尺寸的 CU 對(duì)應(yīng)的劃分深度為 0,3 3 尺寸的 C的劃分深度為 1, 尺寸的 CU 對(duì)應(yīng)的劃分深度為 2,t t 尺寸的對(duì)應(yīng)的劃分深度為 3。為了選取最優(yōu)的 CU 尺寸,編碼器嘗試所有的編碼單元尺寸,計(jì)算編碼代小時(shí)的CU尺寸。編碼代價(jià)也就是率失真代價(jià)RD cos(tRate Distortion Cost價(jià)主要考慮編碼所需的比特和編碼引入的失真。計(jì)算率失真代價(jià)的公式可示為: = u l (2-10)
本文編號(hào):3250734
【文章來源】:上海大學(xué)上海市 211工程院校
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
多層編碼框架
范圍視頻由于其逼真的視覺體驗(yàn),在市場和日常生活中越來越引起人們的關(guān)注。(a) (b)圖2-1 高動(dòng)態(tài)范圍圖片(a) 多曝光合成的高動(dòng)態(tài)范圍照片 (b) 計(jì)算機(jī)生成的高動(dòng)態(tài)范圍照片為了獲取一張高動(dòng)態(tài)范圍的照片,往往需要拍攝一系列不同曝光時(shí)間的照片[26][27]。當(dāng)曝光時(shí)間較短時(shí),照片能夠記錄明亮區(qū)域的細(xì)節(jié)。隨著曝光時(shí)間的增加,照片能夠記錄黑暗的區(qū)域中的細(xì)節(jié)。利用一系列不同曝光時(shí)間的照片,便能得到各個(gè)明暗區(qū)域中的細(xì)節(jié),將各個(gè)區(qū)域的細(xì)節(jié)盡可能融合到一張照片里則能生成一張高動(dòng)態(tài)范圍的圖像。除了以上提到的方法,高動(dòng)態(tài)范圍的圖片也可以使用計(jì)算機(jī)合成。圖 2-1 展示了兩張不同的高動(dòng)態(tài)范圍圖片。在圖 2-1(a)中,不論是街道兩旁明亮的建筑還是陰影中的物體,人眼都能看見豐富的紋理。在圖 2-1(b)中,可以看見巖漿兩側(cè)的形狀和紋理。由圖 2-1 可知
圖 2-2 基于四叉樹的循環(huán)分層結(jié)構(gòu)CU 是 HEVC 編碼器中進(jìn)行幀內(nèi)預(yù)測、幀間預(yù)測等處理的基本單元,最大U 尺寸為 ,最小的 CU 尺寸為 t t。當(dāng)視頻內(nèi)容變化相對(duì)平穩(wěn)時(shí)器會(huì)使用大尺寸的編碼單元。當(dāng)視頻紋理復(fù)雜或者幀間內(nèi)容變化較大時(shí),器會(huì)采用較小的編碼單元,從而提高編碼器的預(yù)測效率,降低殘差,盡可保持了圖像細(xì)節(jié)。CU 一共支持四種不同的尺寸,且每種 CU 的尺寸對(duì)應(yīng)的的劃分深度, 尺寸的 CU 對(duì)應(yīng)的劃分深度為 0,3 3 尺寸的 C的劃分深度為 1, 尺寸的 CU 對(duì)應(yīng)的劃分深度為 2,t t 尺寸的對(duì)應(yīng)的劃分深度為 3。為了選取最優(yōu)的 CU 尺寸,編碼器嘗試所有的編碼單元尺寸,計(jì)算編碼代小時(shí)的CU尺寸。編碼代價(jià)也就是率失真代價(jià)RD cos(tRate Distortion Cost價(jià)主要考慮編碼所需的比特和編碼引入的失真。計(jì)算率失真代價(jià)的公式可示為: = u l (2-10)
本文編號(hào):3250734
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3250734.html
最近更新
教材專著