基于深度學習的端到端圖像視頻壓縮框架
發(fā)布時間:2024-11-10 19:52
圖像和視頻壓縮一直是學術(shù)界和工業(yè)界研究的熱點之一。近年來,隨著深度學習技術(shù)的發(fā)展,尤其是卷積神經(jīng)網(wǎng)絡(luò)在圖像處理和計算機視覺領(lǐng)域的成功應(yīng)用,利用深度學習技術(shù)來對圖像和視頻高效壓縮成為可能。目前深度學習技術(shù)在高層視覺領(lǐng)域,如圖像分類,目標檢測,目標跟蹤,圖像分割,人臉識別等,已經(jīng)取得了突破性的研究成果,然而在低層視覺上,如圖像壓縮,圖像復(fù)原等領(lǐng)域的應(yīng)用還具有很大的研究潛力和價值。本文以深度學習技術(shù)為基礎(chǔ),主要研究工作分為以下兩個部分:一、提出了基于深度學習的端到端圖像壓縮框架,將深度學習技術(shù)與傳統(tǒng)的圖像編解碼器(如JPEG,JPEG2000和BPG等)無縫的銜接起來,進一步提高編解碼器的壓縮性能。二、著眼于視頻幀率轉(zhuǎn)換中的插幀技術(shù),提出了基于運動補償模型的深度學習插幀網(wǎng)絡(luò)模型。為了能提高壓縮圖像質(zhì)量的同時提高壓縮比,我們將兩個卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)編解碼器整合到一個端到端的圖像壓縮框架中。第一個卷積神經(jīng)網(wǎng)絡(luò)Com CNN在編碼器前端,用來學習原圖像的緊湊表示,學習到的緊湊表示被送到傳統(tǒng)編碼器進行編碼。第二個卷積神經(jīng)網(wǎng)絡(luò)Rec CNN在解碼器后端,通過解碼后的緊湊表示來高質(zhì)量的重建原圖像。為了讓這...
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.1.1 圖像和視頻中的冗余
1.1.2 深度學習在圖像和視頻編碼中應(yīng)用的關(guān)鍵問題
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 圖像壓縮的研究現(xiàn)狀
1.2.2 視頻幀率轉(zhuǎn)換的研究現(xiàn)狀
1.3 論文內(nèi)容及結(jié)構(gòu)安排
第2章 深度學習基礎(chǔ)及其在低層視覺領(lǐng)域的應(yīng)用
2.1 深度學習基礎(chǔ)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2 深度學習在圖像壓縮復(fù)原上的應(yīng)用
2.3 深度學習在視頻幀率轉(zhuǎn)換上的應(yīng)用
2.4 本章小結(jié)
第3章 基于卷積神經(jīng)網(wǎng)絡(luò)的端到端圖像壓縮框架
3.1 問題的提出以及提出的圖像壓縮框架
3.1.1 ComCNN網(wǎng)絡(luò)結(jié)構(gòu)
3.1.2 RecCNN網(wǎng)絡(luò)結(jié)構(gòu)
3.2 學習算法
3.2.1更新RecCNN的參數(shù)θ2
3.2.2更新ComCNN的參數(shù)θ1
3.3 損失函數(shù)
3.4 實驗數(shù)據(jù)和實驗結(jié)果
3.4.1 實驗數(shù)據(jù)和參數(shù)設(shè)置
3.4.2 實驗結(jié)果
3.5 本章小結(jié)
第4章 基于深度學習的視頻幀率轉(zhuǎn)換技術(shù)
4.1 問題的提出以及本文提出的方法
4.2 前后幀融合的深度學習插幀算法
4.3 基于運動補償?shù)纳疃葘W習插幀算法
4.3.1 多尺度運動補償網(wǎng)絡(luò)(MC-subnet)
4.3.2 質(zhì)量增強網(wǎng)絡(luò)(QE-subnet)
4.4 損失函數(shù)
4.5 實驗配置及實驗結(jié)果
4.5.1 實驗配置及數(shù)據(jù)集
4.5.2 實驗結(jié)果
4.6 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其他成果
致謝
本文編號:4011872
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.1.1 圖像和視頻中的冗余
1.1.2 深度學習在圖像和視頻編碼中應(yīng)用的關(guān)鍵問題
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 圖像壓縮的研究現(xiàn)狀
1.2.2 視頻幀率轉(zhuǎn)換的研究現(xiàn)狀
1.3 論文內(nèi)容及結(jié)構(gòu)安排
第2章 深度學習基礎(chǔ)及其在低層視覺領(lǐng)域的應(yīng)用
2.1 深度學習基礎(chǔ)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)
2.2 深度學習在圖像壓縮復(fù)原上的應(yīng)用
2.3 深度學習在視頻幀率轉(zhuǎn)換上的應(yīng)用
2.4 本章小結(jié)
第3章 基于卷積神經(jīng)網(wǎng)絡(luò)的端到端圖像壓縮框架
3.1 問題的提出以及提出的圖像壓縮框架
3.1.1 ComCNN網(wǎng)絡(luò)結(jié)構(gòu)
3.1.2 RecCNN網(wǎng)絡(luò)結(jié)構(gòu)
3.2 學習算法
3.2.1更新RecCNN的參數(shù)θ2
3.2.2更新ComCNN的參數(shù)θ1
3.3 損失函數(shù)
3.4 實驗數(shù)據(jù)和實驗結(jié)果
3.4.1 實驗數(shù)據(jù)和參數(shù)設(shè)置
3.4.2 實驗結(jié)果
3.5 本章小結(jié)
第4章 基于深度學習的視頻幀率轉(zhuǎn)換技術(shù)
4.1 問題的提出以及本文提出的方法
4.2 前后幀融合的深度學習插幀算法
4.3 基于運動補償?shù)纳疃葘W習插幀算法
4.3.1 多尺度運動補償網(wǎng)絡(luò)(MC-subnet)
4.3.2 質(zhì)量增強網(wǎng)絡(luò)(QE-subnet)
4.4 損失函數(shù)
4.5 實驗配置及實驗結(jié)果
4.5.1 實驗配置及數(shù)據(jù)集
4.5.2 實驗結(jié)果
4.6 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其他成果
致謝
本文編號:4011872
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/4011872.html
上一篇:基于扭曲微結(jié)構(gòu)的模式干涉光纖傳感技術(shù)研究
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著