基于深度學(xué)習(xí)的圖像壓縮方法研究
發(fā)布時間:2021-11-02 12:17
近年來,隨著拍照設(shè)備的不斷升級,存儲圖片所需的內(nèi)存空間飛速增長,然而硬盤、U盤等存儲設(shè)備的容量卻增長緩慢。不斷增長的圖片數(shù)據(jù)量與有限的存儲容量之間的矛盾給圖像壓縮帶來了巨大的挑戰(zhàn)。深度學(xué)習(xí)已經(jīng)在處理目標(biāo)檢測、跟蹤、分類等諸多圖像問題中取得了巨大突破,然而深度學(xué)習(xí)在圖像壓縮領(lǐng)域目前還并沒有被充分研究。本文將利用深度學(xué)習(xí)在圖像處理方面的優(yōu)勢,使用深度學(xué)習(xí)來提升圖像壓縮性能。本文首先設(shè)計了基于卷積神經(jīng)網(wǎng)絡(luò)的自編碼器,包含圖像編碼網(wǎng)絡(luò)和解碼網(wǎng)絡(luò)。編碼時,將待壓縮的圖像輸入網(wǎng)絡(luò),然后逐步降低圖像的空間尺度和特征圖數(shù)目,并通過量化將對于圖像質(zhì)量影響小的信息去除,從而達到數(shù)據(jù)壓縮的目的。解碼時,通過卷積和像素重排結(jié)構(gòu)逐步將圖像的尺度恢復(fù),最終重構(gòu)輸入圖像。本文在實驗中詳細對比了量化層、子像素卷積層等結(jié)構(gòu)對壓縮效果的影響,對深度網(wǎng)絡(luò)在圖像壓縮領(lǐng)域的應(yīng)用有重要指導(dǎo)意義。然后本文設(shè)計了卷積神經(jīng)網(wǎng)絡(luò)與JPEG結(jié)合的編解碼框架。首先將待壓縮的圖片送入空域冗余去除結(jié)構(gòu),初步去除因圖像局部相似而產(chǎn)生的信息冗余,然后使用JPEG編碼,將圖片變換到DCT域,通過量化去除對于圖像質(zhì)量影響較小的高頻信息。當(dāng)需要解碼時,使...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題的研究目的和意義
1.1.1 圖像壓縮的必要性
1.1.2 深度學(xué)習(xí)在圖像處理方面的潛力
1.2 國內(nèi)外研究背景及現(xiàn)狀
1.2.1 傳統(tǒng)圖像壓縮技術(shù)的發(fā)展
1.2.2 深度學(xué)習(xí)的發(fā)展
1.2.3 圖像壓縮與深度學(xué)習(xí)的結(jié)合
1.3 論文內(nèi)容及結(jié)構(gòu)
第2章 圖像壓縮及深度學(xué)習(xí)理論基礎(chǔ)
2.1 圖像信息理論
2.1.1 圖像的信息量
2.1.2 圖像信息的頻域統(tǒng)計特性
2.2 圖像壓縮理論基礎(chǔ)
2.2.1 DCT變換
2.2.2 量化
2.2.3 熵編碼
2.2.4 圖像質(zhì)量評價方法
2.3 深度學(xué)習(xí)理論基礎(chǔ)
2.3.1 神經(jīng)網(wǎng)絡(luò)的反向傳播過程
2.3.2 深度學(xué)習(xí)的基礎(chǔ)模型
2.3.3 卷積神經(jīng)網(wǎng)絡(luò)
2.4 本章小結(jié)
第3章 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像壓縮技術(shù)
3.1 卷積神經(jīng)網(wǎng)絡(luò)
3.1.1 卷積層參數(shù)
3.1.2 多層卷積的感受野
3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的自編碼器
3.2.1 自編碼器
3.2.2 網(wǎng)絡(luò)結(jié)構(gòu)
3.2.3 網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)細節(jié)
3.2.4 數(shù)據(jù)集預(yù)處理
3.2.5 實驗結(jié)果與分析
3.3 基于卷積神經(jīng)網(wǎng)絡(luò)和JPEG結(jié)合的壓縮框架
3.3.1 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.2 實現(xiàn)細節(jié)
3.3.3 實驗結(jié)果與分析
3.4 本章小結(jié)
第4章 面向手勢分類問題的圖像壓縮技術(shù)
4.1 面向手勢分類問題的圖像壓縮框架
4.1.1 網(wǎng)絡(luò)整體結(jié)構(gòu)
4.1.2 分類網(wǎng)絡(luò)的設(shè)計
4.2 壓縮網(wǎng)絡(luò)和分類網(wǎng)絡(luò)的聯(lián)合訓(xùn)練方式
4.2.1 有監(jiān)督的交替訓(xùn)練
4.2.2 有監(jiān)督的串聯(lián)訓(xùn)練
4.2.3 無監(jiān)督的對抗網(wǎng)絡(luò)訓(xùn)練
4.3 實驗結(jié)果與分析
4.4 本章小結(jié)
結(jié)論
參考文獻
攻讀學(xué)位期間發(fā)表的論文及研究成果
致謝
【參考文獻】:
期刊論文
[1]基于DCT圖像壓縮算法的研究與仿真[J]. 吳曉云,侯茹,湯引生. 商洛學(xué)院學(xué)報. 2016(06)
[2]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
[3]基于BM神經(jīng)網(wǎng)絡(luò)編碼的生理信號情感識別[J]. 潘聞特,申麗萍. 計算機工程與設(shè)計. 2012(03)
碩士論文
[1]基于DCT和APBT的JPEG圖像編碼算法優(yōu)化[D]. 傅齊鳴.山東大學(xué) 2016
[2]多視點編碼標(biāo)準(zhǔn)3D-AVS2中視間預(yù)測相關(guān)技術(shù)研究[D]. 馬冀.哈爾濱工業(yè)大學(xué) 2015
[3]基于小波變換的圖像壓縮感知方法研究[D]. 謝小紅.湖南大學(xué) 2012
[4]基于小波變換的圖像壓縮編碼技術(shù)的研究[D]. 路敬祎.大慶石油學(xué)院 2005
本文編號:3471969
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題的研究目的和意義
1.1.1 圖像壓縮的必要性
1.1.2 深度學(xué)習(xí)在圖像處理方面的潛力
1.2 國內(nèi)外研究背景及現(xiàn)狀
1.2.1 傳統(tǒng)圖像壓縮技術(shù)的發(fā)展
1.2.2 深度學(xué)習(xí)的發(fā)展
1.2.3 圖像壓縮與深度學(xué)習(xí)的結(jié)合
1.3 論文內(nèi)容及結(jié)構(gòu)
第2章 圖像壓縮及深度學(xué)習(xí)理論基礎(chǔ)
2.1 圖像信息理論
2.1.1 圖像的信息量
2.1.2 圖像信息的頻域統(tǒng)計特性
2.2 圖像壓縮理論基礎(chǔ)
2.2.1 DCT變換
2.2.2 量化
2.2.3 熵編碼
2.2.4 圖像質(zhì)量評價方法
2.3 深度學(xué)習(xí)理論基礎(chǔ)
2.3.1 神經(jīng)網(wǎng)絡(luò)的反向傳播過程
2.3.2 深度學(xué)習(xí)的基礎(chǔ)模型
2.3.3 卷積神經(jīng)網(wǎng)絡(luò)
2.4 本章小結(jié)
第3章 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像壓縮技術(shù)
3.1 卷積神經(jīng)網(wǎng)絡(luò)
3.1.1 卷積層參數(shù)
3.1.2 多層卷積的感受野
3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的自編碼器
3.2.1 自編碼器
3.2.2 網(wǎng)絡(luò)結(jié)構(gòu)
3.2.3 網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)細節(jié)
3.2.4 數(shù)據(jù)集預(yù)處理
3.2.5 實驗結(jié)果與分析
3.3 基于卷積神經(jīng)網(wǎng)絡(luò)和JPEG結(jié)合的壓縮框架
3.3.1 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.2 實現(xiàn)細節(jié)
3.3.3 實驗結(jié)果與分析
3.4 本章小結(jié)
第4章 面向手勢分類問題的圖像壓縮技術(shù)
4.1 面向手勢分類問題的圖像壓縮框架
4.1.1 網(wǎng)絡(luò)整體結(jié)構(gòu)
4.1.2 分類網(wǎng)絡(luò)的設(shè)計
4.2 壓縮網(wǎng)絡(luò)和分類網(wǎng)絡(luò)的聯(lián)合訓(xùn)練方式
4.2.1 有監(jiān)督的交替訓(xùn)練
4.2.2 有監(jiān)督的串聯(lián)訓(xùn)練
4.2.3 無監(jiān)督的對抗網(wǎng)絡(luò)訓(xùn)練
4.3 實驗結(jié)果與分析
4.4 本章小結(jié)
結(jié)論
參考文獻
攻讀學(xué)位期間發(fā)表的論文及研究成果
致謝
【參考文獻】:
期刊論文
[1]基于DCT圖像壓縮算法的研究與仿真[J]. 吳曉云,侯茹,湯引生. 商洛學(xué)院學(xué)報. 2016(06)
[2]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
[3]基于BM神經(jīng)網(wǎng)絡(luò)編碼的生理信號情感識別[J]. 潘聞特,申麗萍. 計算機工程與設(shè)計. 2012(03)
碩士論文
[1]基于DCT和APBT的JPEG圖像編碼算法優(yōu)化[D]. 傅齊鳴.山東大學(xué) 2016
[2]多視點編碼標(biāo)準(zhǔn)3D-AVS2中視間預(yù)測相關(guān)技術(shù)研究[D]. 馬冀.哈爾濱工業(yè)大學(xué) 2015
[3]基于小波變換的圖像壓縮感知方法研究[D]. 謝小紅.湖南大學(xué) 2012
[4]基于小波變換的圖像壓縮編碼技術(shù)的研究[D]. 路敬祎.大慶石油學(xué)院 2005
本文編號:3471969
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3471969.html
最近更新
教材專著