基于深度學(xué)習(xí)的人物圖像生成模型研究
發(fā)布時間:2021-05-08 06:03
隨著深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,計算機視覺領(lǐng)域的研究范圍也得到了擴展,其中很重要的一項包括生成式模型的研究。生成式模型體現(xiàn)了計算機對大量樣本數(shù)據(jù)進行建模的能力。盡管目前已經(jīng)有不少的生成式模型陸續(xù)被提出,但這些模型用于圖像生成時,生成圖像的質(zhì)量依然沒有達到令人滿意的效果,尤其是空間結(jié)構(gòu)比較復(fù)雜的圖像,例如全身人物圖像。針對以上提出的一些問題,本篇論文中提出了兩種人物圖像生成模型,一種是基于姿勢的人物圖像生成模型,另一種是基于單張圖像的人物姿勢變換模型。雖然兩種模型在名字上有些差異,其本質(zhì)都是根據(jù)不同的輸入條件生成一張人物圖像。第一種模型接收一張簡單的人體姿勢圖(2維骨架圖)作為輸入,輸出一張對應(yīng)姿勢的人物圖像。該模型采用的是一個條件式生成對抗網(wǎng)絡(luò)的結(jié)構(gòu);第二種模型則接收兩個條件作為輸入,一張目標(biāo)姿勢圖和一張真實人物圖像,輸出對應(yīng)姿勢的真實人物圖像,且要保留輸入人物圖像的外貌信息,這樣就實現(xiàn)了人物的姿勢轉(zhuǎn)換。該模型是在上一個模型的基礎(chǔ)上融合一個變分自動編碼器的結(jié)構(gòu),形成了一個混合式的生成模型,因此,該模型同時擁有生成對抗網(wǎng)絡(luò)和變分自動編碼器的優(yōu)點。此外,為了提高生成圖像的質(zhì)量,兩個模型中...
【文章來源】:湖南大學(xué)湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于自回歸模型的圖像生成
1.2.2 基于變分自動編碼器的圖像生成
1.2.3 基于生成對抗網(wǎng)絡(luò)的圖像生成
1.2.4 人物圖像生成
1.3 研究意義與主要研究工作
1.4 論文組織結(jié)構(gòu)
第2章 理論基礎(chǔ)及相關(guān)技術(shù)
2.1 神經(jīng)網(wǎng)絡(luò)的前向傳播
2.2 神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.4 殘差網(wǎng)絡(luò)
2.5 小結(jié)
第3章 基于姿勢的人物圖片生成
3.1 算法思想
3.2 模型搭建
3.2.1 生成網(wǎng)絡(luò)
3.2.2 判別網(wǎng)絡(luò)
3.3 目標(biāo)函數(shù)
3.3.1 內(nèi)容損失函數(shù)
3.3.2 總體目標(biāo)函數(shù)
3.4 實驗細(xì)節(jié)
3.4.1 訓(xùn)練流程
3.4.2 參數(shù)設(shè)置
3.5 實驗結(jié)果
3.6 小結(jié)
第4章 基于單張圖片的人物姿勢變換
4.1 算法思想
4.2 模型搭建
4.3 目標(biāo)函數(shù)
4.3.1 格拉姆矩陣與風(fēng)格損失函數(shù)
4.3.2 標(biāo)準(zhǔn)風(fēng)格損失函數(shù)的缺陷
4.3.3 多尺度風(fēng)格損失
4.3.4 總體目標(biāo)函數(shù)
4.4 實現(xiàn)細(xì)節(jié)
4.5 實驗結(jié)果
4.6 小結(jié)
第5章 對比實驗與結(jié)果分析
5.1 實驗環(huán)境
5.2 數(shù)據(jù)預(yù)處理
5.2.1 DeepFashion數(shù)據(jù)集
5.2.2 人體姿態(tài)估計
5.3 評估標(biāo)準(zhǔn)
5.3.1 峰值信噪比(PSNR)
5.3.2 結(jié)構(gòu)相似性指數(shù)(SSIM)
5.3.3 Inception Score
5.4對比實驗
5.5 局限性
5.6 小結(jié)
結(jié)論
參考文獻
致謝
附錄A 發(fā)表論文和參加科研情況說明
本文編號:3174813
【文章來源】:湖南大學(xué)湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于自回歸模型的圖像生成
1.2.2 基于變分自動編碼器的圖像生成
1.2.3 基于生成對抗網(wǎng)絡(luò)的圖像生成
1.2.4 人物圖像生成
1.3 研究意義與主要研究工作
1.4 論文組織結(jié)構(gòu)
第2章 理論基礎(chǔ)及相關(guān)技術(shù)
2.1 神經(jīng)網(wǎng)絡(luò)的前向傳播
2.2 神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.4 殘差網(wǎng)絡(luò)
2.5 小結(jié)
第3章 基于姿勢的人物圖片生成
3.1 算法思想
3.2 模型搭建
3.2.1 生成網(wǎng)絡(luò)
3.2.2 判別網(wǎng)絡(luò)
3.3 目標(biāo)函數(shù)
3.3.1 內(nèi)容損失函數(shù)
3.3.2 總體目標(biāo)函數(shù)
3.4 實驗細(xì)節(jié)
3.4.1 訓(xùn)練流程
3.4.2 參數(shù)設(shè)置
3.5 實驗結(jié)果
3.6 小結(jié)
第4章 基于單張圖片的人物姿勢變換
4.1 算法思想
4.2 模型搭建
4.3 目標(biāo)函數(shù)
4.3.1 格拉姆矩陣與風(fēng)格損失函數(shù)
4.3.2 標(biāo)準(zhǔn)風(fēng)格損失函數(shù)的缺陷
4.3.3 多尺度風(fēng)格損失
4.3.4 總體目標(biāo)函數(shù)
4.4 實現(xiàn)細(xì)節(jié)
4.5 實驗結(jié)果
4.6 小結(jié)
第5章 對比實驗與結(jié)果分析
5.1 實驗環(huán)境
5.2 數(shù)據(jù)預(yù)處理
5.2.1 DeepFashion數(shù)據(jù)集
5.2.2 人體姿態(tài)估計
5.3 評估標(biāo)準(zhǔn)
5.3.1 峰值信噪比(PSNR)
5.3.2 結(jié)構(gòu)相似性指數(shù)(SSIM)
5.3.3 Inception Score
5.4對比實驗
5.5 局限性
5.6 小結(jié)
結(jié)論
參考文獻
致謝
附錄A 發(fā)表論文和參加科研情況說明
本文編號:3174813
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3174813.html
最近更新
教材專著