基于非監(jiān)督的卷積神經(jīng)網(wǎng)絡(luò)單目場景深度估計方法研究
發(fā)布時間:2021-02-24 18:14
三維重建在醫(yī)學(xué)圖像處理、虛擬現(xiàn)實、計算機圖形學(xué)、計算機視覺、數(shù)字媒體創(chuàng)作等領(lǐng)域中扮演著重要的角色,深度圖是三維重建中重要的一部分,它決定了三維重建的準(zhǔn)確度、清晰度,故而本文主要是對場景深度進行研究。然而,相對于雙目圖像深度估計方法,單目圖像深度估計方法對相機構(gòu)造要求更低,應(yīng)用方便,單目圖像深度估計方法的難點在于,很難從單目圖像中抓取到足夠的場景結(jié)構(gòu)特征。相關(guān)研究證明,卷積神經(jīng)網(wǎng)絡(luò)非常善于處理圖像類信息,可以從圖像中學(xué)習(xí)到豐富的特征表達,因此本文結(jié)合卷積神經(jīng)網(wǎng)絡(luò)對單目圖像進行深度估計。由于殘差網(wǎng)絡(luò)很好地解決了隨著網(wǎng)絡(luò)加深梯度消失問題,非監(jiān)督方法解決了手工數(shù)據(jù)標(biāo)注難問題,故本文采用非監(jiān)督方法結(jié)合殘差卷積神經(jīng)網(wǎng)絡(luò)給出了基于非監(jiān)督的殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型,簡稱URM模型。URM模型包含單目深度估計殘差卷積神經(jīng)網(wǎng)絡(luò)模型,簡稱Depth CNN模型和位姿殘差卷積神經(jīng)網(wǎng)絡(luò)模型,簡稱Pose CNN模型,Depth CNN主要是對圖像的每個像素點進行深度值估計,Pose CNN主要求得連續(xù)兩幅圖像的相機位姿轉(zhuǎn)換值。接下來,通過兩模型之間的關(guān)系建立了 URM模型的無監(jiān)督信號,然后通過無監(jiān)督信號...
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 本課題研究背景
1.2 理論意義和應(yīng)用價值
1.3 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢
1.4 本文研究內(nèi)容
1.5 本文的結(jié)構(gòu)安排
2 相關(guān)知識介紹
2.1 引言
2.2 機器學(xué)習(xí)中的學(xué)習(xí)類別
2.3 深度表示方法
2.4 卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
2.4.1 卷積層
2.4.2 池化層
2.4.3 激活層
2.4.4 模型參數(shù)的更新
2.5 卷積神經(jīng)網(wǎng)絡(luò)的特征提取
2.6 殘差卷積神經(jīng)網(wǎng)絡(luò)
2.7 木章小結(jié)
3 基于非監(jiān)督的殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計方法
3.1 引言
3.2 單目深度估計殘差卷積神經(jīng)網(wǎng)絡(luò)模型
3.2.1 單目深度估計殘差卷積神經(jīng)網(wǎng)絡(luò)模型的介紹
3.2.2 單目深度估計殘差卷積神經(jīng)網(wǎng)絡(luò)模型框架
3.3 位姿殘差卷積神經(jīng)網(wǎng)絡(luò)模型
3.3.1 相機位姿估計算法
3.3.2 位姿殘差卷積神經(jīng)網(wǎng)絡(luò)模型框架
3.4 無監(jiān)督損失函數(shù)的構(gòu)建
3.4.1 視圖合成
3.4.2 損失函數(shù)的構(gòu)建
3.5 本章小結(jié)
4 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計方法
4.1 引言
4.2 線性鏈條件隨機場模型
4.2.1 概率無向圖模型
4.2.2 線性鏈條件隨機場
4.2.3 線性鏈條件隨機場的參數(shù)化形式
4.3 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型
4.3.1 線性鏈條件隨機場中圖像與深度之間的關(guān)系
4.3.2 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型
4.4 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)模型參數(shù)的更新
4.5 本章小結(jié)
5 模型訓(xùn)練及實驗結(jié)果分析
5.1 引言
5.2 實驗設(shè)置
5.2.1 實驗環(huán)境
5.2.2 Tensorflow框架
5.2.3 模型參數(shù)的設(shè)置
5.2.4 模型性能評價的方法
5.3 場景深度估計常用的數(shù)據(jù)集
5.3.1 KITTI數(shù)據(jù)集
5.3.2 Make3D數(shù)據(jù)集
5.3.3 CITYSCAPES數(shù)據(jù)集
5.3.4 本論文真實場景中的數(shù)據(jù)集
5.4 模型訓(xùn)練
5.4.1 基于非監(jiān)督的殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型的訓(xùn)練
5.4.2 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型的訓(xùn)練
5.5 實驗結(jié)果與分析
5.5.1 基于非監(jiān)督的殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型的實驗結(jié)果
5.5.2 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型的實驗結(jié)果
5.5.3 實驗結(jié)果分析
5.6 本章小結(jié)
結(jié)論
參考文獻
致謝
攻讀碩士學(xué)位期間的科研項目參與
【參考文獻】:
期刊論文
[1]基于深層卷積神經(jīng)網(wǎng)絡(luò)的單目紅外圖像深度估計[J]. 許路,趙海濤,孫韶媛. 光學(xué)學(xué)報. 2016(07)
本文編號:3049760
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 本課題研究背景
1.2 理論意義和應(yīng)用價值
1.3 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢
1.4 本文研究內(nèi)容
1.5 本文的結(jié)構(gòu)安排
2 相關(guān)知識介紹
2.1 引言
2.2 機器學(xué)習(xí)中的學(xué)習(xí)類別
2.3 深度表示方法
2.4 卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
2.4.1 卷積層
2.4.2 池化層
2.4.3 激活層
2.4.4 模型參數(shù)的更新
2.5 卷積神經(jīng)網(wǎng)絡(luò)的特征提取
2.6 殘差卷積神經(jīng)網(wǎng)絡(luò)
2.7 木章小結(jié)
3 基于非監(jiān)督的殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計方法
3.1 引言
3.2 單目深度估計殘差卷積神經(jīng)網(wǎng)絡(luò)模型
3.2.1 單目深度估計殘差卷積神經(jīng)網(wǎng)絡(luò)模型的介紹
3.2.2 單目深度估計殘差卷積神經(jīng)網(wǎng)絡(luò)模型框架
3.3 位姿殘差卷積神經(jīng)網(wǎng)絡(luò)模型
3.3.1 相機位姿估計算法
3.3.2 位姿殘差卷積神經(jīng)網(wǎng)絡(luò)模型框架
3.4 無監(jiān)督損失函數(shù)的構(gòu)建
3.4.1 視圖合成
3.4.2 損失函數(shù)的構(gòu)建
3.5 本章小結(jié)
4 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計方法
4.1 引言
4.2 線性鏈條件隨機場模型
4.2.1 概率無向圖模型
4.2.2 線性鏈條件隨機場
4.2.3 線性鏈條件隨機場的參數(shù)化形式
4.3 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型
4.3.1 線性鏈條件隨機場中圖像與深度之間的關(guān)系
4.3.2 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型
4.4 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)模型參數(shù)的更新
4.5 本章小結(jié)
5 模型訓(xùn)練及實驗結(jié)果分析
5.1 引言
5.2 實驗設(shè)置
5.2.1 實驗環(huán)境
5.2.2 Tensorflow框架
5.2.3 模型參數(shù)的設(shè)置
5.2.4 模型性能評價的方法
5.3 場景深度估計常用的數(shù)據(jù)集
5.3.1 KITTI數(shù)據(jù)集
5.3.2 Make3D數(shù)據(jù)集
5.3.3 CITYSCAPES數(shù)據(jù)集
5.3.4 本論文真實場景中的數(shù)據(jù)集
5.4 模型訓(xùn)練
5.4.1 基于非監(jiān)督的殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型的訓(xùn)練
5.4.2 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型的訓(xùn)練
5.5 實驗結(jié)果與分析
5.5.1 基于非監(jiān)督的殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型的實驗結(jié)果
5.5.2 基于非監(jiān)督的條件隨機場殘差卷積神經(jīng)網(wǎng)絡(luò)場景深度估計模型的實驗結(jié)果
5.5.3 實驗結(jié)果分析
5.6 本章小結(jié)
結(jié)論
參考文獻
致謝
攻讀碩士學(xué)位期間的科研項目參與
【參考文獻】:
期刊論文
[1]基于深層卷積神經(jīng)網(wǎng)絡(luò)的單目紅外圖像深度估計[J]. 許路,趙海濤,孫韶媛. 光學(xué)學(xué)報. 2016(07)
本文編號:3049760
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3049760.html
最近更新
教材專著