基于深度學(xué)習(xí)的單視圖三維點(diǎn)云重建方法研究
發(fā)布時(shí)間:2021-10-25 09:17
三維重建是計(jì)算機(jī)圖形學(xué)領(lǐng)域的經(jīng)典任務(wù),近年來(lái)深度學(xué)習(xí)在二維圖像處理中被廣泛應(yīng)用并且取得顯著成果,越來(lái)越多的研究者嘗試將深度學(xué)習(xí)在二維圖像處理任務(wù)上的成功復(fù)制到三維重建任務(wù)中,因此基于深度學(xué)習(xí)的三維重建相關(guān)研究也逐漸成為研究熱點(diǎn)。相比需要精密采集設(shè)備和嚴(yán)格標(biāo)定圖像信息的傳統(tǒng)三維重建方法,基于深度學(xué)習(xí)的三維重建方法通過(guò)深度神經(jīng)網(wǎng)絡(luò)完成二維圖像到三維模型的匹配,能夠大量地、快速地從普通采集設(shè)備獲取的RGB圖像重建多種類(lèi)別物體的三維模型。從單一圖像重建高質(zhì)量的三維模型則更具有挑戰(zhàn)性,如何提取圖像特征,恢復(fù)三維模型信息,生成高質(zhì)量的三維模型成為三維重建研究的重點(diǎn)。本文主要研究工作歸納如下:(1)對(duì)已有的基于深度學(xué)習(xí)的多種表現(xiàn)形式的三維重建方法進(jìn)行分析和總結(jié):按照基于深度學(xué)習(xí)的三維重建的發(fā)展梳理了三維體素重建、三維點(diǎn)云重建和三維網(wǎng)格重建的國(guó)內(nèi)外相關(guān)研究,通過(guò)對(duì)比和分析三種三維模型表現(xiàn)形式的優(yōu)劣,并根據(jù)研究需要確定將三維點(diǎn)云作為研究對(duì)象,另外詳細(xì)分析了目前普遍使用的三維模型數(shù)據(jù)集、數(shù)據(jù)處理方式、評(píng)估方法以及應(yīng)用于三維重建的神經(jīng)網(wǎng)絡(luò)中的基礎(chǔ)操作等。(2)提出了基于注意力機(jī)制的高密度點(diǎn)云重建方法:針對(duì)過(guò)...
【文章來(lái)源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Choy等人[8]3d-r2n2網(wǎng)絡(luò)架構(gòu)
合肥工業(yè)大學(xué)學(xué)術(shù)碩士研究生學(xué)位論文4能將用于二維圖像處理的神經(jīng)網(wǎng)絡(luò)架構(gòu)與基礎(chǔ)操作擴(kuò)展到三維體素的處理中。但三維體素重建的劣勢(shì)在于這種簡(jiǎn)單的擴(kuò)展會(huì)導(dǎo)致卷積等計(jì)算資源出現(xiàn)維度上的增長(zhǎng),因此在有限的計(jì)算資源和存儲(chǔ)資源下,重建出的三維體素通常是323這樣的較低分辨率,也就是說(shuō)重建出的三維體素很難表示較為細(xì)節(jié)的形狀信息。圖1.2Lu等人[13]3D-FHNet網(wǎng)絡(luò)架構(gòu)Fig1.2Networkstructureof3D-FHNetofLuetal.[13]Lu等人[13]提出融合分層重建網(wǎng)絡(luò),認(rèn)為三維循環(huán)神經(jīng)網(wǎng)絡(luò)在三維體素重建中對(duì)多視圖信息的融合隨視圖順序的不同是不穩(wěn)定、不可靠的,因此采用了選取基于視點(diǎn)的最大特征的多視圖特征融合方法以及分層預(yù)測(cè)的策略使得神經(jīng)網(wǎng)絡(luò)能夠通過(guò)單視圖或者任意多張視圖進(jìn)行三維體素重建,實(shí)驗(yàn)結(jié)果說(shuō)明當(dāng)視圖數(shù)量增加時(shí),重建結(jié)果也會(huì)越來(lái)越好。圖1.3Wang等人[14]O-CNN概覽Fig1.3OverviewofO-CNNofWangetal.[14]上述研究受限于三維體素內(nèi)存占用過(guò)大以及計(jì)算資源消耗過(guò)大等原因,大多只重建低分辨率的三維體素,而Wang等人[14]提出基于八叉樹(shù)的卷積神經(jīng)網(wǎng)絡(luò),即將三維體素?cái)?shù)據(jù)組織存儲(chǔ)在八叉樹(shù)內(nèi),同時(shí)卷積神經(jīng)網(wǎng)絡(luò)的特征也相應(yīng)的能夠存儲(chǔ)于八叉樹(shù)的結(jié)構(gòu)中,而基于八叉樹(shù)的卷積神經(jīng)網(wǎng)絡(luò)的內(nèi)存和計(jì)算成本隨著八叉樹(shù)的深度增加呈平方增長(zhǎng),相對(duì)于原始三維體素結(jié)構(gòu)隨體素單位增加呈立方增長(zhǎng)
Wang等人[14]O-CNN概覽
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)在基于單幅圖像的物體三維重建中的應(yīng)用[J]. 陳加,張玉麒,宋鵬,魏艷濤,王煜. 自動(dòng)化學(xué)報(bào). 2019(04)
本文編號(hào):3457100
【文章來(lái)源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Choy等人[8]3d-r2n2網(wǎng)絡(luò)架構(gòu)
合肥工業(yè)大學(xué)學(xué)術(shù)碩士研究生學(xué)位論文4能將用于二維圖像處理的神經(jīng)網(wǎng)絡(luò)架構(gòu)與基礎(chǔ)操作擴(kuò)展到三維體素的處理中。但三維體素重建的劣勢(shì)在于這種簡(jiǎn)單的擴(kuò)展會(huì)導(dǎo)致卷積等計(jì)算資源出現(xiàn)維度上的增長(zhǎng),因此在有限的計(jì)算資源和存儲(chǔ)資源下,重建出的三維體素通常是323這樣的較低分辨率,也就是說(shuō)重建出的三維體素很難表示較為細(xì)節(jié)的形狀信息。圖1.2Lu等人[13]3D-FHNet網(wǎng)絡(luò)架構(gòu)Fig1.2Networkstructureof3D-FHNetofLuetal.[13]Lu等人[13]提出融合分層重建網(wǎng)絡(luò),認(rèn)為三維循環(huán)神經(jīng)網(wǎng)絡(luò)在三維體素重建中對(duì)多視圖信息的融合隨視圖順序的不同是不穩(wěn)定、不可靠的,因此采用了選取基于視點(diǎn)的最大特征的多視圖特征融合方法以及分層預(yù)測(cè)的策略使得神經(jīng)網(wǎng)絡(luò)能夠通過(guò)單視圖或者任意多張視圖進(jìn)行三維體素重建,實(shí)驗(yàn)結(jié)果說(shuō)明當(dāng)視圖數(shù)量增加時(shí),重建結(jié)果也會(huì)越來(lái)越好。圖1.3Wang等人[14]O-CNN概覽Fig1.3OverviewofO-CNNofWangetal.[14]上述研究受限于三維體素內(nèi)存占用過(guò)大以及計(jì)算資源消耗過(guò)大等原因,大多只重建低分辨率的三維體素,而Wang等人[14]提出基于八叉樹(shù)的卷積神經(jīng)網(wǎng)絡(luò),即將三維體素?cái)?shù)據(jù)組織存儲(chǔ)在八叉樹(shù)內(nèi),同時(shí)卷積神經(jīng)網(wǎng)絡(luò)的特征也相應(yīng)的能夠存儲(chǔ)于八叉樹(shù)的結(jié)構(gòu)中,而基于八叉樹(shù)的卷積神經(jīng)網(wǎng)絡(luò)的內(nèi)存和計(jì)算成本隨著八叉樹(shù)的深度增加呈平方增長(zhǎng),相對(duì)于原始三維體素結(jié)構(gòu)隨體素單位增加呈立方增長(zhǎng)
Wang等人[14]O-CNN概覽
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)在基于單幅圖像的物體三維重建中的應(yīng)用[J]. 陳加,張玉麒,宋鵬,魏艷濤,王煜. 自動(dòng)化學(xué)報(bào). 2019(04)
本文編號(hào):3457100
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3457100.html
最近更新
教材專(zhuān)著