基于全卷積神經(jīng)網(wǎng)絡(luò)的全向場(chǎng)景分割研究與算法實(shí)現(xiàn)

發(fā)布時(shí)間：2017-12-11 13:38

本文關(guān)鍵詞：基于全卷積神經(jīng)網(wǎng)絡(luò)的全向場(chǎng)景分割研究與算法實(shí)現(xiàn)

【摘要】：隨著計(jì)算機(jī)性能的跨越式提高和大數(shù)據(jù)時(shí)代的來(lái)臨,深度學(xué)習(xí)受到了各界越來(lái)越廣泛的關(guān)注。它能夠?qū)⒌图?jí)特征進(jìn)行組合,形成更為抽象的高級(jí)特征,對(duì)數(shù)據(jù)進(jìn)行更為本質(zhì)的刻畫,因此被廣泛應(yīng)用到了計(jì)算機(jī)視覺、文本翻譯、模式識(shí)別、搜索推薦等各個(gè)領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度神經(jīng)網(wǎng)絡(luò)的一種,它具有稀疏連接、參數(shù)共享的特點(diǎn),可以自動(dòng)提取特征,主要應(yīng)用于二維圖像的識(shí)別,能夠?qū)崿F(xiàn)圖像級(jí)別的分類。而全卷積網(wǎng)絡(luò)(FCN)是CNN的發(fā)展和延伸,它除了具有卷積神經(jīng)網(wǎng)絡(luò)的一般特點(diǎn)外,還有全卷積化、上采樣、跳躍結(jié)構(gòu)等一系列特征。全卷積網(wǎng)絡(luò)能夠預(yù)測(cè)每個(gè)像素點(diǎn)的語(yǔ)義標(biāo)簽,可以實(shí)現(xiàn)像素級(jí)別的分類,從而對(duì)圖像進(jìn)行場(chǎng)景分割。論文探討了 CNN與FCN的網(wǎng)絡(luò)結(jié)構(gòu),工作原理以及各自特點(diǎn),比較了兩種網(wǎng)絡(luò)之間的區(qū)別。為了實(shí)現(xiàn)全向場(chǎng)景的分割,本文在原有的FCN圖像分割的基礎(chǔ)上引入了全景圖像,詳細(xì)分析了全景圖像的種類、特點(diǎn)、應(yīng)用場(chǎng)景以及對(duì)分割效果的影響,并論述了由普通圖像合成球面全景圖像的具體方法;為了進(jìn)一步地提高全向場(chǎng)景分割的效果,我們對(duì)基于FCN的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),最終將全景圖像與改進(jìn)網(wǎng)絡(luò)相結(jié)合,提高了網(wǎng)絡(luò)對(duì)邊緣和細(xì)節(jié)部分的處理能力,實(shí)現(xiàn)了更準(zhǔn)確的全向場(chǎng)景分割。本文的主要?jiǎng)?chuàng)新點(diǎn)在于:一是引入全景圖像,將同一場(chǎng)景的普通圖像合成為球面全景圖,作為神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)輸入。球面全景圖像具有更為廣闊的視野,能夠完全覆蓋周邊環(huán)境,在提供全向場(chǎng)景信息的同時(shí),增強(qiáng)了圖像中物體的整體性,有助于網(wǎng)絡(luò)提取更具有代表性的特征。二是在FCN的基礎(chǔ)上對(duì)網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行改進(jìn),設(shè)計(jì)上下兩層網(wǎng)絡(luò),并行輸入RGB圖像和深度圖像。上層對(duì)RGB圖像進(jìn)行處理,獲得整體空間架構(gòu);下層將深度圖像作為約束,充分利用深度圖像簡(jiǎn)潔,輪廓特征明顯的特點(diǎn),通過(guò)卷積網(wǎng)絡(luò)提取相對(duì)精細(xì)的外部幾何特征。將同一場(chǎng)景、不同類型、不同層次的特征圖相結(jié)合,提高圖像場(chǎng)景分割的精確度。
【學(xué)位授予單位】：山東大學(xué)
【學(xué)位級(jí)別】：碩士
【學(xué)位授予年份】：2017
【分類號(hào)】：TP391.41;TP183

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 王學(xué)軍;丁紅濤;陳賀新;;一種基于鏡頭聚類的視頻場(chǎng)景分割方法[J];中國(guó)圖象圖形學(xué)報(bào);2007年12期

2 張浩峰;業(yè)巧林;趙春霞;楊靜宇;;一種非監(jiān)督道路場(chǎng)景分割方法[J];南京理工大學(xué)學(xué)報(bào);2012年02期

3 曹建榮;;一種基于語(yǔ)義的視頻場(chǎng)景分割算法[J];中國(guó)圖象圖形學(xué)報(bào);2006年11期

4 郭小川;劉明杰;王婧璐;董道國(guó);萬(wàn)乾榮;;基于頻繁鏡頭集合的視頻場(chǎng)景分割方法[J];計(jì)算機(jī)應(yīng)用與軟件;2011年06期

5 劉曉杰;晉卓;宋占偉;張e，

本文編號(hào)：1278680

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://www.sikaile.net/shoufeilunwen/xixikjs/1278680.html

上一篇：全日制專業(yè)碩士教學(xué)中引入慕課（MOOC）的策略研究
下一篇：基于雙因素的分布式認(rèn)證密鑰協(xié)商方案研究

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于全卷積神經(jīng)網(wǎng)絡(luò)的全向場(chǎng)景分割研究與算法實(shí)現(xiàn)