天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

限定場(chǎng)景下圖像語(yǔ)義理解及分割的研究與應(yīng)用

發(fā)布時(shí)間:2021-01-15 12:09
  圖像語(yǔ)義分割技術(shù)其目的是為圖像中每個(gè)像素分配類別標(biāo)簽,由于此項(xiàng)技術(shù)與無(wú)人駕駛等多種智能應(yīng)用密切相關(guān),因此成為了計(jì)算機(jī)視覺(jué)中一個(gè)研究熱點(diǎn)。深度學(xué)習(xí)的迅速發(fā)展推動(dòng)語(yǔ)義分割領(lǐng)域的研究取得突破性進(jìn)展,使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行語(yǔ)義分割的方法效果遠(yuǎn)遠(yuǎn)好于其他方法,通過(guò)不斷探索及研究該領(lǐng)域中深度學(xué)習(xí)算法后發(fā)現(xiàn):卷積神經(jīng)網(wǎng)絡(luò)中大量的卷積和池化操作縮小了圖像的分辨率,導(dǎo)致像素一定程度上失去了空間信息,并且由于神經(jīng)網(wǎng)絡(luò)以像素為單位進(jìn)行特征提取及學(xué)習(xí),缺少對(duì)圖像的整體理解,現(xiàn)有網(wǎng)絡(luò)在物體所屬類別的分類上表現(xiàn)仍然有所欠缺;谝陨蠁(wèn)題,本研究使用場(chǎng)景上下文編碼模塊,通過(guò)對(duì)自然場(chǎng)景中圖像所包含的場(chǎng)景信息進(jìn)行編碼學(xué)習(xí)。該方法圖像分割與圖像中的場(chǎng)景緊密的聯(lián)系起來(lái),從全局理解圖像的語(yǔ)義并且利用圖像場(chǎng)景中的圖像語(yǔ)義信息來(lái)指導(dǎo)語(yǔ)義分割任務(wù)。從而使得整體的像素分類更加合理,分割結(jié)果更加準(zhǔn)確,具體的研究?jī)?nèi)容如下:(1)本研究提出了基于限定場(chǎng)景上下文編碼的語(yǔ)義分割網(wǎng)絡(luò),網(wǎng)絡(luò)中融合了一個(gè)場(chǎng)景編碼模塊。利用圖像中的場(chǎng)景信息對(duì)理解圖像中像素的對(duì)象類別提供幫助,并且能夠通過(guò)場(chǎng)景信息將圖像像素的類別分類限制在符合場(chǎng)景信息的類別上。(2)通過(guò)... 

【文章來(lái)源】:北方工業(yè)大學(xué)北京市

【文章頁(yè)數(shù)】:60 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

限定場(chǎng)景下圖像語(yǔ)義理解及分割的研究與應(yīng)用


語(yǔ)義分割在醫(yī)學(xué)領(lǐng)域的分割示意圖

結(jié)構(gòu)圖,殘差,結(jié)構(gòu)圖


叫?惶岢。?芯恐蟹⑾鄭??綺?數(shù)的增加并不能持續(xù)地優(yōu)化其性能,相反隨著網(wǎng)絡(luò)的加深,反向傳播的梯度逐漸消失,模型的準(zhǔn)確率開(kāi)始下降,網(wǎng)絡(luò)的收斂速度也大大減慢。2015年,一個(gè)被稱為殘差網(wǎng)絡(luò)[13](ResidualNetwork,ResNet)的特征提取模型由何凱明及其團(tuán)隊(duì)所提出,該網(wǎng)絡(luò)的作者基于計(jì)算機(jī)視覺(jué)領(lǐng)域中的殘差表達(dá)的原理將其應(yīng)用于構(gòu)建CNN的模型。殘差網(wǎng)絡(luò)是由被稱為殘差塊(ResidualBlock)的基本單元構(gòu)成,其的主要特點(diǎn)是在網(wǎng)絡(luò)中添加了跳躍連接,通過(guò)多層卷積之間輸入于輸出之間的殘差來(lái)進(jìn)行特征學(xué)習(xí)。殘差塊的組成如圖1-2所示。實(shí)驗(yàn)中表明殘差結(jié)構(gòu)能夠有效避免梯度消失的問(wèn)題。圖1-2殘差塊結(jié)構(gòu)圖實(shí)際的殘差網(wǎng)絡(luò)中,使用的殘差結(jié)構(gòu)稱為瓶頸結(jié)構(gòu)(BottleNeckBlock),不同數(shù)量的BottleNeckBlock結(jié)合組成殘差網(wǎng)絡(luò)。從淺至深有ResNet18、ResNet34、ResNet50、ResNet101、ResNet152。由于越深的網(wǎng)絡(luò)訓(xùn)練耗時(shí)越長(zhǎng),而淺層網(wǎng)絡(luò)性能有所欠缺,實(shí)際應(yīng)用中常用ResNet50、ResNet101作為特征提取網(wǎng)絡(luò)。1.2.2圖像分割研究現(xiàn)狀在圖像分割的研究領(lǐng)域中,由于卷積神經(jīng)網(wǎng)絡(luò)具有高效率的學(xué)習(xí)性能,受到了眾多學(xué)者的青睞,不僅成為了研究中的熱點(diǎn),并且在實(shí)際中得到了廣泛的應(yīng)用。除卷積神經(jīng)網(wǎng)絡(luò)外,循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)具有能夠通過(guò)處理歷史信息進(jìn)而進(jìn)行建模的特點(diǎn),在一些與時(shí)間序列相關(guān)的問(wèn)題上總會(huì)RNN的身影,因此在圖像處理中RNN通常用于對(duì)圖像的上下文信息進(jìn)行捕獲。傳統(tǒng)模型通常面臨欠擬合或過(guò)擬合的問(wèn)題,生成對(duì)抗網(wǎng)絡(luò)(GenerativeAdversarialNetworks,GAN)通過(guò)生成器和判別器兩個(gè)模型之間的相互對(duì)抗,具有更好的學(xué)習(xí)能力,避免了此類問(wèn)題,因此逐漸在語(yǔ)義分割的研究中流行起來(lái)?傮w上講,

神經(jīng)網(wǎng)絡(luò)模型,神經(jīng)網(wǎng)絡(luò)


第二章語(yǔ)義分割相關(guān)知識(shí)概述9層,同一層內(nèi)結(jié)點(diǎn)相互獨(dú)立。圖2-1簡(jiǎn)易神經(jīng)網(wǎng)絡(luò)模型圖每個(gè)結(jié)點(diǎn)對(duì)應(yīng)的計(jì)算公式如(2-2)所示:{1(2)=(1(2))=(11(1)1+12(1)2+1(1))2(2)=(2(2))=(21(1)1+22(1)2+2(1))3(2)=(3(2))=(31(1)1+32(1)2+3(1))(2-2)輸出層對(duì)應(yīng)計(jì)算公式如(2-3)所示:()=(11(2)1(2)+12(2)2(2)+13(2)3(2)+1(2))(2-3)神經(jīng)網(wǎng)絡(luò)每一層相對(duì)于前一層學(xué)習(xí)到了更多的特征,網(wǎng)絡(luò)因此可以表達(dá)更深層次的特征,能夠更準(zhǔn)確地進(jìn)行預(yù)測(cè)。因此多層神經(jīng)網(wǎng)絡(luò)模型逐漸被普遍運(yùn)用。為了實(shí)現(xiàn)更復(fù)雜的任務(wù),需要提取的特征數(shù)量不斷增加,研究者們?cè)谏窠?jīng)網(wǎng)絡(luò)中不斷堆疊隱藏層,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)走向復(fù)雜化,訓(xùn)練過(guò)程中計(jì)算量大且整體耗時(shí)長(zhǎng)。2.1.2反向傳播神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程實(shí)際上是對(duì)網(wǎng)絡(luò)中的參數(shù)尋求最優(yōu)解的問(wèn)題,通常情況下可由梯度下降法重復(fù)進(jìn)行迭代完成最優(yōu)化過(guò)程。但是因?yàn)樯窠?jīng)網(wǎng)絡(luò)包含多個(gè)神經(jīng)元,對(duì)應(yīng)包含多個(gè)參數(shù),依照鏈?zhǔn)椒▌t計(jì)算每個(gè)參數(shù)的梯度計(jì)算量則過(guò)大。因此,反向傳播方法被應(yīng)用于神經(jīng)網(wǎng)絡(luò)中以解決計(jì)算量過(guò)大的問(wèn)題。反向傳播算法屬于監(jiān)督式算法[24][25]按照網(wǎng)絡(luò)結(jié)構(gòu),反向傳播算法使用鏈?zhǔn)椒▌t從后往前反向計(jì)算出每一層的梯度,根據(jù)梯度自動(dòng)更新網(wǎng)絡(luò)中的權(quán)值和偏差,每一次參數(shù)的變化都將以反向傳播這種方式傳遞送到網(wǎng)絡(luò)各層,這便可以讓網(wǎng)絡(luò)的輸出值逐漸達(dá)到使用者的期望。反向傳播算法兩個(gè)步驟組成:第一步,激勵(lì)傳

【參考文獻(xiàn)】:
期刊論文
[1]基于顏色和空間距離的顯著性區(qū)域固定閾值分割算法[J]. 錢堃,李芳,文益民.  計(jì)算機(jī)科學(xué). 2016(01)
[2]基于HSI和LAB顏色空間的彩色圖像分割[J]. 龐曉敏,閔子建,闞江明.  廣西大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(06)
[3]移動(dòng)機(jī)器人目標(biāo)分割及測(cè)距方法研究[J]. 沈春生,王耀南.  計(jì)算機(jī)工程與應(yīng)用. 2011(23)
[4]Unit-Linking PCNN和圖像熵的彩色圖像分割與邊緣檢測(cè)[J]. 譚穎芳,周冬明,趙東風(fēng),聶仁燦.  計(jì)算機(jī)工程與應(yīng)用. 2009(12)
[5]基于形態(tài)學(xué)梯度重構(gòu)和標(biāo)記提取的分水嶺圖像分割[J]. 王宇,陳殿仁,沈美麗,吳戈.  中國(guó)圖象圖形學(xué)報(bào). 2008(11)
[6]基于區(qū)域生長(zhǎng)法的圖像分割技術(shù)[J]. 陳方昕.  科技信息(科學(xué)教研). 2008(15)
[7]梯度下降法[J]. 劉穎超,張紀(jì)元.  南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 1993(02)



本文編號(hào):2978847

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2978847.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶120fc***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com