基于多任務(wù)深度學(xué)習(xí)網(wǎng)絡(luò)的服裝檢測(cè)和搭配方法研究
發(fā)布時(shí)間:2021-07-11 18:46
隨著服裝電子商務(wù)的發(fā)展和大數(shù)據(jù)時(shí)代的來(lái)臨,越來(lái)越多的線下服裝商家開始在電子商務(wù)平臺(tái)上銷售服裝,互聯(lián)網(wǎng)上存儲(chǔ)著海量的服裝數(shù)據(jù),用戶對(duì)自身服裝搭配也越來(lái)越重視。借助海量數(shù)據(jù)和算法為用戶推薦服裝搭配方案,以滿足用戶需求及提升用戶的購(gòu)買欲望,是服裝電商平臺(tái)提升用戶體驗(yàn)和銷量的重要手段。此外,現(xiàn)代社會(huì)中,人們將穿搭視為自己個(gè)性的表達(dá),也更加注重自身服裝搭配。因此研究服裝搭配技術(shù)對(duì)電商平臺(tái)和用戶都有十分重要的意義。本文基于服裝圖像搭配的應(yīng)用背景,將深度學(xué)習(xí)網(wǎng)絡(luò)中的圖像分割模型和時(shí)間序列模型應(yīng)用到服裝搭配上。主要完成以下工作:1.提出殘差結(jié)構(gòu)的遞歸融合模塊,用以改進(jìn)語(yǔ)義分割網(wǎng)絡(luò),能在減少網(wǎng)絡(luò)參數(shù)的同時(shí)提高語(yǔ)義分割的精度。遞歸結(jié)構(gòu)通過(guò)卷積核復(fù)用來(lái)減少卷積核參數(shù)量,殘差結(jié)構(gòu)緩解梯度傳播困難,特征圖融合結(jié)構(gòu)將可視野大小不同的特征圖融合到一起以提高分割精度。并將該模塊應(yīng)用于Mask RCNN實(shí)例分割網(wǎng)絡(luò)的分割分支上,提高了Mask RCNN網(wǎng)絡(luò)的分割性能。2.提出基于Bi-LSTM的服裝搭配網(wǎng)絡(luò),共有三個(gè)模塊組成。a)特征提取模塊分別使用Inception V3提取服裝圖像的低層特征信息和Mask RCNN...
【文章來(lái)源】:東華大學(xué)上海市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
FCN將全連接層轉(zhuǎn)換為全卷積示意圖[11]
第1章緒論4圖1.2FCN“跳躍”結(jié)構(gòu)示意圖[11]DeepLab[19]是谷歌團(tuán)隊(duì)在FCN的基礎(chǔ)上進(jìn)行優(yōu)化的圖像分割方法,該文創(chuàng)新性的將Atrousconvolution(空洞卷積)與SSP(金字塔池化)結(jié)合提出了ASPP(空洞金字塔池化)應(yīng)用到深度卷積模型上,既能改善下采樣后得到的特征圖過(guò)小的問題,又能適應(yīng)多尺度目標(biāo)。經(jīng)過(guò)ASPP池化層的特征圖下采樣了八倍,使用雙線性插值將其恢復(fù)到原圖的尺寸,這種方法簡(jiǎn)單有效地替代了在稠密任務(wù)中的反卷積層,大大提高了運(yùn)算速度,同時(shí)金字塔池化也解決了物體在多尺度圖像中狀態(tài)不同的問題,提高了分割網(wǎng)絡(luò)的魯棒性。其示意圖如下:圖1.3ASPP(空洞金字塔池化)示意圖[19]該文另一個(gè)創(chuàng)新點(diǎn)是結(jié)合了深度卷積神經(jīng)網(wǎng)絡(luò)(DCNNs)和概率圖模型(DenseCRFs)。由于目標(biāo)分類需要空間不變,DCNN的空間準(zhǔn)確性被限制,而DeepLab通過(guò)將DCNNs層的響應(yīng)和完全連接的條件隨機(jī)場(chǎng)(CRFs)結(jié)合來(lái)解決該問題,結(jié)果顯示CRFs能夠產(chǎn)生準(zhǔn)確的分割掩碼并能恢復(fù)目標(biāo)邊緣的細(xì)節(jié)信息。FCN和Deeplab都是像素級(jí)別的語(yǔ)義分割網(wǎng)絡(luò),通過(guò)預(yù)測(cè)圖像中的每個(gè)像素
第1章緒論4圖1.2FCN“跳躍”結(jié)構(gòu)示意圖[11]DeepLab[19]是谷歌團(tuán)隊(duì)在FCN的基礎(chǔ)上進(jìn)行優(yōu)化的圖像分割方法,該文創(chuàng)新性的將Atrousconvolution(空洞卷積)與SSP(金字塔池化)結(jié)合提出了ASPP(空洞金字塔池化)應(yīng)用到深度卷積模型上,既能改善下采樣后得到的特征圖過(guò)小的問題,又能適應(yīng)多尺度目標(biāo)。經(jīng)過(guò)ASPP池化層的特征圖下采樣了八倍,使用雙線性插值將其恢復(fù)到原圖的尺寸,這種方法簡(jiǎn)單有效地替代了在稠密任務(wù)中的反卷積層,大大提高了運(yùn)算速度,同時(shí)金字塔池化也解決了物體在多尺度圖像中狀態(tài)不同的問題,提高了分割網(wǎng)絡(luò)的魯棒性。其示意圖如下:圖1.3ASPP(空洞金字塔池化)示意圖[19]該文另一個(gè)創(chuàng)新點(diǎn)是結(jié)合了深度卷積神經(jīng)網(wǎng)絡(luò)(DCNNs)和概率圖模型(DenseCRFs)。由于目標(biāo)分類需要空間不變,DCNN的空間準(zhǔn)確性被限制,而DeepLab通過(guò)將DCNNs層的響應(yīng)和完全連接的條件隨機(jī)場(chǎng)(CRFs)結(jié)合來(lái)解決該問題,結(jié)果顯示CRFs能夠產(chǎn)生準(zhǔn)確的分割掩碼并能恢復(fù)目標(biāo)邊緣的細(xì)節(jié)信息。FCN和Deeplab都是像素級(jí)別的語(yǔ)義分割網(wǎng)絡(luò),通過(guò)預(yù)測(cè)圖像中的每個(gè)像素
【參考文獻(xiàn)】:
期刊論文
[1]基于極速學(xué)習(xí)機(jī)的服裝搭配智能推薦系統(tǒng)設(shè)計(jì)[J]. 杜丹,張千惠. 中國(guó)科技信息. 2012(17)
碩士論文
[1]基于模糊粗集等價(jià)聚類的不確定性屬性約簡(jiǎn)及其在服裝搭配上的應(yīng)用[D]. 徐略輝.東華大學(xué) 2008
本文編號(hào):3278647
【文章來(lái)源】:東華大學(xué)上海市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
FCN將全連接層轉(zhuǎn)換為全卷積示意圖[11]
第1章緒論4圖1.2FCN“跳躍”結(jié)構(gòu)示意圖[11]DeepLab[19]是谷歌團(tuán)隊(duì)在FCN的基礎(chǔ)上進(jìn)行優(yōu)化的圖像分割方法,該文創(chuàng)新性的將Atrousconvolution(空洞卷積)與SSP(金字塔池化)結(jié)合提出了ASPP(空洞金字塔池化)應(yīng)用到深度卷積模型上,既能改善下采樣后得到的特征圖過(guò)小的問題,又能適應(yīng)多尺度目標(biāo)。經(jīng)過(guò)ASPP池化層的特征圖下采樣了八倍,使用雙線性插值將其恢復(fù)到原圖的尺寸,這種方法簡(jiǎn)單有效地替代了在稠密任務(wù)中的反卷積層,大大提高了運(yùn)算速度,同時(shí)金字塔池化也解決了物體在多尺度圖像中狀態(tài)不同的問題,提高了分割網(wǎng)絡(luò)的魯棒性。其示意圖如下:圖1.3ASPP(空洞金字塔池化)示意圖[19]該文另一個(gè)創(chuàng)新點(diǎn)是結(jié)合了深度卷積神經(jīng)網(wǎng)絡(luò)(DCNNs)和概率圖模型(DenseCRFs)。由于目標(biāo)分類需要空間不變,DCNN的空間準(zhǔn)確性被限制,而DeepLab通過(guò)將DCNNs層的響應(yīng)和完全連接的條件隨機(jī)場(chǎng)(CRFs)結(jié)合來(lái)解決該問題,結(jié)果顯示CRFs能夠產(chǎn)生準(zhǔn)確的分割掩碼并能恢復(fù)目標(biāo)邊緣的細(xì)節(jié)信息。FCN和Deeplab都是像素級(jí)別的語(yǔ)義分割網(wǎng)絡(luò),通過(guò)預(yù)測(cè)圖像中的每個(gè)像素
第1章緒論4圖1.2FCN“跳躍”結(jié)構(gòu)示意圖[11]DeepLab[19]是谷歌團(tuán)隊(duì)在FCN的基礎(chǔ)上進(jìn)行優(yōu)化的圖像分割方法,該文創(chuàng)新性的將Atrousconvolution(空洞卷積)與SSP(金字塔池化)結(jié)合提出了ASPP(空洞金字塔池化)應(yīng)用到深度卷積模型上,既能改善下采樣后得到的特征圖過(guò)小的問題,又能適應(yīng)多尺度目標(biāo)。經(jīng)過(guò)ASPP池化層的特征圖下采樣了八倍,使用雙線性插值將其恢復(fù)到原圖的尺寸,這種方法簡(jiǎn)單有效地替代了在稠密任務(wù)中的反卷積層,大大提高了運(yùn)算速度,同時(shí)金字塔池化也解決了物體在多尺度圖像中狀態(tài)不同的問題,提高了分割網(wǎng)絡(luò)的魯棒性。其示意圖如下:圖1.3ASPP(空洞金字塔池化)示意圖[19]該文另一個(gè)創(chuàng)新點(diǎn)是結(jié)合了深度卷積神經(jīng)網(wǎng)絡(luò)(DCNNs)和概率圖模型(DenseCRFs)。由于目標(biāo)分類需要空間不變,DCNN的空間準(zhǔn)確性被限制,而DeepLab通過(guò)將DCNNs層的響應(yīng)和完全連接的條件隨機(jī)場(chǎng)(CRFs)結(jié)合來(lái)解決該問題,結(jié)果顯示CRFs能夠產(chǎn)生準(zhǔn)確的分割掩碼并能恢復(fù)目標(biāo)邊緣的細(xì)節(jié)信息。FCN和Deeplab都是像素級(jí)別的語(yǔ)義分割網(wǎng)絡(luò),通過(guò)預(yù)測(cè)圖像中的每個(gè)像素
【參考文獻(xiàn)】:
期刊論文
[1]基于極速學(xué)習(xí)機(jī)的服裝搭配智能推薦系統(tǒng)設(shè)計(jì)[J]. 杜丹,張千惠. 中國(guó)科技信息. 2012(17)
碩士論文
[1]基于模糊粗集等價(jià)聚類的不確定性屬性約簡(jiǎn)及其在服裝搭配上的應(yīng)用[D]. 徐略輝.東華大學(xué) 2008
本文編號(hào):3278647
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3278647.html
最近更新
教材專著