基于深度學(xué)習(xí)的商品檢測(cè)算法研究
發(fā)布時(shí)間:2021-08-16 12:17
無(wú)人超市消費(fèi)便利、方便高效,逐漸成為一種新興的購(gòu)物方式。與傳統(tǒng)超市的自助掃碼結(jié)算方式不同,無(wú)人超市的結(jié)算過(guò)程發(fā)生在購(gòu)物動(dòng)作結(jié)束的同時(shí),更加快捷。因此,準(zhǔn)確檢測(cè)出無(wú)人超市環(huán)境下購(gòu)物過(guò)程中的商品信息對(duì)于實(shí)時(shí)掌握商品銷售情況、提供更好的客戶購(gòu)物體驗(yàn)等都至關(guān)重要。根據(jù)普通人的購(gòu)物習(xí)慣,通過(guò)對(duì)手部所持商品進(jìn)行檢測(cè),即可實(shí)現(xiàn)對(duì)客戶購(gòu)物情況等信息的獲取。本文基于計(jì)算機(jī)視覺技術(shù)和深度學(xué)習(xí)理論,從多目標(biāo)商品檢測(cè)、單目標(biāo)背景下的手持商品識(shí)別和多目標(biāo)背景下的手持商品檢測(cè)等方面進(jìn)行了研究,主要研究?jī)?nèi)容如下:1.針對(duì)目前缺乏多目標(biāo)背景下的手持商品檢測(cè)數(shù)據(jù)集的問(wèn)題,本文以模擬的無(wú)人超市商品貨架為背景,10種商品為檢測(cè)目標(biāo),構(gòu)建了同時(shí)包含彩色圖像和深度圖像的數(shù)據(jù)集,適用于多目標(biāo)商品檢測(cè)和多目標(biāo)背景下的手持商品檢測(cè)。2.研究了深度學(xué)習(xí)目標(biāo)檢測(cè)結(jié)構(gòu)Faster R-CNN,構(gòu)建了多目標(biāo)商品檢測(cè)模型。針對(duì)Kinect人體關(guān)鍵點(diǎn)檢測(cè)方法在身體發(fā)生遮擋時(shí)容易產(chǎn)生骨架錯(cuò)亂的現(xiàn)象,研究了基于CPMs模型的人體關(guān)鍵點(diǎn)檢測(cè)方法,通過(guò)獲取圖像的紋理信息和關(guān)節(jié)點(diǎn)置信圖的空間信息得到關(guān)節(jié)點(diǎn)位置,為實(shí)現(xiàn)手持商品檢測(cè)模型提供支持。3.針對(duì)單目...
【文章來(lái)源】:西安建筑科技大學(xué)陜西省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
0類商品實(shí)例示例
西安建筑科技大學(xué)碩士學(xué)位論文15GrabCutCropandResize樣本貼圖圖2.6訓(xùn)練數(shù)據(jù)構(gòu)建流程1)原始樣本采集從不同角度對(duì)圖2.5所示的10種常見飲品實(shí)例進(jìn)行拍攝獲得視頻數(shù)據(jù)。相關(guān)拍攝情況如下:(1)攝像頭在距離目標(biāo)對(duì)象1米的距離進(jìn)行拍攝;(2)攝像機(jī)分別從平視、俯視45°和仰視45°的角度進(jìn)行拍攝;(3)攝像機(jī)的每個(gè)角度都分別對(duì)目標(biāo)的0°(以商品正面商標(biāo)為0°)到180°進(jìn)行拍攝,之后掉轉(zhuǎn)目標(biāo)方向再拍攝一次。由于在視頻拍攝過(guò)程中允許商品產(chǎn)生運(yùn)動(dòng),因此對(duì)視頻進(jìn)行抽幀操作后提取出的圖像中同時(shí)包含有清晰和模糊的圖像。采集的原始樣本圖像如圖2.7所示。圖2.7原始樣本圖像示例最終抽取出的圖像中,每個(gè)類別商品大約36張左右,包含有目標(biāo)對(duì)象的各個(gè)角度。10類商品共獲得324張?jiān)紙D像,采用labelImg[50]將原始圖像標(biāo)注為VOC2007[51]格式,得到包含位置和類別信息的標(biāo)注文件。2)目標(biāo)對(duì)象分割在進(jìn)行樣本圖像貼圖之前,需要對(duì)粘貼的目標(biāo)對(duì)象進(jìn)行分割,本文采用GrabCut[52]算法對(duì)目標(biāo)圖像進(jìn)行分割。GrabCut是圖像分割的常用算法,是GraphCut算法[53]的改進(jìn)。該算法利用圖
西安建筑科技大學(xué)碩士學(xué)位論文16像中的紋理(顏色)信息和邊界(反差)信息來(lái)區(qū)分前景和背景,算法思想是將整幅圖像映射為s-t網(wǎng)絡(luò)圖,如圖2.8所示,圖中的源點(diǎn)和分別指前景和背景的終點(diǎn)。圖2.8s-t網(wǎng)絡(luò)圖可根據(jù)人為畫框的方式選定前景和背景范圍,即進(jìn)行算法初始化操作。之后分別構(gòu)建前景和背景的高斯混合模型,并采用-均值聚類[54]進(jìn)行初始化操作。通過(guò)計(jì)算各相鄰節(jié)點(diǎn)之間的距離獲得分割的能量權(quán)重值,構(gòu)造未知區(qū)的s-t網(wǎng)絡(luò)圖,最后以最大流-最小割算法進(jìn)行切分。GrabCut算法通過(guò)不斷更新和修正高斯混合模型參數(shù)使之趨于收斂來(lái)實(shí)現(xiàn)分割,即使Gibbs能量函數(shù)[55]逐漸減少,最終收斂。在本文中,使用標(biāo)注數(shù)據(jù)中的位置信息進(jìn)行初始化。對(duì)原始樣本圖像進(jìn)行分割后得到如圖2.9所示樣本前景圖像及其對(duì)應(yīng)的mask圖像。(a)前景圖像(b)mask圖2.9樣本前景圖像及其對(duì)應(yīng)的mask圖像3)樣本圖像貼圖在保留前景圖像和對(duì)應(yīng)mask圖像不同大小的原尺寸情況下,對(duì)前景圖像及其對(duì)應(yīng)的mask圖像同時(shí)進(jìn)行縮放,縮放規(guī)則為分別縮放到短邊長(zhǎng)為15像素、30像素、60像素和100像素;谏厦嫔傻母鞒叽绲那熬皹颖緢D像及其對(duì)應(yīng)的mask圖像,我們隨機(jī)選取
【參考文獻(xiàn)】:
期刊論文
[1]基于區(qū)域分割的混合地震預(yù)測(cè)算法[J]. 周天祥,董紅斌,周雯. 計(jì)算機(jī)工程. 2019(09)
[2]基于最優(yōu)k均值聚類的時(shí)空動(dòng)態(tài)背景模型[J]. 舒浩浩,陳盛雙,李石君. 小型微型計(jì)算機(jī)系統(tǒng). 2019(02)
[3]基于自動(dòng)種子區(qū)域生長(zhǎng)的超聲B圖像缺陷分割方法[J]. 倪豪,鄭慧峰,王月兵,呼劉晨,曹永剛,張凱. 計(jì)量學(xué)報(bào). 2018(06)
[4]融合深度信息的Grabcut自動(dòng)圖像分割[J]. 劉輝,石小龍,漆坤元,左星. 小型微型計(jì)算機(jī)系統(tǒng). 2018(10)
[5]改進(jìn)的基于深度學(xué)習(xí)的遙感圖像分類算法[J]. 王鑫,李可,徐明君,寧晨. 計(jì)算機(jī)應(yīng)用. 2019(02)
[6]Faster R-CNN在工業(yè)CT圖像缺陷檢測(cè)中的應(yīng)用[J]. 常海濤,茍軍年,李曉梅. 中國(guó)圖象圖形學(xué)報(bào). 2018(07)
[7]基于SAD算法的立體匹配的實(shí)現(xiàn)[J]. 岳陳平,孟麗婭. 微型機(jī)與應(yīng)用. 2013(06)
[8]一種基于邊緣與區(qū)域信息的先驗(yàn)水平集圖像分割方法[J]. 王斌,李潔,高新波. 計(jì)算機(jī)學(xué)報(bào). 2012(05)
[9]基于分裂合并法和Ncut法的圖像分割[J]. 邵健萍,陳麗芳. 江南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(05)
[10]一種基于區(qū)域Gibbs勢(shì)能函數(shù)的視頻運(yùn)動(dòng)對(duì)象分割算法[J]. 包紅強(qiáng),張兆揚(yáng). 通信學(xué)報(bào). 2005(06)
博士論文
[1]基于數(shù)據(jù)挖掘方法的長(zhǎng)春地區(qū)40歲以上人群2型糖尿病非侵入性風(fēng)險(xiǎn)評(píng)分研究[D]. 劉玉佳.吉林大學(xué) 2018
[2]基于特征學(xué)習(xí)的無(wú)約束環(huán)境下的人臉識(shí)別研究[D]. 田雷.北京郵電大學(xué) 2018
[3]視覺顯著性計(jì)算及其應(yīng)用研究[D]. 楊軍.華南理工大學(xué) 2014
碩士論文
[1]基于深度學(xué)習(xí)的變電設(shè)備圖像特征提取[D]. 陳旭.南京郵電大學(xué) 2018
[2]基于復(fù)合神經(jīng)網(wǎng)絡(luò)的開放域問(wèn)題分類方法研究與實(shí)現(xiàn)[D]. 周忠誠(chéng).國(guó)防科學(xué)技術(shù)大學(xué) 2017
[3]基于多特征融合的商品圖像分類[D]. 余健.西南交通大學(xué) 2013
[4]基于數(shù)據(jù)挖掘的復(fù)雜仿真數(shù)據(jù)分析方法研究[D]. 田萌.哈爾濱工業(yè)大學(xué) 2010
本文編號(hào):3345657
【文章來(lái)源】:西安建筑科技大學(xué)陜西省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
0類商品實(shí)例示例
西安建筑科技大學(xué)碩士學(xué)位論文15GrabCutCropandResize樣本貼圖圖2.6訓(xùn)練數(shù)據(jù)構(gòu)建流程1)原始樣本采集從不同角度對(duì)圖2.5所示的10種常見飲品實(shí)例進(jìn)行拍攝獲得視頻數(shù)據(jù)。相關(guān)拍攝情況如下:(1)攝像頭在距離目標(biāo)對(duì)象1米的距離進(jìn)行拍攝;(2)攝像機(jī)分別從平視、俯視45°和仰視45°的角度進(jìn)行拍攝;(3)攝像機(jī)的每個(gè)角度都分別對(duì)目標(biāo)的0°(以商品正面商標(biāo)為0°)到180°進(jìn)行拍攝,之后掉轉(zhuǎn)目標(biāo)方向再拍攝一次。由于在視頻拍攝過(guò)程中允許商品產(chǎn)生運(yùn)動(dòng),因此對(duì)視頻進(jìn)行抽幀操作后提取出的圖像中同時(shí)包含有清晰和模糊的圖像。采集的原始樣本圖像如圖2.7所示。圖2.7原始樣本圖像示例最終抽取出的圖像中,每個(gè)類別商品大約36張左右,包含有目標(biāo)對(duì)象的各個(gè)角度。10類商品共獲得324張?jiān)紙D像,采用labelImg[50]將原始圖像標(biāo)注為VOC2007[51]格式,得到包含位置和類別信息的標(biāo)注文件。2)目標(biāo)對(duì)象分割在進(jìn)行樣本圖像貼圖之前,需要對(duì)粘貼的目標(biāo)對(duì)象進(jìn)行分割,本文采用GrabCut[52]算法對(duì)目標(biāo)圖像進(jìn)行分割。GrabCut是圖像分割的常用算法,是GraphCut算法[53]的改進(jìn)。該算法利用圖
西安建筑科技大學(xué)碩士學(xué)位論文16像中的紋理(顏色)信息和邊界(反差)信息來(lái)區(qū)分前景和背景,算法思想是將整幅圖像映射為s-t網(wǎng)絡(luò)圖,如圖2.8所示,圖中的源點(diǎn)和分別指前景和背景的終點(diǎn)。圖2.8s-t網(wǎng)絡(luò)圖可根據(jù)人為畫框的方式選定前景和背景范圍,即進(jìn)行算法初始化操作。之后分別構(gòu)建前景和背景的高斯混合模型,并采用-均值聚類[54]進(jìn)行初始化操作。通過(guò)計(jì)算各相鄰節(jié)點(diǎn)之間的距離獲得分割的能量權(quán)重值,構(gòu)造未知區(qū)的s-t網(wǎng)絡(luò)圖,最后以最大流-最小割算法進(jìn)行切分。GrabCut算法通過(guò)不斷更新和修正高斯混合模型參數(shù)使之趨于收斂來(lái)實(shí)現(xiàn)分割,即使Gibbs能量函數(shù)[55]逐漸減少,最終收斂。在本文中,使用標(biāo)注數(shù)據(jù)中的位置信息進(jìn)行初始化。對(duì)原始樣本圖像進(jìn)行分割后得到如圖2.9所示樣本前景圖像及其對(duì)應(yīng)的mask圖像。(a)前景圖像(b)mask圖2.9樣本前景圖像及其對(duì)應(yīng)的mask圖像3)樣本圖像貼圖在保留前景圖像和對(duì)應(yīng)mask圖像不同大小的原尺寸情況下,對(duì)前景圖像及其對(duì)應(yīng)的mask圖像同時(shí)進(jìn)行縮放,縮放規(guī)則為分別縮放到短邊長(zhǎng)為15像素、30像素、60像素和100像素;谏厦嫔傻母鞒叽绲那熬皹颖緢D像及其對(duì)應(yīng)的mask圖像,我們隨機(jī)選取
【參考文獻(xiàn)】:
期刊論文
[1]基于區(qū)域分割的混合地震預(yù)測(cè)算法[J]. 周天祥,董紅斌,周雯. 計(jì)算機(jī)工程. 2019(09)
[2]基于最優(yōu)k均值聚類的時(shí)空動(dòng)態(tài)背景模型[J]. 舒浩浩,陳盛雙,李石君. 小型微型計(jì)算機(jī)系統(tǒng). 2019(02)
[3]基于自動(dòng)種子區(qū)域生長(zhǎng)的超聲B圖像缺陷分割方法[J]. 倪豪,鄭慧峰,王月兵,呼劉晨,曹永剛,張凱. 計(jì)量學(xué)報(bào). 2018(06)
[4]融合深度信息的Grabcut自動(dòng)圖像分割[J]. 劉輝,石小龍,漆坤元,左星. 小型微型計(jì)算機(jī)系統(tǒng). 2018(10)
[5]改進(jìn)的基于深度學(xué)習(xí)的遙感圖像分類算法[J]. 王鑫,李可,徐明君,寧晨. 計(jì)算機(jī)應(yīng)用. 2019(02)
[6]Faster R-CNN在工業(yè)CT圖像缺陷檢測(cè)中的應(yīng)用[J]. 常海濤,茍軍年,李曉梅. 中國(guó)圖象圖形學(xué)報(bào). 2018(07)
[7]基于SAD算法的立體匹配的實(shí)現(xiàn)[J]. 岳陳平,孟麗婭. 微型機(jī)與應(yīng)用. 2013(06)
[8]一種基于邊緣與區(qū)域信息的先驗(yàn)水平集圖像分割方法[J]. 王斌,李潔,高新波. 計(jì)算機(jī)學(xué)報(bào). 2012(05)
[9]基于分裂合并法和Ncut法的圖像分割[J]. 邵健萍,陳麗芳. 江南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(05)
[10]一種基于區(qū)域Gibbs勢(shì)能函數(shù)的視頻運(yùn)動(dòng)對(duì)象分割算法[J]. 包紅強(qiáng),張兆揚(yáng). 通信學(xué)報(bào). 2005(06)
博士論文
[1]基于數(shù)據(jù)挖掘方法的長(zhǎng)春地區(qū)40歲以上人群2型糖尿病非侵入性風(fēng)險(xiǎn)評(píng)分研究[D]. 劉玉佳.吉林大學(xué) 2018
[2]基于特征學(xué)習(xí)的無(wú)約束環(huán)境下的人臉識(shí)別研究[D]. 田雷.北京郵電大學(xué) 2018
[3]視覺顯著性計(jì)算及其應(yīng)用研究[D]. 楊軍.華南理工大學(xué) 2014
碩士論文
[1]基于深度學(xué)習(xí)的變電設(shè)備圖像特征提取[D]. 陳旭.南京郵電大學(xué) 2018
[2]基于復(fù)合神經(jīng)網(wǎng)絡(luò)的開放域問(wèn)題分類方法研究與實(shí)現(xiàn)[D]. 周忠誠(chéng).國(guó)防科學(xué)技術(shù)大學(xué) 2017
[3]基于多特征融合的商品圖像分類[D]. 余健.西南交通大學(xué) 2013
[4]基于數(shù)據(jù)挖掘的復(fù)雜仿真數(shù)據(jù)分析方法研究[D]. 田萌.哈爾濱工業(yè)大學(xué) 2010
本文編號(hào):3345657
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3345657.html
最近更新
教材專著