基于語義分割的食品標(biāo)簽文本檢測
發(fā)布時間:2021-11-29 10:10
食品包裝上的標(biāo)簽文本含有生產(chǎn)日期、營養(yǎng)成分、生產(chǎn)廠家等食品相關(guān)信息,這些不僅為消費者購買食品提供了重要依據(jù),也有助于食品監(jiān)督抽檢機構(gòu)發(fā)現(xiàn)潛在的食品安全問題。食品標(biāo)簽文本檢測是食品標(biāo)簽自動識別的前提,有助于降低人工錄入成本、提高數(shù)據(jù)處理效率;谑称钒b圖像構(gòu)建數(shù)據(jù)集,提出了一種基于語義分割的距離場模型,以檢測食品標(biāo)簽。該模型包含像素分類和距離場回歸兩類任務(wù),其中像素分類任務(wù)分割處理圖像中的文本區(qū)域,距離場回歸任務(wù)預(yù)測文本區(qū)域內(nèi)的像素點到該區(qū)域邊界的歸一化距離。為提升模型的檢測性能,在回歸預(yù)測模塊中通過增加注意力模塊優(yōu)化模型結(jié)構(gòu),并針對距離場回歸任務(wù)損失值過小、影響模型訓(xùn)練優(yōu)化問題對其損失函數(shù)進(jìn)行了改進(jìn)。消融實驗結(jié)果表明,增加注意力模塊和損失函數(shù)的改進(jìn)使得模型的準(zhǔn)確率分別提高了4.39、3.80個百分點,有效提高了檢測準(zhǔn)確率。食品包裝圖像數(shù)據(jù)集的對比實驗表明,采用本文模型檢測食品標(biāo)簽文本具有較好的性能,其召回率、準(zhǔn)確率分別達(dá)到87.61%、76.50%。
【文章來源】:農(nóng)業(yè)機械學(xué)報. 2020,51(08)北大核心EICSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
基于語義分割的距離場模型檢測流程
針對食品包裝圖像中的標(biāo)簽文本檢測,提出一種基于語義分割的距離場模型(Semantic segmentation based distance field model,DFM),該模型包含像素分類任務(wù)和距離場回歸任務(wù)。DFM能夠根據(jù)神經(jīng)網(wǎng)絡(luò)模型預(yù)測圖像中文本區(qū)域內(nèi)像素點至其邊界的歸一化距離以及文本與背景分割圖。為了有效利用像素分類任務(wù)與距離場回歸任務(wù)之間存在的聯(lián)系以提升模型的檢測效果,在回歸預(yù)測模塊中增加了注意力模塊,并且針對距離場回歸任務(wù)損失值過小導(dǎo)致模型訓(xùn)練優(yōu)化不佳的問題,對其損失函數(shù)提出改進(jìn),以提高模型的預(yù)測準(zhǔn)確率。最后根據(jù)DFM兩類任務(wù)的預(yù)測結(jié)果利用擴展分組算法獲得食品包裝的標(biāo)簽文本區(qū)域。2.1 模型框架
如圖3所示,將ResNet-50網(wǎng)絡(luò)中不同階段得到語義特征f1、f2、f3和f4通過卷積和上采樣運算得到不同維度融合特征P1、P2、P3和P4,其計算方式為式中Up×s———s倍上采樣函數(shù)
【參考文獻(xiàn)】:
期刊論文
[1]農(nóng)業(yè)信息成像感知與深度學(xué)習(xí)應(yīng)用研究進(jìn)展[J]. 孫紅,李松,李民贊,劉豪杰,喬浪,張瑤. 農(nóng)業(yè)機械學(xué)報. 2020(05)
[2]基于深度學(xué)習(xí)的自然場景文本檢測與識別綜述[J]. 王建新,王子亞,田萱. 軟件學(xué)報. 2020(05)
[3]食品安全大數(shù)據(jù)的融合及分類技術(shù)綜述[J]. 張素智,陳小妮,李鵬輝,楊芮,蔡強. 計算機技術(shù)與發(fā)展. 2020(02)
[4]基于深度學(xué)習(xí)的圖像語義分割方法綜述[J]. 田萱,王亮,丁琪. 軟件學(xué)報. 2019(02)
[5]食品安全監(jiān)督存在的問題與解決措施分析[J]. 袁云. 食品安全導(dǎo)刊. 2018(06)
本文編號:3526320
【文章來源】:農(nóng)業(yè)機械學(xué)報. 2020,51(08)北大核心EICSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
基于語義分割的距離場模型檢測流程
針對食品包裝圖像中的標(biāo)簽文本檢測,提出一種基于語義分割的距離場模型(Semantic segmentation based distance field model,DFM),該模型包含像素分類任務(wù)和距離場回歸任務(wù)。DFM能夠根據(jù)神經(jīng)網(wǎng)絡(luò)模型預(yù)測圖像中文本區(qū)域內(nèi)像素點至其邊界的歸一化距離以及文本與背景分割圖。為了有效利用像素分類任務(wù)與距離場回歸任務(wù)之間存在的聯(lián)系以提升模型的檢測效果,在回歸預(yù)測模塊中增加了注意力模塊,并且針對距離場回歸任務(wù)損失值過小導(dǎo)致模型訓(xùn)練優(yōu)化不佳的問題,對其損失函數(shù)提出改進(jìn),以提高模型的預(yù)測準(zhǔn)確率。最后根據(jù)DFM兩類任務(wù)的預(yù)測結(jié)果利用擴展分組算法獲得食品包裝的標(biāo)簽文本區(qū)域。2.1 模型框架
如圖3所示,將ResNet-50網(wǎng)絡(luò)中不同階段得到語義特征f1、f2、f3和f4通過卷積和上采樣運算得到不同維度融合特征P1、P2、P3和P4,其計算方式為式中Up×s———s倍上采樣函數(shù)
【參考文獻(xiàn)】:
期刊論文
[1]農(nóng)業(yè)信息成像感知與深度學(xué)習(xí)應(yīng)用研究進(jìn)展[J]. 孫紅,李松,李民贊,劉豪杰,喬浪,張瑤. 農(nóng)業(yè)機械學(xué)報. 2020(05)
[2]基于深度學(xué)習(xí)的自然場景文本檢測與識別綜述[J]. 王建新,王子亞,田萱. 軟件學(xué)報. 2020(05)
[3]食品安全大數(shù)據(jù)的融合及分類技術(shù)綜述[J]. 張素智,陳小妮,李鵬輝,楊芮,蔡強. 計算機技術(shù)與發(fā)展. 2020(02)
[4]基于深度學(xué)習(xí)的圖像語義分割方法綜述[J]. 田萱,王亮,丁琪. 軟件學(xué)報. 2019(02)
[5]食品安全監(jiān)督存在的問題與解決措施分析[J]. 袁云. 食品安全導(dǎo)刊. 2018(06)
本文編號:3526320
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3526320.html
最近更新
教材專著