基于食材信息的食品圖像識別方法研究
發(fā)布時間:2021-05-23 22:25
食物對人類生活至關(guān)重要,是人們生活的基礎(chǔ)。隨著社交網(wǎng)絡(luò)、移動網(wǎng)絡(luò)和物聯(lián)網(wǎng)的快速發(fā)展,人們通常會上傳、分享、記錄食品圖像、食譜、烹飪視頻和飲食記錄,這樣可以輕松獲得大規(guī)模的食品數(shù)據(jù)。研究人員可以利用這些食品數(shù)據(jù)在食品圖像領(lǐng)域做各種研究,例如食品圖像識別、食品檢索等。食品圖像識別是開展食品推薦、檢索等領(lǐng)域的研究基礎(chǔ),并且有著廣泛的實(shí)際應(yīng)用,如多模態(tài)的食品記錄和個性化的醫(yī)療健康等,因此食品圖像識別越來越受到關(guān)注,F(xiàn)有方法大多數(shù)都是使用深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)直接提取整張圖像的視覺特征來進(jìn)行食品圖像識別,而沒有考慮食品圖像自身的特點(diǎn)。不同于一般的物體圖像,食品圖像通常不具有獨(dú)特的空間布局,而且沒有共同語義部分。因此,直接使用CNN很難捕獲食品圖像判別性信息。隨著移動互聯(lián)網(wǎng)的發(fā)展,用戶不僅上傳大量的食品照片,而且提供豐富的食材信息,就像物體對場景的重要性一樣,食品圖像中的食材對于食品識別同樣非常重要。而且許多研究結(jié)果表明使用語義上有意義的食材可以作為食品圖像識別的屬性信息,它從不同的視角和粒度提供互補(bǔ)性信息來提高食品圖像的識別性能。此外...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院大學(xué)人工智能學(xué)院)北京市
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 技術(shù)挑戰(zhàn)
1.3 本文的研究內(nèi)容與主要貢獻(xiàn)
1.3.1 本文的研究內(nèi)容
1.3.2 本文的主要貢獻(xiàn)
1.4 論文結(jié)構(gòu)安排
第2章 研究現(xiàn)狀概述
2.1 單標(biāo)簽食品圖像識別
2.2 多標(biāo)簽食品圖像識別
2.3 面向移動端的食品圖像識別
2.4 融入上下文信息的食品圖像識別
2.5 小結(jié)
第3章 融合多尺度多視角特征的食品圖像識別
3.1 問題引出
3.2 模型設(shè)計(jì)及實(shí)現(xiàn)
3.2.1 多視角特征融合
3.2.1.1 中層屬性特征
3.2.1.2 高層語義特征
3.2.1.3 深度視覺特征
3.2.2 多尺度特征融合
3.2.3 多尺度多視角特征融合
3.2.4 分析
3.3 實(shí)驗(yàn)驗(yàn)證與分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)
3.3.2 評測指標(biāo)
3.3.3 實(shí)現(xiàn)細(xì)節(jié)
3.3.4 性能分析
3.3.4.1 ETH Food-101的性能分析
3.3.4.2 VireoFood-172和ChineseFoodNet的性能分析
3.3.5 討論
3.4 小結(jié)
第4章 基于級聯(lián)多注意力網(wǎng)絡(luò)的食品圖像識別
4.1 問題引出
4.2 ISIA Food-200數(shù)據(jù)集構(gòu)建
4.3 模型設(shè)計(jì)和實(shí)現(xiàn)
4.3.1 類別信息監(jiān)督的注意力子網(wǎng)絡(luò)
4.3.2 食材信息監(jiān)督的注意力子網(wǎng)絡(luò)
4.3.3 多注意力機(jī)制網(wǎng)絡(luò)
4.3.4 多任務(wù)學(xué)習(xí)
4.3.5 多尺度聯(lián)合表示
4.4 實(shí)驗(yàn)驗(yàn)證與分析
4.4.1 實(shí)驗(yàn)數(shù)據(jù)
4.4.2 評測指標(biāo)
4.4.3 實(shí)現(xiàn)細(xì)節(jié)
4.4.4 性能對比
4.4.5 定性分析和可視化
4.4.6 討論
4.5 小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
作者簡歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
【參考文獻(xiàn)】:
期刊論文
[1]融合三元卷積神經(jīng)網(wǎng)絡(luò)與關(guān)系網(wǎng)絡(luò)的小樣本食品圖像識別[J]. 呂永強(qiáng),閔巍慶,段華,蔣樹強(qiáng). 計(jì)算機(jī)科學(xué). 2020(01)
本文編號:3203069
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院大學(xué)人工智能學(xué)院)北京市
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 技術(shù)挑戰(zhàn)
1.3 本文的研究內(nèi)容與主要貢獻(xiàn)
1.3.1 本文的研究內(nèi)容
1.3.2 本文的主要貢獻(xiàn)
1.4 論文結(jié)構(gòu)安排
第2章 研究現(xiàn)狀概述
2.1 單標(biāo)簽食品圖像識別
2.2 多標(biāo)簽食品圖像識別
2.3 面向移動端的食品圖像識別
2.4 融入上下文信息的食品圖像識別
2.5 小結(jié)
第3章 融合多尺度多視角特征的食品圖像識別
3.1 問題引出
3.2 模型設(shè)計(jì)及實(shí)現(xiàn)
3.2.1 多視角特征融合
3.2.1.1 中層屬性特征
3.2.1.2 高層語義特征
3.2.1.3 深度視覺特征
3.2.2 多尺度特征融合
3.2.3 多尺度多視角特征融合
3.2.4 分析
3.3 實(shí)驗(yàn)驗(yàn)證與分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)
3.3.2 評測指標(biāo)
3.3.3 實(shí)現(xiàn)細(xì)節(jié)
3.3.4 性能分析
3.3.4.1 ETH Food-101的性能分析
3.3.4.2 VireoFood-172和ChineseFoodNet的性能分析
3.3.5 討論
3.4 小結(jié)
第4章 基于級聯(lián)多注意力網(wǎng)絡(luò)的食品圖像識別
4.1 問題引出
4.2 ISIA Food-200數(shù)據(jù)集構(gòu)建
4.3 模型設(shè)計(jì)和實(shí)現(xiàn)
4.3.1 類別信息監(jiān)督的注意力子網(wǎng)絡(luò)
4.3.2 食材信息監(jiān)督的注意力子網(wǎng)絡(luò)
4.3.3 多注意力機(jī)制網(wǎng)絡(luò)
4.3.4 多任務(wù)學(xué)習(xí)
4.3.5 多尺度聯(lián)合表示
4.4 實(shí)驗(yàn)驗(yàn)證與分析
4.4.1 實(shí)驗(yàn)數(shù)據(jù)
4.4.2 評測指標(biāo)
4.4.3 實(shí)現(xiàn)細(xì)節(jié)
4.4.4 性能對比
4.4.5 定性分析和可視化
4.4.6 討論
4.5 小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
作者簡歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
【參考文獻(xiàn)】:
期刊論文
[1]融合三元卷積神經(jīng)網(wǎng)絡(luò)與關(guān)系網(wǎng)絡(luò)的小樣本食品圖像識別[J]. 呂永強(qiáng),閔巍慶,段華,蔣樹強(qiáng). 計(jì)算機(jī)科學(xué). 2020(01)
本文編號:3203069
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3203069.html
最近更新
教材專著