果蔬圖像的混合粒度分類研究
本文關鍵詞:果蔬圖像的混合粒度分類研究,由筆耕文化傳播整理發(fā)布。
【摘要】:近幾年,隨著機器視覺、大數(shù)據(jù)、互聯(lián)網(wǎng)以及人機交互技術的發(fā)展,智能家居領域開始受到廣泛關注,其中以智能冰箱的發(fā)展最為顯著。智能冰箱期望實現(xiàn)食材的保鮮周期、種類、數(shù)量識別以及個性化食譜推薦等智能化食材管理功能。針對這一實際問題,機器視覺研究中的目標檢測、目標分類、目標識別與計數(shù)等方法提供了相應的技術路線。然而,與一般的機器視覺任務不同,這一特定領域的研究需要專門的圖像數(shù)據(jù)庫。因此,本文構建一個新的、層次化結構的果蔬原材料圖像數(shù)據(jù)庫,命名為VegFru數(shù)據(jù)庫。該數(shù)據(jù)庫的類別結構符合人們日常的飲食和烹飪習慣,基本囊括了所有常見的果蔬類別。目前,VegFru數(shù)據(jù)庫包含15大類,200小類蔬菜,10大類,92小類水果。每類包含200張以上自然圖片,整個數(shù)據(jù)庫包含91,117張蔬菜圖片,69,817張水果圖片,總共160,000張以上圖片。針對提出的VegFru數(shù)據(jù)庫,首先進行基本的混合粒度圖像分類研究。為了與其他標準數(shù)據(jù)庫對比,本文分別使用傳統(tǒng)特征模型和卷積神經網(wǎng)絡模型進行分類研究。傳統(tǒng)分類模型使用BOW和SPM相結合的特征提取框架,首先提取多尺度SIFT和CM作為底層特征,分別進行LSA編碼和FV編碼,然后在空間金字塔子區(qū)域內進行最大池化得到圖像的直方圖表示,最后使用線性分類器分別對蔬菜和水果進行分類;卷積神經網(wǎng)絡模型則分別給出VegFru數(shù)據(jù)庫在AlexNet、 CaffeNet以及GoogLeNet三個網(wǎng)絡模型中的分類結果。在基本分類模型的基礎上,本文提出一個基于自上而下注意圖分割的混合粒度圖像分類模型。首先,在卷積神經網(wǎng)絡模型中引入注意信息,檢測和分割出圖像的目標區(qū)域;然后利用分割圖像學習新的網(wǎng)絡模型得到分割網(wǎng)絡,迫使網(wǎng)絡關注圖像的判別性目標區(qū)域,從而得到較優(yōu)的初始化權值;使用原始圖像對分割網(wǎng)絡進行微調,最后得到的分部訓練網(wǎng)絡不僅能夠充分挖掘圖像的目標區(qū)域信息,還能補充分割網(wǎng)絡遺漏的互補信息,進一步提高分類性能。綜上所述,本文在智能家居的應用背景下,構建了一個特定領域的果蔬原材料混合粒度圖像數(shù)據(jù)庫,給出該數(shù)據(jù)庫在傳統(tǒng)特征分類模型與卷積神經網(wǎng)絡模型中的基本分類結果,并提出一個新的利用自上而下注意圖分割的分類模型,進一步提高分類正確率。為基于VegFru數(shù)據(jù)庫的機器視覺技術以及智能冰箱研究提供數(shù)據(jù)來源和技術路線,促進智能家居、機器視覺與智能家居應用相結合的研究和發(fā)展。
【關鍵詞】:智能家居 混合粒度圖像分類 卷積神經網(wǎng)絡 自上而下注意圖 目標分割
【學位授予單位】:中國科學技術大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.41
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第一章 緒論10-22
- 1.1 課題背景10-11
- 1.2 課題研究的目的和意義11-12
- 1.3 國內外研究現(xiàn)狀12-20
- 1.3.1 粗粒度圖像分類的研究現(xiàn)狀12-14
- 1.3.2 細粒度圖像分類的研究現(xiàn)狀14-17
- 1.3.3 混合粒度圖像分類的研究現(xiàn)狀17-20
- 1.4 本課題的目標和主要工作20-21
- 1.5 章節(jié)安排21-22
- 第二章 圖像分類方法概述22-38
- 2.1 傳統(tǒng)方法概述22-24
- 2.2 編碼策略24-31
- 2.2.1 早期編碼方法24-28
- 2.2.2 LSA編碼28
- 2.2.3 FV編碼28-31
- 2.3 池化策略31-32
- 2.4 卷積神經網(wǎng)絡模型32-37
- 2.4.1 基于AlexNet的卷積神經網(wǎng)絡模型35-36
- 2.4.2 基于GoogLeNet的卷積神經網(wǎng)絡模型36-37
- 2.5 本章小結37-38
- 第三章 VegFru圖像數(shù)據(jù)庫38-56
- 3.1 VegFru數(shù)據(jù)庫概述38
- 3.2 數(shù)據(jù)庫結構38-40
- 3.2.1 VegFru層次類別39
- 3.2.2 VegFru分類法39-40
- 3.3 構造數(shù)據(jù)庫40-43
- 3.3.1 構造原則41-42
- 3.3.2 圖像搜集42-43
- 3.3.3 圖像整理43
- 3.3.4 圖像劃分43
- 3.4 VeFru與ImageNet43-46
- 3.4.1 數(shù)據(jù)庫的結構44
- 3.4.2 數(shù)據(jù)庫的分類法44-45
- 3.4.3 圖片的選擇45-46
- 3.5 數(shù)據(jù)庫應用前景和難點46-48
- 3.6 數(shù)據(jù)庫的基本實驗48-54
- 3.6.1 基于傳統(tǒng)特征模型的基本實驗49-50
- 3.6.2 基于卷積神經網(wǎng)絡模型的基本實驗50-54
- 3.7 本章小結54-56
- 第四章 基于自上而下注意圖分割的混合粒度圖像分類56-64
- 4.1 模型概述56-57
- 4.2 自上而下注意圖的生成57-59
- 4.3 基于注意圖的分割模型59-62
- 4.4 混合粒度圖像分類模型62-63
- 4.5 本章小結63-64
- 第五章 總結與展望64-66
- 5.1 總結64-65
- 5.2 展望65-66
- 參考文獻66-72
- 致謝72-74
- 在讀期間發(fā)表的學術論文與取得的科研成果74
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉玉紅;謝正祥;;圖像挖掘技術及醫(yī)學應用[J];中國醫(yī)學物理學雜志;2010年01期
2 曹家瑋;;用圖像說話[J];藝術與設計(理論);2009年08期
3 付普;;讓你的字體和圖像燃燒起來[J];Internet信息世界;1999年03期
4 劉筱霞;轉換圖像模式以適于輸出[J];印刷世界;2003年06期
5 朱薇;劉利剛;;保色調的黑白卡通圖像著色方法[J];計算機輔助設計與圖形學學報;2011年03期
6 許向陽;張旭亮;李博;;基于顏色屬性相關性的圖像色差公式的研究[J];包裝工程;2013年13期
7 潘建初;圖像漫談[J];電腦愛好者;1998年14期
8 王偉,吳玲達,老松楊,王辰;基于示例學習的圖像人臉檢測技術[J];計算機應用研究;2002年03期
9 高彥宇;王新平;尹怡欣;;自然風景圖像情感標識方法研究[J];小型微型計算機系統(tǒng);2011年04期
10 劉毅,劉維獻;多媒體圖像數(shù)據(jù)的獲取與顯示[J];山東電子;1998年04期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 吳楠;李曉曦;宋方敏;;圖像挖掘及其在醫(yī)學圖像分類中的應用[A];2006年全國理論計算機科學學術年會論文集[C];2006年
2 潘海為;謝曉芹;張煒;李建中;;基于ROI的醫(yī)學圖像聚類算法[A];第二十三屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2006年
3 孫華;;Photoshop軟件在眼科領域的應用[A];中華醫(yī)學會第十二屆全國眼科學術大會論文匯編[C];2007年
中國重要報紙全文數(shù)據(jù)庫 前8條
1 重慶 楊清德;寬屏幕電視機圖像模式的選擇[N];電子報;2007年
2 計算機世界實驗室 吳挺;高速中進取[N];計算機世界;2008年
3 山東濰坊學院 年仁德;上好Photoshop的第一節(jié)課圖片欣賞課[N];中國電腦教育報;2004年
4 劉全恩;高清投影機量產 家用市場占兩成[N];中國電子報;2007年
5 eN書蟲;用Photoshop制作燃燒字[N];江蘇經濟報;2000年
6 王林;東芝XV500系列高清首選[N];電子資訊時報;2008年
7 趙軍紅 編譯;手機顯微鏡將在非洲試用[N];科技日報;2010年
8 ;輕松制作電子詞典的開機畫面[N];中國計算機報;2004年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 黃明明;圖像局部特征提取及應用研究[D];北京科技大學;2016年
2 段曼妮;圖像挖掘在圖像檢索中的應用[D];中國科學技術大學;2009年
3 袁承志;風格與象征——魏晉南北朝蓮花圖像研究[D];清華大學;2004年
4 秦昆;基于形式概念分析的圖像數(shù)據(jù)挖掘研究[D];武漢大學;2004年
5 蔡濤;面向目標識別的圖像特征融合提取技術研究[D];中國人民解放軍國防科學技術大學;2000年
6 韓躍平;復雜產品內部結構裝配正確性X射線自動檢測技術研究[D];中北大學;2009年
7 曹建芳;場景圖像情感語義分析關鍵技術研究[D];太原理工大學;2015年
8 徐望明;面向圖像檢索和分類任務的稀疏特征學習[D];武漢科技大學;2013年
9 周海英;基于視覺認知的圖像搜索與識別關鍵技術研究[D];北京科技大學;2015年
10 韓子仲;視象與圖像[D];中國美術學院;2008年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 吳春燕;樹木葉片滯塵量與反射光譜及圖像特征的關系研究[D];中國林業(yè)科學研究院;2015年
2 李娜;基于SAR圖像的海洋油膜分類研究[D];中國石油大學(華東);2014年
3 冀鑫;基于矢量量化與LBP的圖像檢索算法研究[D];太原理工大學;2016年
4 陳之凡;西方圖像的中國形象異化和視覺文化批判[D];武漢紡織大學;2016年
5 馮語姍;果蔬圖像的混合粒度分類研究[D];中國科學技術大學;2016年
6 邱炳瑜;基于內容的圖像收集和地區(qū)代表性圖像選出系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學;2009年
7 史英杰;醫(yī)學圖像輔助診斷系統(tǒng)中圖像分割技術的研究[D];華中科技大學;2007年
8 余昌瑾;圖像挖掘技術研究與應用[D];武漢理工大學;2010年
9 陳思坤;醫(yī)學圖像的自動標注[D];電子科技大學;2011年
10 白玉超;公共圖像對中小學美術教育的影響[D];廣西師范大學;2014年
本文關鍵詞:果蔬圖像的混合粒度分類研究,,由筆耕文化傳播整理發(fā)布。
本文編號:394639
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/394639.html