天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

圖像場(chǎng)景識(shí)別的特征研究

發(fā)布時(shí)間:2017-09-28 20:00

  本文關(guān)鍵詞:圖像場(chǎng)景識(shí)別的特征研究


  更多相關(guān)文章: 圖像場(chǎng)景識(shí)別 LDA(Latent Dirichlet Allocation) 主題特征 目標(biāo)屬性特征 稀疏編碼 空間金字塔


【摘要】:圖像場(chǎng)景識(shí)別是根據(jù)場(chǎng)景相似性對(duì)圖像進(jìn)行分類(lèi)。人類(lèi)在完成場(chǎng)景識(shí)別時(shí)需要深刻理解圖像從而形成高層次的抽象概念,而計(jì)算機(jī)則是直接面向圖像的數(shù)字存儲(chǔ)形式做出判斷。人所理解的“概念相似性”與計(jì)算機(jī)理解的“數(shù)字存儲(chǔ)形式相似性”之間的“語(yǔ)義鴻溝”(Semantic Gap)是圖像場(chǎng)景識(shí)別面臨的重要問(wèn)題之一。提取高層次的特征從而深度挖掘圖像中的信息可以有效跨越“語(yǔ)義鴻溝”,提高識(shí)別準(zhǔn)確率。 圍繞用于圖像場(chǎng)景識(shí)別的特征研究,論文的主要研究工作如下: 1.提出了一種可高效提取和分類(lèi)的主題特征(Efficient Topic Feature,E-TF)。目前常見(jiàn)的使用主題模型表達(dá)新圖像時(shí)需要進(jìn)行主題潛變量推理,因此計(jì)算量較大,同時(shí)由于主題建模時(shí)需要已知標(biāo)簽從而造成標(biāo)簽和特征的耦合。為解決該問(wèn)題,使用潛在狄利克雷分配(Latent Dirichlet Allocation,LDA)模型的潛變量及其學(xué)習(xí)算法構(gòu)造了一種主題表示,并通過(guò)主題模型的潛變量進(jìn)一步提出了可高效提取和分類(lèi)的主題特征。該主題特征在所有類(lèi)別中共享主題空間,提取過(guò)程無(wú)需類(lèi)別標(biāo)簽,從而避免了特征與標(biāo)簽的耦合;對(duì)圖像碼字進(jìn)行簡(jiǎn)單的線(xiàn)性映射即可完成E-TF的提取,從而大幅減小了計(jì)算量。通過(guò)類(lèi)似的實(shí)驗(yàn)條件對(duì)比了其它三種相似特征,并在15-Scenes數(shù)據(jù)集上對(duì)比了pooling方法,,結(jié)果表明E-TF可以獲得更高的識(shí)別準(zhǔn)確率。 2.提出了低維目標(biāo)屬性(Low Dimensionality Object Bank,LD-OB)特征。目標(biāo)屬性特征是圖像的一種高層特征,具有很高的識(shí)別準(zhǔn)確率,然而其維度過(guò)高導(dǎo)致分類(lèi)運(yùn)算的計(jì)算量過(guò)大,現(xiàn)有的降維方法不能兼顧大幅降低維度與提高識(shí)別率兩個(gè)指標(biāo)。針對(duì)該問(wèn)題,提出一種低維目標(biāo)屬性特征,通過(guò)pooling方法簡(jiǎn)化目標(biāo)屬性特征的模式從而大幅降低了維度,并且采用兩個(gè)優(yōu)化策略提高識(shí)別準(zhǔn)確率。為了驗(yàn)證LD-OB特征的有效性,在三個(gè)真實(shí)場(chǎng)景數(shù)據(jù)集上對(duì)其進(jìn)行了評(píng)估:事件類(lèi)UIUC-Sports數(shù)據(jù)集、自然場(chǎng)景LabelMe數(shù)據(jù)集、室內(nèi)室外混合場(chǎng)景15-Scenes數(shù)據(jù)集。實(shí)驗(yàn)結(jié)果表明,LD-OB特征不僅可以顯著降低目標(biāo)屬性特征的維度,且具有更高的識(shí)別準(zhǔn)確率。計(jì)算復(fù)雜度的分析表明該特征可以有效降低分類(lèi)的時(shí)間復(fù)雜度。 3.提出了一種基于快速稀疏編碼(Fast Sparse Coding,F(xiàn)-SC)的中間層特征。稀疏編碼的詞典學(xué)習(xí)需要詞典更新步驟和碼字分配步驟兩個(gè)凸優(yōu)化問(wèn)題解的相互迭代,因此具有很大的計(jì)算量。為了對(duì)詞典學(xué)習(xí)步驟進(jìn)行優(yōu)化,改進(jìn)了稀疏編碼算法的詞典學(xué)習(xí)步驟,并由此建立了一種中間層特征。F-SC算法按照與碼字分配無(wú)關(guān)的規(guī)則尋找一系列最具有代表性的樣本作為詞典分量,使用k-means++算法求取初始化樣本,然后使用k-mediods聚類(lèi)算法搜索有代表性的樣本,最終使用搜索到的樣本構(gòu)造詞典進(jìn)行稀疏編碼。改進(jìn)的詞典更新步驟獨(dú)立于稀疏編碼的碼字分配步驟,避免了兩個(gè)凸優(yōu)化問(wèn)題解的相互迭代,因此可以有效降低詞典學(xué)習(xí)的計(jì)算復(fù)雜度。使用F-SC算法提取中間層特征,并進(jìn)行空間金字塔建模,在Caltech-101數(shù)據(jù)集、15-Scenes數(shù)據(jù)集和UIUC-Sports數(shù)據(jù)集上與其它空間金字塔方法展開(kāi)了對(duì)比實(shí)驗(yàn),結(jié)果表明基于F-SC算法的中間層特征可以有效提高識(shí)別準(zhǔn)確率。
【關(guān)鍵詞】:圖像場(chǎng)景識(shí)別 LDA(Latent Dirichlet Allocation) 主題特征 目標(biāo)屬性特征 稀疏編碼 空間金字塔
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP391.41
【目錄】:
  • 摘要4-6
  • Abstract6-12
  • 第1章 緒論12-18
  • 1.1 課題的研究背景及意義12-13
  • 1.2 圖像場(chǎng)景識(shí)別的研究現(xiàn)狀13-16
  • 1.3 論文的研究?jī)?nèi)容16-17
  • 1.4 論文的組織結(jié)構(gòu)17-18
  • 第2章 圖像場(chǎng)景識(shí)別中各層特征18-32
  • 2.1 底層局部特征18-23
  • 2.1.1 尺度不變特征變換描述符18-21
  • 2.1.2 方向梯度直方圖特征21-23
  • 2.2 中間層特征23-27
  • 2.2.1 基于詞袋模型的中間層特征23-24
  • 2.2.2 基于稀疏編碼的中間層特征24-25
  • 2.2.3 基于局部可變模型的中間層特征25-27
  • 2.3 高層特征27-30
  • 2.3.1 基于主題模型的高層特征27-29
  • 2.3.2 基于空間金字塔的高層特征29-30
  • 2.4 本章小結(jié)30-32
  • 第3章 可高效提取和分類(lèi)的主題特征32-50
  • 3.1 引言32-33
  • 3.2 主題模型與特征提取算法33-39
  • 3.2.1 特征與碼書(shū)34-35
  • 3.2.2 模型結(jié)構(gòu)35-36
  • 3.2.3 參數(shù)估計(jì)—Gibbs 采樣36-38
  • 3.2.4 圖像表示與主題特征38-39
  • 3.3 主題模型用于場(chǎng)景識(shí)別的相關(guān)研究39-40
  • 3.4 對(duì)比實(shí)驗(yàn)及結(jié)果分析40-46
  • 3.4.1 實(shí)驗(yàn)條件40-41
  • 3.4.2 LabelMe 和 UIUC-Sports 數(shù)據(jù)集41-44
  • 3.4.3 15-Scenes 數(shù)據(jù)集44-46
  • 3.5 可高效提取和分類(lèi)的主題特征討論46-48
  • 3.6 本章小結(jié)48-50
  • 第4章 低維目標(biāo)屬性特征50-74
  • 4.1 引言50-52
  • 4.2 基于目標(biāo)屬性的圖像場(chǎng)景識(shí)別相關(guān)工作52-53
  • 4.3 Object Bank 特征53-56
  • 4.3.1 目標(biāo)濾波器及其響應(yīng)53
  • 4.3.2 由響應(yīng)值生成 OB 描述符53-55
  • 4.3.3 現(xiàn)有的 OB 降維特征55-56
  • 4.4 低維目標(biāo)屬性特征的提取模型與算法56-62
  • 4.4.1 合并特征的層次與尺度56-58
  • 4.4.2 模式分析與 pooling 降維理論58-60
  • 4.4.3 目標(biāo)屬性特征的降維算法60-62
  • 4.5 對(duì)比實(shí)驗(yàn)及結(jié)果分析62-66
  • 4.5.1 UIUC-Sports 數(shù)據(jù)集63-65
  • 4.5.2 LabelMe 數(shù)據(jù)集65
  • 4.5.3 15-Scenes 數(shù)據(jù)集65-66
  • 4.6 低維目標(biāo)屬性特征分析66-72
  • 4.6.1 關(guān)鍵策略的作用66-68
  • 4.6.2 算法復(fù)雜度68-69
  • 4.6.3 空間信息69-72
  • 4.7 本章小結(jié)72-74
  • 第5章 基于快速稀疏編碼的中間層特征74-88
  • 5.1 引言74-75
  • 5.2 基于快速稀疏編碼的相關(guān)研究75-76
  • 5.3 稀疏編碼的模型與算法76-80
  • 5.3.1 稀疏編碼的模型假設(shè)76-78
  • 5.3.2 基于符號(hào)搜索的碼字分配算法78-79
  • 5.3.3 拉格朗日乘數(shù)法更新詞典79-80
  • 5.4 快速稀疏編碼80-82
  • 5.4.1 詞典學(xué)習(xí)的模型假設(shè)80
  • 5.4.2 快速詞典學(xué)習(xí)算法80-82
  • 5.5 對(duì)比實(shí)驗(yàn)及結(jié)果分析82-87
  • 5.5.1 Caltech-101 數(shù)據(jù)集83-85
  • 5.5.2 15-Scenes 數(shù)據(jù)集85-86
  • 5.5.3 UIUC-Sports 數(shù)據(jù)集86-87
  • 5.6 本章小結(jié)87-88
  • 第6章 全文總結(jié)88-92
  • 6.1 論文工作總結(jié)88-89
  • 6.2 工作展望89-92
  • 參考文獻(xiàn)92-106
  • 作者簡(jiǎn)介及科研成果106-108
  • 致謝108-109

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 徐戈;王厚峰;;自然語(yǔ)言處理中主題模型的發(fā)展[J];計(jì)算機(jī)學(xué)報(bào);2011年08期



本文編號(hào):937754

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/937754.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)992b7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com