基于多特征融合及短期記憶選擇網(wǎng)絡(luò)的視覺關(guān)系檢測
發(fā)布時(shí)間:2023-04-22 05:18
自2012年Alex-Net在ImageNet大規(guī)模圖像分類比賽中取得成功后,深度學(xué)習(xí)在圖像分類、目標(biāo)檢測和分割的性能上都取得了非常大的提升,達(dá)到甚至超過了人類的識別水平。在此基礎(chǔ)上,進(jìn)一步研究圖像內(nèi)容理解成為大勢所趨。視覺關(guān)系檢測作為對象檢測和圖像理解的中間級任務(wù),在近幾年受到越來越多的關(guān)注,成為計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn)之一。視覺關(guān)系檢測的目標(biāo)是從圖像中識別出所有的<主語-謂詞-賓語>三元組,同時(shí)標(biāo)注出主語和賓語的位置,可分為謂詞檢測、短語檢測、關(guān)系檢測等三個(gè)子任務(wù)。與圖像分類、目標(biāo)檢測等任務(wù)相比,對象之間的關(guān)系更為抽象,因而如何有效表征自然圖像中對象之間的視覺關(guān)系是一個(gè)挑戰(zhàn)。近幾年來研究人員先后提出了基于語言先驗(yàn)、統(tǒng)計(jì)依賴和知識表征學(xué)習(xí)等技術(shù)的視覺關(guān)系檢測方法,它們利用了對象的視覺特征、位置特征和/或者語義特征進(jìn)行關(guān)系檢測。然而,這些方法一方面沒有充分獲取有效表征對象間視覺關(guān)系的特征,另一方面也沒有考慮不同種類特征之間的相互聯(lián)系,因此檢測性能還不太理想。針對上述問題,本文對圖像中對象之間的視覺關(guān)系表征進(jìn)行探索,從對象多特征融合表達(dá)、多特征的相互關(guān)聯(lián)作用兩個(gè)角度,對視覺關(guān)...
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 視覺關(guān)系檢測及其挑戰(zhàn)
1.3 國內(nèi)外研究現(xiàn)狀
1.4 本文主要工作
1.5 本文組織結(jié)構(gòu)
第2章 相關(guān)研究工作
2.1 目標(biāo)檢測
2.1.1 基于Single Shot的目標(biāo)檢測算法
2.1.2 基于R-CNN的目標(biāo)檢測算法
2.2 短期記憶選擇理論
2.3 視覺關(guān)系檢測
2.3.1 基于語言先驗(yàn)的視覺關(guān)系檢測
2.3.2 基于翻譯嵌入模型的視覺關(guān)系檢測
2.3.3 深度關(guān)系網(wǎng)絡(luò)
2.4 本章小結(jié)
第3章 基于多特征融合的視覺關(guān)系檢測
3.1 研究問題
3.2 基于多特征融合的視覺關(guān)系檢測算法
3.2.1 網(wǎng)絡(luò)整體框架
3.2.2 多特征模塊
3.2.3 特征融合
3.2.4 損失函數(shù)
3.3 實(shí)驗(yàn)與分析
3.3.1 數(shù)據(jù)集
3.3.2 評價(jià)指標(biāo)
3.3.3 參數(shù)的選擇和數(shù)據(jù)的預(yù)處理
3.3.4 實(shí)驗(yàn)結(jié)果及其分析
3.4 本章小結(jié)
第4章 基于短期記憶選擇網(wǎng)絡(luò)的視覺關(guān)系檢測
4.1 網(wǎng)絡(luò)的整體框架
4.2 網(wǎng)絡(luò)模塊介紹
4.2.1 目標(biāo)檢測
4.2.2 特征提取和融合
4.2.3 短期記憶選擇網(wǎng)絡(luò)
4.3 實(shí)驗(yàn)與分析
4.3.1 數(shù)據(jù)集和訓(xùn)練參數(shù)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.3.3 各模塊對不同類型謂詞檢測結(jié)果的影響
4.4 本章小結(jié)
第5章 總結(jié)和展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
致謝
本文編號:3796995
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 視覺關(guān)系檢測及其挑戰(zhàn)
1.3 國內(nèi)外研究現(xiàn)狀
1.4 本文主要工作
1.5 本文組織結(jié)構(gòu)
第2章 相關(guān)研究工作
2.1 目標(biāo)檢測
2.1.1 基于Single Shot的目標(biāo)檢測算法
2.1.2 基于R-CNN的目標(biāo)檢測算法
2.2 短期記憶選擇理論
2.3 視覺關(guān)系檢測
2.3.1 基于語言先驗(yàn)的視覺關(guān)系檢測
2.3.2 基于翻譯嵌入模型的視覺關(guān)系檢測
2.3.3 深度關(guān)系網(wǎng)絡(luò)
2.4 本章小結(jié)
第3章 基于多特征融合的視覺關(guān)系檢測
3.1 研究問題
3.2 基于多特征融合的視覺關(guān)系檢測算法
3.2.1 網(wǎng)絡(luò)整體框架
3.2.2 多特征模塊
3.2.3 特征融合
3.2.4 損失函數(shù)
3.3 實(shí)驗(yàn)與分析
3.3.1 數(shù)據(jù)集
3.3.2 評價(jià)指標(biāo)
3.3.3 參數(shù)的選擇和數(shù)據(jù)的預(yù)處理
3.3.4 實(shí)驗(yàn)結(jié)果及其分析
3.4 本章小結(jié)
第4章 基于短期記憶選擇網(wǎng)絡(luò)的視覺關(guān)系檢測
4.1 網(wǎng)絡(luò)的整體框架
4.2 網(wǎng)絡(luò)模塊介紹
4.2.1 目標(biāo)檢測
4.2.2 特征提取和融合
4.2.3 短期記憶選擇網(wǎng)絡(luò)
4.3 實(shí)驗(yàn)與分析
4.3.1 數(shù)據(jù)集和訓(xùn)練參數(shù)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.3.3 各模塊對不同類型謂詞檢測結(jié)果的影響
4.4 本章小結(jié)
第5章 總結(jié)和展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
致謝
本文編號:3796995
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3796995.html
最近更新
教材專著