基于私有信息的跨領域場景識別
發(fā)布時間:2021-08-24 17:48
場景識別作為計算機視覺領域重要的技術之一,目前已經發(fā)展成為研究人員重點研究的方向,在智能駕駛,智能攝像,圖像檢索等領域取得巨大的發(fā)展。所以,提高場景識別技術有著十分重要的作用。場景圖像往往因為光照,背景,遮擋等因素的原因,導致了類間差異大,類內差異小的問題。最近幾年,場景識別研究從早期通過先驗知識人工設計淺層特征,發(fā)展到通過構建深度網絡模型自動學習深度特征。研究表明,學習多領域圖像特征,可以產生比單獨學習一種領域圖像特征獲得更好的識別模型,越來越多的科學家對使用額外領域的特征信息來提高分類性能的工作產生了興趣。經典場景識別方法考慮訓練和測試樣本具有相同的視覺特征,但在實際應用中搜集和標注圖像工作量巨大,且受限于場景的多樣化,很難得到滿足條件的充足實驗樣本,而私有信息作為僅在訓練時學習的額外特征,測試時并不用提供,可以適當解決實驗樣本不充足的問題。本文提出一種基于相似融合的私有信息利用方法,并基于該方法設計了基于跨領域特征相似融合的網絡模型(model of cross-domain similarity fusion,簡稱CSDF模型)。我們將CSDF模型定義為一個領域自適應問題,目的...
【文章來源】:南京郵電大學江蘇省
【文章頁數】:66 頁
【學位級別】:碩士
【部分圖文】:
MIT67數據集場景樣本圖
南京郵電大學碩士研究生學位論文第一章緒論6廚房、洗手間、課堂教室、辦公室等場景類別。MIT67數據集是一個具有挑戰(zhàn)性的室內場景數據集,這是因為室內場景有較大的類內差異,并且由于室內背景和一些常見的物體,造成了很多難以識別的室內場景。MIT67數據集可以用于場景和環(huán)境為應用內容的視覺認知任務,該數據集目前是由MIT大學維護。該數據集部分圖像如下圖1.1所示:圖1.1MIT67數據集場景樣本圖(2)Places365數據集Places365[41]數據集是目前數據量最大的場景數據集,基本涵蓋了室內室外所有的場景類別。標準的Places365訓練集大概有180萬數據,每個場景4000左右數據量,在驗證集中每個類別含50左右圖像,測試集每個類別大約900的數據量。Places2數據集是在Places數據集的基礎上拓展而來,它包含超過1000萬張圖像,包括400多個場景類別。該數據集基本涵蓋真實世界的所有場景,可能是目前最具挑戰(zhàn)性的數據集,該數據集應用范圍十分廣泛,對場景識別模型幫助很大。該數據集部分圖像如下圖1.2所示:圖1.2Places365數據集場景圖像樣本圖
南京郵電大學碩士研究生學位論文第一章緒論7(3)SUN數據集SUN數據集[42]是一個包含室內場景和室外場景的大型場景數據集。針對當時場景識別數據集普遍過小從而無法捕捉到各類場景特征的問題,SUN數據集包含了899個類別和130519張圖像,大大豐富了各類場景特征。其中SUN397被用在大量場景識別實驗中,它總共有397個類別,108754張圖像,每個類別最少有100張圖像。這些類別包括不同種類的室內和室外場景,它們具有巨大的差異性,大大提高了場景識別的復雜性。該數據集的部分圖片如下圖1.3所示:圖1.3SUN397數據集場景圖像樣本圖(4)ImageNet數據集ImageNet[43]是人工智能領域最具影響力的大型數據庫,它是根據WordNet層次結構組織設計的。WordNet中的每個有意義的概念被稱為同義詞集或者synset,每個synet提供平均1000張圖像。目前ImageNet共有14197122福圖像,共分為21841個類別。其中類別包括:動物、植物、樂器、工具、車輛、場景等類別。該數據場景部分圖片如下圖1.4所示:圖1.4ImageNet數據集場景樣本圖
【參考文獻】:
期刊論文
[1]卷積神經網絡研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機學報. 2017(06)
[2]特征融合與S-D概率矯正的RGB-D顯著檢測[J]. 黃子超,劉政怡. 中國圖象圖形學報. 2016(10)
碩士論文
[1]基于遞歸神經網絡的深度學習模型及其應用[D]. 李若晨.華北電力大學 2018
[2]基于改進卷積神經網絡的圖像分類研究[D]. 曹惠珍.廣西師范大學 2017
[3]場景識別技術研究[D]. 宋慶歡.中國科學院研究生院(光電技術研究所) 2015
[4]高可靠性再入軌跡在線設計及實時制導[D]. 馬宏圖.大連理工大學 2014
本文編號:3360444
【文章來源】:南京郵電大學江蘇省
【文章頁數】:66 頁
【學位級別】:碩士
【部分圖文】:
MIT67數據集場景樣本圖
南京郵電大學碩士研究生學位論文第一章緒論6廚房、洗手間、課堂教室、辦公室等場景類別。MIT67數據集是一個具有挑戰(zhàn)性的室內場景數據集,這是因為室內場景有較大的類內差異,并且由于室內背景和一些常見的物體,造成了很多難以識別的室內場景。MIT67數據集可以用于場景和環(huán)境為應用內容的視覺認知任務,該數據集目前是由MIT大學維護。該數據集部分圖像如下圖1.1所示:圖1.1MIT67數據集場景樣本圖(2)Places365數據集Places365[41]數據集是目前數據量最大的場景數據集,基本涵蓋了室內室外所有的場景類別。標準的Places365訓練集大概有180萬數據,每個場景4000左右數據量,在驗證集中每個類別含50左右圖像,測試集每個類別大約900的數據量。Places2數據集是在Places數據集的基礎上拓展而來,它包含超過1000萬張圖像,包括400多個場景類別。該數據集基本涵蓋真實世界的所有場景,可能是目前最具挑戰(zhàn)性的數據集,該數據集應用范圍十分廣泛,對場景識別模型幫助很大。該數據集部分圖像如下圖1.2所示:圖1.2Places365數據集場景圖像樣本圖
南京郵電大學碩士研究生學位論文第一章緒論7(3)SUN數據集SUN數據集[42]是一個包含室內場景和室外場景的大型場景數據集。針對當時場景識別數據集普遍過小從而無法捕捉到各類場景特征的問題,SUN數據集包含了899個類別和130519張圖像,大大豐富了各類場景特征。其中SUN397被用在大量場景識別實驗中,它總共有397個類別,108754張圖像,每個類別最少有100張圖像。這些類別包括不同種類的室內和室外場景,它們具有巨大的差異性,大大提高了場景識別的復雜性。該數據集的部分圖片如下圖1.3所示:圖1.3SUN397數據集場景圖像樣本圖(4)ImageNet數據集ImageNet[43]是人工智能領域最具影響力的大型數據庫,它是根據WordNet層次結構組織設計的。WordNet中的每個有意義的概念被稱為同義詞集或者synset,每個synet提供平均1000張圖像。目前ImageNet共有14197122福圖像,共分為21841個類別。其中類別包括:動物、植物、樂器、工具、車輛、場景等類別。該數據場景部分圖片如下圖1.4所示:圖1.4ImageNet數據集場景樣本圖
【參考文獻】:
期刊論文
[1]卷積神經網絡研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機學報. 2017(06)
[2]特征融合與S-D概率矯正的RGB-D顯著檢測[J]. 黃子超,劉政怡. 中國圖象圖形學報. 2016(10)
碩士論文
[1]基于遞歸神經網絡的深度學習模型及其應用[D]. 李若晨.華北電力大學 2018
[2]基于改進卷積神經網絡的圖像分類研究[D]. 曹惠珍.廣西師范大學 2017
[3]場景識別技術研究[D]. 宋慶歡.中國科學院研究生院(光電技術研究所) 2015
[4]高可靠性再入軌跡在線設計及實時制導[D]. 馬宏圖.大連理工大學 2014
本文編號:3360444
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3360444.html
最近更新
教材專著