子空間學(xué)習(xí)及其在圖像集分類中的應(yīng)用研究
發(fā)布時(shí)間:2018-01-11 18:04
本文關(guān)鍵詞:子空間學(xué)習(xí)及其在圖像集分類中的應(yīng)用研究 出處:《北京交通大學(xué)》2017年博士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 子空間學(xué)習(xí) 子空間聚類 自表示學(xué)習(xí) 流形學(xué)習(xí) 半監(jiān)督學(xué)習(xí) 圖像集分類 稀疏表示 組稀疏 格拉斯曼流形 對(duì)稱正定矩陣流形 交替方向乘子法
【摘要】:作為高維數(shù)據(jù)分析的有效工具,子空間學(xué)習(xí)已被廣泛應(yīng)用于各類機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺任務(wù)中。從無監(jiān)督的數(shù)據(jù)降維到有監(jiān)督的判別式分析,從局部的多結(jié)構(gòu)發(fā)現(xiàn)到跨領(lǐng)域的共享知識(shí)表示,從人臉識(shí)別到動(dòng)作分割,子空間學(xué)習(xí)都發(fā)揮著重要作用。在其眾多應(yīng)用當(dāng)中,有一類問題近期引起了研究者的關(guān)注,這便是圖像集分類。與傳統(tǒng)的,以單個(gè)樣本為分類對(duì)象的方法不同,圖像集分類適合處理那些內(nèi)部變化豐富的分類對(duì)象,如視頻片段,多角度的物體照片等。其在提供待分類對(duì)象豐富信息的同時(shí),還可以簡(jiǎn)化分類流程,降低標(biāo)注負(fù)擔(dān)。子空間的結(jié)構(gòu)特性使其非常適合于對(duì)單個(gè)集合建模。目前,基于子空間的圖像集分類通常存在一些問題。第一,集合內(nèi)部結(jié)構(gòu)的復(fù)雜性,使得單一子空間的集合表示很難反映出復(fù)雜的集合內(nèi)變化。第二,基于成對(duì)集合距離學(xué)習(xí)的圖像集分類方法忽略了集合間關(guān)系,特別是在集合內(nèi)樣本不足時(shí),會(huì)帶來較大的度量誤差。第三,當(dāng)把子空間看成黎曼流形上的一個(gè)點(diǎn)時(shí),流形學(xué)習(xí)會(huì)大大拓展圖像集分類的研究范圍,但集合的異質(zhì)性使得單一的流形無法充分刻畫集合的結(jié)構(gòu)特征。第四,在把流形降維分析用于圖像集分類時(shí),通常采用核方法,這使得很難直接獲得低維流形的顯式表示,并帶來過大的計(jì)算負(fù)擔(dān)。針對(duì)這些問題,本文的主要工作包括:(1)針對(duì)復(fù)雜的集合結(jié)構(gòu),提出了基于受限彈性網(wǎng)(constrained elastic-net)的子空間聚類算法,用于挖掘集合內(nèi)的多子空間結(jié)構(gòu)。在該方法中,數(shù)據(jù)間的自重構(gòu)系數(shù)被用來表示數(shù)據(jù)間相似度,進(jìn)而使用譜聚類的方法獲得最終的聚類指派。為了獲得更加魯棒的表示系數(shù),引入了加權(quán)l(xiāng)1范數(shù)與Frobenius范數(shù)的組合約束項(xiàng)。其中加權(quán)l(xiāng)1范數(shù)使用基于形狀交互矩陣(shape interaction matrix)的加權(quán)策略,以增加同一子空間的數(shù)據(jù)點(diǎn)的內(nèi)聚性和不同子空間的數(shù)據(jù)點(diǎn)的可分性。(2)針對(duì)多集合下的數(shù)據(jù)表示問題,提出了基于組協(xié)作表示(group collaborative representation,GCR)的圖像集表示方法。在該方法中,首先利用子空間聚類算法從訓(xùn)練集合中抽取多個(gè)子空間結(jié)構(gòu)。進(jìn)而獲得單幅訓(xùn)練圖像到多個(gè)訓(xùn)練集合的表示(point-to-sets representation,PSsR)及單個(gè)測(cè)試集合到多個(gè)訓(xùn)練集合的表示(set-to-setsrepresentation,SSsR)。其中PSsR有助于緩解由集合內(nèi)樣本不足引起的性能退化問題,SSsR有助于提升測(cè)試集合表示的魯棒性和測(cè)試階段的效率。(3)針對(duì)采用單一流形對(duì)集合建模的表示性不足問題,提出了半監(jiān)督多流形學(xué)習(xí)框架(semi-supervised learning on multi-Riemannian manifolds,SSMM),其把半監(jiān)督學(xué)習(xí)和多流形學(xué)習(xí)整合成一個(gè)統(tǒng)一的優(yōu)化過程。該框架主要由一組半監(jiān)督學(xué)習(xí)器組成,通過多種流形度量間的互補(bǔ)性來提升學(xué)習(xí)性能。不同于傳統(tǒng)的基于圖的半監(jiān)督學(xué)習(xí)方法,其圖的構(gòu)建和標(biāo)簽傳播被分為兩個(gè)獨(dú)立的部分。該框架不僅可以為標(biāo)簽傳播提供每個(gè)流形上數(shù)據(jù)的圖表示,而且可以回傳來自多個(gè)流形的監(jiān)督信息和結(jié)構(gòu)信息來指導(dǎo)圖的構(gòu)建。(4)針對(duì)集合建模中判別性流形表示問題,以三元損失函數(shù)(tripletloss)為基礎(chǔ),提出了適應(yīng)性聚類三元損失函數(shù)(adaptive cluster triplet loss,ACTL)。該方法同時(shí)考慮聚類中心之間,聚類中心與樣本之間的關(guān)系。聚類中心的引入可以提升魯棒性并降低約束的數(shù)量。同時(shí),采用聚類中心與樣本之間的距離代替原有三元損失函數(shù)中采用硬指派確定的間隔,則有助于提升方法的適應(yīng)性。通過在對(duì)稱正定矩陣流形和歐氏空間內(nèi)應(yīng)用該損失函數(shù)驗(yàn)證了其有效性。
[Abstract]:A subspace clustering algorithm based on constrained elastic - net has been widely used in various machine learning and computer vision tasks . (2)閽堝澶氶泦鍚堜笅鐨勬暟鎹〃紺洪棶棰,
本文編號(hào):1410608
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/1410608.html
最近更新
教材專著