面向多標記圖片分類的新類別標記發(fā)現(xiàn)問題的研究
發(fā)布時間:2021-07-28 00:51
多標記學習是機器學習領域中一種重要的學習范式,在過去幾年的發(fā)展中,多標記學習算法被廣泛應用到諸多多標記對象的學習場景中。隨著多標記學習領域的不斷發(fā)展,在標準多標記學習任務中算法的性能日益成熟,同時,機器學習算法對動態(tài)開放環(huán)境的適應性對機器學習領域的發(fā)展提出了新的挑戰(zhàn)。傳統(tǒng)多標記學習算法假設標記空間在訓練階段與預測階段一致,而現(xiàn)實世界動態(tài)開放的環(huán)境可能會打破這一假設,因此對動態(tài)開放環(huán)境中的多標記學習進行研究,針對出現(xiàn)未見的新類別標記的情形提出適應性算法十分有必要。多標記圖片是一類重要的多標記學習對象,多標記圖片分類任務是目前具有挑戰(zhàn)性的研究課題,其在互聯(lián)網(wǎng)領域和安防監(jiān)控場景的視頻任務中應用前景廣闊。同時近些年來卷積神經網(wǎng)絡(CNN)技術的發(fā)展極大的促進了圖片識別領域的發(fā)展,并且基于大規(guī)模訓練集預訓練的模型能夠遷移到其他相關的學習任務中。因此結合卷積神經網(wǎng)絡技術對多標記圖片分類任務中可能遇到的新類別標記學習問題展開研究具有重要的理論價值和應用價值。本文將圍繞動態(tài)開放環(huán)境下的多標記圖片分類任務,設計算法解決新類別標記出現(xiàn)的問題。本文提出新類別標記學習算法MULNLC:(1)首先使用經過預訓練...
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
多標記對象示例
東南大學碩士學位論文2或將其預測為相近的cat標記。這種在預測階段和訓練階段標記空間不一致的問題屬于增量學習[49]中的類別增量學習,類別增量學習所解決的問題是在學習系統(tǒng)訓練好之后,后續(xù)出現(xiàn)的示例帶有未見的新類別。這方面的代表性工作包括LACU框架[20]和MUENL算法[21],前者是針對單示例單標記學習場景提出的算法,后者是多標記學習場景下基于異常值檢測的思路提出的(其基于集成樹的異常值檢測算法不適合高維的圖片數(shù)據(jù)),它們均不適合多標記圖片分類任務下的新類別標記學習問題。多標記圖片分類任務是目前具有挑戰(zhàn)性的研究課題,其在互聯(lián)網(wǎng)領域和安防監(jiān)控場景的視頻任務中應用前景廣闊,因此對多標記圖片分類任務中可能遇到的新類別標記學習問題展開研究具有重要的理論價值和應用價值。本文將圍繞動態(tài)開放環(huán)境下的多標記圖片分類任務,設計算法解決新類別標記出現(xiàn)的問題。本文提出的MULNLC算法首先使用經過預訓練和微調的卷積神經網(wǎng)絡模型作為多標記圖片的特征提取器,基于初始訓練集學習分類模型以及新類別標記檢測模型;然后在可能包含新類別標記的批數(shù)據(jù)中,使用雙階段檢測模塊在未知標記的批數(shù)據(jù)中檢測包含新類別標記的數(shù)據(jù)示例,并對于檢測到的新類別標記數(shù)據(jù)使用卷積網(wǎng)絡模型加以擴充,豐富后續(xù)學習模型的訓練樣本;最后,基于新類別標記數(shù)據(jù)和已知標記數(shù)據(jù)更新分類模型和新類別標記檢測模型。在常用的多標記圖片數(shù)據(jù)集上的實驗結果表明了算法的有效性,同時,本文基于提出的MULNLC算法開發(fā)了適用于實際應用場景的“新類別標記圖片標注系統(tǒng)”。圖1-2訓練集和測試集標記空間不一致性的示例
啾穡?3?此之外,Zhu[20]等提出一種在多標記學習場景下的新類別標記發(fā)現(xiàn)問題的解決框架,它假設新類別標記在時間上以一定的順序出現(xiàn),即在相同一段時間若有新類別標記出現(xiàn),則假定是同一類新類別標記,然后在下一時間段中,出現(xiàn)的是另一類相同的新類別標記。論文引入異常值檢測思路來判別一個示例是否帶有新類別標記;如果帶有新類別標記,則將這個示例放到緩存中,等到新類別標記在緩存中擁有足夠的數(shù)據(jù)量,利用緩存中的新類別標記的示例構建該標記的分類器,更新已知標記的分類器。此外,在多標記多示例分類任務中(參見圖1-3),數(shù)據(jù)以“包”的形式組織,每一個“包”中含有多個單示例,這些單示例各自帶有的標記構成了“包”的標記。多標記多示例學習的目的就是在上述的數(shù)據(jù)對象上,學習從輸入到輸出的映射。該類問題和多標記學習以及單示例單標記學習的差異性在于“包”層次上具有多個標記,“包”內部的示例具有各自的單標記;谙嗤瑯擞浀氖纠谔卣骺臻g中的距離更近且每個標記有原型簇中心的假設,Zhu[22]提出一種迭代優(yōu)化的模型解決此類任務中新類別標記發(fā)現(xiàn)的問題。對以往的新類別標記學習相關方法進行總結和學習,能夠對目前該問題的基本解決思路的初步把握,并且前期的工作也是后續(xù)該領域進一步發(fā)展的重要推動因素。圖1-3多示例多標記學習示意圖[59]
本文編號:3306866
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
多標記對象示例
東南大學碩士學位論文2或將其預測為相近的cat標記。這種在預測階段和訓練階段標記空間不一致的問題屬于增量學習[49]中的類別增量學習,類別增量學習所解決的問題是在學習系統(tǒng)訓練好之后,后續(xù)出現(xiàn)的示例帶有未見的新類別。這方面的代表性工作包括LACU框架[20]和MUENL算法[21],前者是針對單示例單標記學習場景提出的算法,后者是多標記學習場景下基于異常值檢測的思路提出的(其基于集成樹的異常值檢測算法不適合高維的圖片數(shù)據(jù)),它們均不適合多標記圖片分類任務下的新類別標記學習問題。多標記圖片分類任務是目前具有挑戰(zhàn)性的研究課題,其在互聯(lián)網(wǎng)領域和安防監(jiān)控場景的視頻任務中應用前景廣闊,因此對多標記圖片分類任務中可能遇到的新類別標記學習問題展開研究具有重要的理論價值和應用價值。本文將圍繞動態(tài)開放環(huán)境下的多標記圖片分類任務,設計算法解決新類別標記出現(xiàn)的問題。本文提出的MULNLC算法首先使用經過預訓練和微調的卷積神經網(wǎng)絡模型作為多標記圖片的特征提取器,基于初始訓練集學習分類模型以及新類別標記檢測模型;然后在可能包含新類別標記的批數(shù)據(jù)中,使用雙階段檢測模塊在未知標記的批數(shù)據(jù)中檢測包含新類別標記的數(shù)據(jù)示例,并對于檢測到的新類別標記數(shù)據(jù)使用卷積網(wǎng)絡模型加以擴充,豐富后續(xù)學習模型的訓練樣本;最后,基于新類別標記數(shù)據(jù)和已知標記數(shù)據(jù)更新分類模型和新類別標記檢測模型。在常用的多標記圖片數(shù)據(jù)集上的實驗結果表明了算法的有效性,同時,本文基于提出的MULNLC算法開發(fā)了適用于實際應用場景的“新類別標記圖片標注系統(tǒng)”。圖1-2訓練集和測試集標記空間不一致性的示例
啾穡?3?此之外,Zhu[20]等提出一種在多標記學習場景下的新類別標記發(fā)現(xiàn)問題的解決框架,它假設新類別標記在時間上以一定的順序出現(xiàn),即在相同一段時間若有新類別標記出現(xiàn),則假定是同一類新類別標記,然后在下一時間段中,出現(xiàn)的是另一類相同的新類別標記。論文引入異常值檢測思路來判別一個示例是否帶有新類別標記;如果帶有新類別標記,則將這個示例放到緩存中,等到新類別標記在緩存中擁有足夠的數(shù)據(jù)量,利用緩存中的新類別標記的示例構建該標記的分類器,更新已知標記的分類器。此外,在多標記多示例分類任務中(參見圖1-3),數(shù)據(jù)以“包”的形式組織,每一個“包”中含有多個單示例,這些單示例各自帶有的標記構成了“包”的標記。多標記多示例學習的目的就是在上述的數(shù)據(jù)對象上,學習從輸入到輸出的映射。該類問題和多標記學習以及單示例單標記學習的差異性在于“包”層次上具有多個標記,“包”內部的示例具有各自的單標記;谙嗤瑯擞浀氖纠谔卣骺臻g中的距離更近且每個標記有原型簇中心的假設,Zhu[22]提出一種迭代優(yōu)化的模型解決此類任務中新類別標記發(fā)現(xiàn)的問題。對以往的新類別標記學習相關方法進行總結和學習,能夠對目前該問題的基本解決思路的初步把握,并且前期的工作也是后續(xù)該領域進一步發(fā)展的重要推動因素。圖1-3多示例多標記學習示意圖[59]
本文編號:3306866
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3306866.html
最近更新
教材專著