基于標(biāo)簽傳播的半監(jiān)督多標(biāo)簽學(xué)習(xí)
本文關(guān)鍵詞:基于標(biāo)簽傳播的半監(jiān)督多標(biāo)簽學(xué)習(xí),,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,弱標(biāo)簽(Weak Label)問題逐漸成為多標(biāo)簽學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)。一般來說,訓(xùn)練數(shù)據(jù)大量存在且標(biāo)簽完整,是保證多標(biāo)簽學(xué)習(xí)較好性能的前提。然而,由于在現(xiàn)實(shí)應(yīng)用中數(shù)據(jù)規(guī)模大、標(biāo)簽種類多、標(biāo)記工作繁重等可能原因,獲取的訓(xùn)練數(shù)據(jù)數(shù)量少且標(biāo)簽不完整。給出部分或不完整的標(biāo)簽,預(yù)測標(biāo)簽的完整集合(即預(yù)測丟失的標(biāo)簽)問題,被定義為“弱標(biāo)簽學(xué)習(xí)問題”。半監(jiān)督學(xué)習(xí)方法將標(biāo)簽傳播算法引入多標(biāo)簽學(xué)習(xí),以應(yīng)對實(shí)際應(yīng)用中已標(biāo)記數(shù)據(jù)數(shù)量較少的情況,并利用大量存在的未標(biāo)記數(shù)據(jù)提高算法性能。然而在處理弱標(biāo)簽數(shù)據(jù)時,半監(jiān)督學(xué)習(xí)仍存在一定不足。因此本文針對弱標(biāo)簽問題,對基于圖的半監(jiān)督學(xué)習(xí)方法進(jìn)行改進(jìn)。通過多組公開多標(biāo)簽數(shù)據(jù)集上的分類實(shí)驗(yàn),驗(yàn)證了改進(jìn)算法的有效性。本文研究工作主要如下:1.結(jié)合聚類算法,針對弱標(biāo)簽數(shù)據(jù)構(gòu)造了基于k均值的相似度矩陣。弱標(biāo)簽數(shù)據(jù)中每個樣本對應(yīng)多個標(biāo)簽,樣本間的相似度關(guān)系著弱標(biāo)簽樣本標(biāo)簽補(bǔ)全的程度。標(biāo)簽傳播算法需要事先構(gòu)造圖,圖中邊的權(quán)重大小決定標(biāo)簽的傳播程度。邊權(quán)重度量方法僅靠樣本特征之間的歐式距離確定,過于局部。因此本文利用樣本聚類信息,調(diào)整弱標(biāo)簽樣本的相似度矩陣。2.為了應(yīng)對弱標(biāo)簽數(shù)據(jù)集的分類問題,本文將多標(biāo)簽學(xué)習(xí)與基于圖的學(xué)習(xí)方法結(jié)合,并對標(biāo)簽傳播的過程進(jìn)行改進(jìn),提出了基于弱標(biāo)簽的標(biāo)簽傳播(Label Propagation Based on Weak Label,LPWL)方法。由于弱標(biāo)簽數(shù)據(jù)集的特性,不僅要填充未標(biāo)記數(shù)據(jù)的標(biāo)簽,還要補(bǔ)全已標(biāo)記樣本中的缺失標(biāo)簽。LPWL方法利用標(biāo)簽傳播補(bǔ)全樣本標(biāo)簽,并充分利用弱標(biāo)簽數(shù)據(jù)提升分類效果。通過在多組數(shù)據(jù)集上不同弱標(biāo)簽率下的對比實(shí)驗(yàn),驗(yàn)證了本文方法能有效提升對弱標(biāo)簽數(shù)據(jù)集的分類效果。同時,本文對不同標(biāo)簽率下的數(shù)據(jù)集進(jìn)行對比實(shí)驗(yàn),進(jìn)一步分析了弱標(biāo)簽率給多標(biāo)簽數(shù)據(jù)分類帶來的影響。
【關(guān)鍵詞】:弱標(biāo)簽 多標(biāo)簽學(xué)習(xí) 半監(jiān)督學(xué)習(xí) 標(biāo)簽傳播
【學(xué)位授予單位】:重慶郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13;TP181
【目錄】:
- 摘要3-4
- Abstract4-10
- 第1章 引言10-18
- 1.1 研究背景及意義10-13
- 1.1.1 弱標(biāo)簽學(xué)習(xí)簡介11-12
- 1.1.2 半監(jiān)督多標(biāo)簽學(xué)習(xí)概述12-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-16
- 1.2.1 弱標(biāo)簽數(shù)據(jù)分類研究現(xiàn)狀13-14
- 1.2.2 半監(jiān)督多標(biāo)簽學(xué)習(xí)研究現(xiàn)狀14-16
- 1.3 論文主要工作16
- 1.4 論文組織結(jié)構(gòu)16-18
- 第2章 半監(jiān)督學(xué)習(xí)方法18-31
- 2.1 多標(biāo)簽學(xué)習(xí)簡介18-20
- 2.2 無標(biāo)簽數(shù)據(jù)的作用20-22
- 2.3 半監(jiān)督學(xué)習(xí)依賴的假設(shè)22-23
- 2.4 半監(jiān)督學(xué)習(xí)方法分類23-28
- 2.5 算法的評價標(biāo)準(zhǔn)28-30
- 2.6 本章小結(jié)30-31
- 第3章 基于聚類的相似度矩陣構(gòu)造方法31-44
- 3.1 圖的構(gòu)造方法32-34
- 3.2 基于聚類的圖構(gòu)造方法34-38
- 3.2.1 聚類方法簡介34-35
- 3.2.2 基于k-means聚類的相似度矩陣構(gòu)建35-38
- 3.3 實(shí)驗(yàn)38-43
- 3.3.1 實(shí)驗(yàn)數(shù)據(jù)38-39
- 3.3.2 實(shí)驗(yàn)設(shè)置39
- 3.3.3 實(shí)驗(yàn)結(jié)果及分析39-43
- 3.4 本章小結(jié)43-44
- 第4章 針對弱標(biāo)簽的標(biāo)簽傳播半監(jiān)督學(xué)習(xí)44-60
- 4.1 標(biāo)簽傳播算法簡介45-49
- 4.1.1 標(biāo)簽傳播算法架構(gòu)45-47
- 4.1.2 算法的收斂性47-49
- 4.2 針對弱標(biāo)簽的標(biāo)簽傳播算法49-52
- 4.2.1 算法總結(jié)與架構(gòu)50-51
- 4.2.2 算法具體流程51-52
- 4.3 實(shí)驗(yàn)52-59
- 4.3.1 實(shí)驗(yàn)數(shù)據(jù)53
- 4.3.2 對比方法與實(shí)驗(yàn)設(shè)置53-55
- 4.3.3 實(shí)驗(yàn)結(jié)果及分析55-59
- 4.4 本章小結(jié)59-60
- 第5章 總結(jié)60-62
- 5.1 本文工作總結(jié)60-61
- 5.2 后續(xù)研究工作61-62
- 參考文獻(xiàn)62-68
- 致謝68-69
- 攻讀碩士學(xué)位期間從事的科研工作及取得的成果69
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前7條
1 劉建偉;劉媛;羅雄麟;;半監(jiān)督學(xué)習(xí)方法[J];計算機(jī)學(xué)報;2015年08期
2 田楓;沈旭昆;;一種適合弱標(biāo)簽數(shù)據(jù)集的圖像語義標(biāo)注方法[J];軟件學(xué)報;2013年10期
3 張晨光;張燕;張夏歡;;從希爾伯特-施密特獨(dú)立性中學(xué)習(xí)的多標(biāo)簽半監(jiān)督學(xué)習(xí)方法[J];中國科技論文;2013年10期
4 劉楊磊;梁吉業(yè);高嘉偉;楊靜;;基于Tri-training的半監(jiān)督多標(biāo)記學(xué)習(xí)算法[J];智能系統(tǒng)學(xué)報;2013年05期
5 張俊麗;常艷麗;師文;;標(biāo)簽傳播算法理論及其應(yīng)用研究綜述[J];計算機(jī)應(yīng)用研究;2013年01期
6 孔祥南;黎銘;姜遠(yuǎn);周志華;;一種針對弱標(biāo)記的直推式多標(biāo)記分類方法[J];計算機(jī)研究與發(fā)展;2010年08期
7 姜遠(yuǎn);佘俏俏;黎銘;周志華;;一種直推式多標(biāo)記文檔分類方法[J];計算機(jī)研究與發(fā)展;2008年11期
本文關(guān)鍵詞:基于標(biāo)簽傳播的半監(jiān)督多標(biāo)簽學(xué)習(xí),由筆耕文化傳播整理發(fā)布。
本文編號:455773
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/455773.html