弱標(biāo)記數(shù)據(jù)不確定性度量及特征選擇研究
發(fā)布時(shí)間:2021-04-15 21:09
處理多標(biāo)記數(shù)據(jù)是機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘當(dāng)中一個(gè)非常重要的任務(wù),它已經(jīng)引起了諸多學(xué)者的廣泛研究。然而,在實(shí)際應(yīng)用領(lǐng)域中,例如圖像識(shí)別、文本分類等場(chǎng)景下,想要獲得數(shù)據(jù)的完整標(biāo)記來(lái)進(jìn)行學(xué)習(xí)和訓(xùn)練通常是一件非常困難并且代價(jià)十分昂貴的事情。我們獲得的往往是部分標(biāo)記的數(shù)據(jù)或者帶有缺失標(biāo)記的多標(biāo)記數(shù)據(jù),即弱標(biāo)記數(shù)據(jù)。到目前為止,關(guān)于弱標(biāo)記數(shù)據(jù)中不確定性度量問(wèn)題的研究并不多。實(shí)際上,不確定性度量有助于我們發(fā)現(xiàn)蘊(yùn)含在弱標(biāo)記數(shù)據(jù)當(dāng)中的潛在特征和更加實(shí)質(zhì)性的內(nèi)容。信息熵早已被用于評(píng)估和描述數(shù)據(jù)的不確定性,但是,它們往往針對(duì)的是單標(biāo)記數(shù)據(jù),并不適用于多標(biāo)記數(shù)據(jù),尤其是弱標(biāo)記數(shù)據(jù)。因此,本文提出一種新形式的類似條件熵的度量來(lái)描述弱標(biāo)記數(shù)據(jù)的不確定性,以期進(jìn)一步挖掘弱標(biāo)記數(shù)據(jù)的價(jià)值,助力弱標(biāo)記數(shù)據(jù)的特征選擇等任務(wù)及應(yīng)用。本文緊密圍繞弱標(biāo)記數(shù)據(jù)的不確定性度量和特征選擇展開(kāi)研究,主要研究工作及貢獻(xiàn)如下:(1)本文提出了一種單調(diào)相容條件熵的形式來(lái)描述和度量弱標(biāo)記數(shù)據(jù)的不確定性。這一新形式的不確定性度量主要是借助模糊粗糙集當(dāng)中的相似類及相容類的概念分別處理特征空間和不完備的標(biāo)記空間,結(jié)合條件熵完成新的定義使其更加適應(yīng)弱標(biāo)記數(shù)...
【文章來(lái)源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 多標(biāo)記學(xué)習(xí)與特征選擇
1.2.2 粗糙集與不確定性度量
1.3 研究?jī)?nèi)容與論文結(jié)構(gòu)
1.3.1 研究?jī)?nèi)容
1.3.2 論文結(jié)構(gòu)
第2章 相關(guān)工作概述及基礎(chǔ)知識(shí)
2.1 相關(guān)工作
2.1.1 擴(kuò)充的Pawlak近似精度度量
2.1.2 不完備決策系統(tǒng)中的不確定性度量
2.1.3 基于信息理論的多標(biāo)記數(shù)據(jù)特征選擇
2.2 基礎(chǔ)知識(shí)
2.2.1 單標(biāo)記決策表和弱標(biāo)記系統(tǒng)
2.2.2 模糊相似關(guān)系和相容關(guān)系
2.2.3 信息熵理論
2.3 本章小結(jié)
第3章 弱標(biāo)記數(shù)據(jù)的不確定性度量
3.1 引言
3.2 單調(diào)的相容條件熵
3.3 性質(zhì)及理論證明
3.4 實(shí)驗(yàn)與分析
3.4.1 數(shù)據(jù)描述
3.4.2 結(jié)果與分析
3.5 本章小結(jié)
第4章 弱標(biāo)記數(shù)據(jù)的特征選擇算法
4.1 引言
4.2 約簡(jiǎn)和特征選擇算法
4.3 實(shí)驗(yàn)及分析
4.3.1 數(shù)據(jù)描述
4.3.2 評(píng)價(jià)指標(biāo)
4.3.3 對(duì)比算法
4.3.4 結(jié)果與分析
4.4 本章小結(jié)
第5章 結(jié)語(yǔ)
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
發(fā)表論文和參加科研情況說(shuō)明
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于邊界域和知識(shí)粒度的粗糙集不確定性度量[J]. 黃國(guó)順,文翰. 控制與決策. 2016(06)
[2]基于決策粗糙集的多標(biāo)記情緒分類[J]. 張志飛,苗奪謙,張紅云. 模式識(shí)別與人工智能. 2015(08)
本文編號(hào):3140087
【文章來(lái)源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 多標(biāo)記學(xué)習(xí)與特征選擇
1.2.2 粗糙集與不確定性度量
1.3 研究?jī)?nèi)容與論文結(jié)構(gòu)
1.3.1 研究?jī)?nèi)容
1.3.2 論文結(jié)構(gòu)
第2章 相關(guān)工作概述及基礎(chǔ)知識(shí)
2.1 相關(guān)工作
2.1.1 擴(kuò)充的Pawlak近似精度度量
2.1.2 不完備決策系統(tǒng)中的不確定性度量
2.1.3 基于信息理論的多標(biāo)記數(shù)據(jù)特征選擇
2.2 基礎(chǔ)知識(shí)
2.2.1 單標(biāo)記決策表和弱標(biāo)記系統(tǒng)
2.2.2 模糊相似關(guān)系和相容關(guān)系
2.2.3 信息熵理論
2.3 本章小結(jié)
第3章 弱標(biāo)記數(shù)據(jù)的不確定性度量
3.1 引言
3.2 單調(diào)的相容條件熵
3.3 性質(zhì)及理論證明
3.4 實(shí)驗(yàn)與分析
3.4.1 數(shù)據(jù)描述
3.4.2 結(jié)果與分析
3.5 本章小結(jié)
第4章 弱標(biāo)記數(shù)據(jù)的特征選擇算法
4.1 引言
4.2 約簡(jiǎn)和特征選擇算法
4.3 實(shí)驗(yàn)及分析
4.3.1 數(shù)據(jù)描述
4.3.2 評(píng)價(jià)指標(biāo)
4.3.3 對(duì)比算法
4.3.4 結(jié)果與分析
4.4 本章小結(jié)
第5章 結(jié)語(yǔ)
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
發(fā)表論文和參加科研情況說(shuō)明
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于邊界域和知識(shí)粒度的粗糙集不確定性度量[J]. 黃國(guó)順,文翰. 控制與決策. 2016(06)
[2]基于決策粗糙集的多標(biāo)記情緒分類[J]. 張志飛,苗奪謙,張紅云. 模式識(shí)別與人工智能. 2015(08)
本文編號(hào):3140087
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3140087.html
最近更新
教材專著