天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

融合標(biāo)記關(guān)系的多標(biāo)記數(shù)據(jù)建模研究

發(fā)布時(shí)間:2021-01-22 13:36
  現(xiàn)實(shí)中的數(shù)據(jù)往往具有多標(biāo)記性。例如,一張圖片可能同時(shí)包含“沙漠”、“駱駝”和“藍(lán)天”等語義標(biāo)注;一篇新聞報(bào)道可能同時(shí)包含“經(jīng)濟(jì)”、“戰(zhàn)爭”和“政治”等主題;一段話可能同時(shí)包含有“愉悅”和“悲傷”等情感。多標(biāo)記數(shù)據(jù)的高維性,會(huì)增加分類、聚類等數(shù)據(jù)挖掘任務(wù)的困難性,如增加挖掘算法的時(shí)間復(fù)雜度以及模型的復(fù)雜度等。特征選擇是一種保證對(duì)挖掘結(jié)果不變差的條件下,盡量使用較少的特征進(jìn)行建模的數(shù)據(jù)預(yù)處理技術(shù)。目前的多標(biāo)記數(shù)據(jù)特征選擇研究還未對(duì)標(biāo)記之間的關(guān)系進(jìn)行充分利用,同時(shí)在特征選擇后,直接使用已有的分類,未很好的利用特征選擇的結(jié)果。為此,融合標(biāo)記關(guān)系,開展多標(biāo)記數(shù)據(jù)的特征選擇以及針對(duì)特征選擇結(jié)果的分類器的設(shè)計(jì)研究,主要研究內(nèi)容和結(jié)論如下:(1)基于模糊不一致對(duì)的多標(biāo)記屬性約簡本文將每個(gè)標(biāo)記視做一個(gè)隨機(jī)變量,利用KL散度度量標(biāo)記關(guān)系,結(jié)合該標(biāo)記關(guān)系,賦予每個(gè)標(biāo)記以權(quán)重,結(jié)合標(biāo)記權(quán)重定義模糊不一致樣本對(duì)。用屬性對(duì)模糊不一致樣本對(duì)的區(qū)分能力定義屬性重要度,提出了一種基于模糊不一致對(duì)的多標(biāo)記屬性約簡算法。在對(duì)8個(gè)公開的多標(biāo)記數(shù)據(jù)集當(dāng)中,采用6種評(píng)價(jià)指標(biāo),證明了所提算法的有效性。(2)融合標(biāo)記關(guān)系的K近鄰多標(biāo)... 

【文章來源】:山西大學(xué)山西省

【文章頁數(shù)】:67 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

融合標(biāo)記關(guān)系的多標(biāo)記數(shù)據(jù)建模研究


多標(biāo)

評(píng)價(jià)指標(biāo),數(shù)據(jù)集,算法,指標(biāo)


融合標(biāo)記關(guān)系的多標(biāo)記模糊粗糙建模研究26(a)漢明損失(HL)(b)排序損失(RL)(c)1-錯(cuò)誤率(OE)(d)覆蓋率(CV)(e)平均精度(AP)(f)Micro-F1微平均(F1)圖3.1數(shù)據(jù)集business上6種評(píng)價(jià)指標(biāo)下各算法的分類性能的變化情況根據(jù)表3.3-3.8可以得出以下結(jié)論:(1)對(duì)于AP指標(biāo),RL指標(biāo),HL指標(biāo),CV指標(biāo),OE指標(biāo)上MLAR-FL算法在八個(gè)數(shù)據(jù)集合上得到的分類精度都高于其余4種算法;對(duì)于F1指標(biāo),computer,health,reference數(shù)據(jù)集上,MALR-FL算法低于其余算法。因而,對(duì)于6個(gè)評(píng)價(jià)指標(biāo)而言,MLAR-FL在前五個(gè)評(píng)價(jià)指標(biāo)上的表現(xiàn)很好,在F1指標(biāo)上,得到的結(jié)果并非最好。(2)從統(tǒng)計(jì)的8個(gè)數(shù)據(jù)集合,6個(gè)評(píng)價(jià)指標(biāo),總共48個(gè)對(duì)比結(jié)果可以看出,

性能,數(shù)據(jù)集,評(píng)價(jià)指標(biāo),算法


第三章基于模糊不一致對(duì)的多標(biāo)記屬性約簡27(a)漢明損失(HL)(b)排序損失(RL)(c)1-錯(cuò)誤率(OE)(d)覆蓋率(CV)(e)平均精度(AP)(f)Micro-F1微平均(F1)圖3.2數(shù)據(jù)集reference上6種評(píng)價(jià)指標(biāo)下各算法的分類性能的變化情況MLAR-FL的勝率為93.75%,總體而言,MLAR-FL的分類情況較好?傊,在8個(gè)數(shù)據(jù)集上,MLAR-FL的分類性能比其余4種算法的分類性能好。但是即使得到的特征子集在分類器上的分類性能優(yōu),也不能表示可以從整體上了解算法的分類性能在特征數(shù)目變化時(shí)的變化情況。為了能夠從整體上直觀的看到各個(gè)算法的分類性能隨著特征數(shù)目的變化情況,圖3.1-3.3分別給出了在數(shù)據(jù)集business,reference,science上面六種性能評(píng)價(jià)指標(biāo)AP,HL,RL,OE,CV,F(xiàn)1下,分類性能隨著特征數(shù)目的變化趨勢(shì)。由于FRMFS


本文編號(hào):2993319

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/lindaojc/2993319.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9f34a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com