天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類碩士論文 >

基于標(biāo)記權(quán)重與加權(quán)核極限學(xué)習(xí)機(jī)的多標(biāo)記學(xué)習(xí)研究

發(fā)布時(shí)間:2024-04-12 05:33
  多標(biāo)記學(xué)習(xí)是機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘中的研究重點(diǎn)之一,其目的是通過(guò)分析已有多標(biāo)記數(shù)據(jù)對(duì)未知樣本進(jìn)行較準(zhǔn)確的預(yù)測(cè)。在大多數(shù)多標(biāo)記數(shù)據(jù)集中,描述樣本的特征數(shù)存在大量冗余特征。冗余特征不僅影響分類精度,還增加了計(jì)算的復(fù)雜性。特征選擇能有效解決上述問(wèn)題。然而,在實(shí)際分類問(wèn)題中,類不平衡的問(wèn)題也是機(jī)器學(xué)習(xí)的研究難點(diǎn)之一。本文充分調(diào)研了相關(guān)參考文獻(xiàn),總結(jié)了研究現(xiàn)狀,分析了現(xiàn)有方法的優(yōu)缺點(diǎn)。在此基礎(chǔ)上,挖掘標(biāo)記對(duì)樣本可區(qū)分度對(duì)標(biāo)記賦權(quán)值。并針對(duì)類不平衡問(wèn)題提出了一種解決方法,本文的主要研究工作如下:(1)挖掘出標(biāo)記對(duì)樣本可區(qū)分度,并依據(jù)此對(duì)標(biāo)記賦權(quán)值,提出了基于核函數(shù)和標(biāo)記權(quán)重的多標(biāo)記特征選擇算法(Multi-label feature selection based on kernel function and label weighting,KF-LW)。首先分別統(tǒng)計(jì)貼有不同標(biāo)記的樣本數(shù)量。若對(duì)某個(gè)標(biāo)記,貼有該標(biāo)記的樣本數(shù)量明顯高于含有其他標(biāo)記的樣本數(shù)量,則表明該標(biāo)記的權(quán)重越大,根據(jù)標(biāo)記空間的信息對(duì)標(biāo)記進(jìn)行權(quán)重賦值;然后,利用核函數(shù)將原始特征空間映射到高維空間,使得特征具有可分性,最后根據(jù)信息熵度量特...

【文章頁(yè)數(shù)】:49 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖1.1多標(biāo)記示例

圖1.1多標(biāo)記示例

2(a)醫(yī)療、經(jīng)濟(jì)、生物(b)森林、經(jīng)濟(jì)、澳大利亞圖1.1多標(biāo)記示例在多標(biāo)記學(xué)習(xí)中,為了盡可能準(zhǔn)確地描述樣本,用若干個(gè)特征描述該樣本,同時(shí),該樣本同時(shí)屬于多個(gè)類別標(biāo)記。根據(jù)已知的多標(biāo)記數(shù)據(jù),學(xué)習(xí)樣本特征到標(biāo)記之間的映射關(guān)系,并通過(guò)該映射關(guān)系盡可能準(zhǔn)確的預(yù)測(cè)出未知樣本的標(biāo)記。然而,....


圖1.2特征選擇的基本過(guò)程模型圖

圖1.2特征選擇的基本過(guò)程模型圖

5圖1.2特征選擇的基本過(guò)程模型圖處理多標(biāo)記問(wèn)題時(shí),按照處理思路,主要是分為兩類:?jiǎn)栴}轉(zhuǎn)化法和算法轉(zhuǎn)化法。問(wèn)題轉(zhuǎn)化法是將多標(biāo)記問(wèn)題轉(zhuǎn)化為多個(gè)單標(biāo)記問(wèn)題,然后可以利用已有的單標(biāo)記算法解決多標(biāo)記分類問(wèn)題。目前,問(wèn)題轉(zhuǎn)化方法主要分為BR(BinaryRelevance)和LP(Labe....


圖1.3經(jīng)過(guò)BR方法轉(zhuǎn)化的結(jié)果

圖1.3經(jīng)過(guò)BR方法轉(zhuǎn)化的結(jié)果

6表1.1多標(biāo)記數(shù)據(jù)集樣本屬性標(biāo)記11x1l,3l22x2l33x1l,2l44x3l(a)標(biāo)記1l(b)標(biāo)記2l(c)標(biāo)記3l圖1.3經(jīng)過(guò)BR方法轉(zhuǎn)化的結(jié)果算法轉(zhuǎn)化方法則是改編現(xiàn)已提出的單標(biāo)記學(xué)習(xí)算法以解決多標(biāo)記分類問(wèn)題。其優(yōu)點(diǎn)是能夠避免問(wèn)題轉(zhuǎn)化過(guò)程中造成的信息損失。在現(xiàn)已提出....


圖1.1多標(biāo)記示例

圖1.1多標(biāo)記示例

然而,在現(xiàn)實(shí)世界中,樣本通常由多個(gè)特征對(duì)其進(jìn)行描述,同時(shí),樣本也屬于多個(gè)類別標(biāo)記[9]。例如,一篇關(guān)于新型冠狀肺炎的報(bào)道中,其可能同時(shí)屬于醫(yī)療、經(jīng)濟(jì)、生物等多個(gè)主題。一段關(guān)于澳大利亞大火的視頻,其同時(shí)屬于森林、經(jīng)濟(jì)、澳大利亞等多個(gè)類別標(biāo)記。而單標(biāo)記學(xué)習(xí)假定樣本只屬于一類標(biāo)記,則其....



本文編號(hào):3951739

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3951739.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8c790***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com