天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

不平衡標(biāo)記密度學(xué)習(xí)的特征選擇研究

發(fā)布時(shí)間:2024-11-26 21:47
  多標(biāo)記學(xué)習(xí)已逐漸成為機(jī)器學(xué)習(xí)、大數(shù)據(jù)和數(shù)據(jù)挖掘等智能領(lǐng)域的研究熱點(diǎn)之一。在多標(biāo)記學(xué)習(xí)中,通常樣本的特征數(shù)量越多,樣本實(shí)例也就被描述的越準(zhǔn)確。隨著特征數(shù)量的不斷增加,它的相關(guān)冗余特征也將不斷增多。由于這些特征數(shù)量的存在會(huì)嚴(yán)重影響到分類(lèi)器的精度,甚至?xí)斐烧`分,因此需要對(duì)特征數(shù)量進(jìn)行降維。特征選擇是一種有效的降維方法,它可以先從中選擇出相關(guān)性高且冗余性小的特征作為特征子集,再對(duì)其進(jìn)行分類(lèi)訓(xùn)練與預(yù)測(cè)。在一個(gè)樣本實(shí)例中,是否有標(biāo)記與樣本實(shí)例的特征屬性有著密切的聯(lián)系。同時(shí)由于標(biāo)記的不平衡性在智能領(lǐng)域中廣泛存在,它會(huì)讓不同標(biāo)記對(duì)樣本實(shí)例的描述程度存在一定的差異性。目前,有關(guān)不平衡數(shù)據(jù)的研究較為匱乏。傳統(tǒng)的處理方法一般是先通過(guò)抽樣或者重采樣的方式將不平衡數(shù)據(jù)處理成為平衡數(shù)據(jù),再對(duì)其進(jìn)行研究。但是這種處理方法常會(huì)改變?cè)袛?shù)據(jù)集的屬性和丟失部分信息,致使分類(lèi)器的精度有所下降。現(xiàn)有的研究多數(shù)是針對(duì)單標(biāo)記下的不平衡性,而對(duì)多標(biāo)記下的不平衡性卻鮮有研究。基于多標(biāo)記下的不平衡性存在的問(wèn)題,本文提出了兩種改進(jìn)算法,主要研究工作如下:(1)目前多數(shù)特征選擇算法并未考慮不同標(biāo)記對(duì)樣本的描述程度可能存在一定的差異性。針對(duì)...

【文章頁(yè)數(shù)】:50 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2.1 信息熵與互信息的關(guān)系圖

圖2.1 信息熵與互信息的關(guān)系圖

由此可知,若I(X;Y)越大,則X與Y之間關(guān)聯(lián)越緊密,若X與Y無(wú)關(guān),則I(X;Y)=0。通過(guò)文氏圖(Venndiagram)可以更直觀的展示信息熵與互信息的關(guān)聯(lián)性(見(jiàn)圖2.1)。2.2.3特征與標(biāo)記集合互信息


圖2.2 特征選擇流程圖

圖2.2 特征選擇流程圖

特征選擇是指從全部特征中選取一個(gè)使構(gòu)造出來(lái)的模型效果更好且推廣能力更強(qiáng)的特征子集,即通過(guò)篩選出全局或局部最優(yōu)特征子集用以降低特征空間維數(shù)的過(guò)程。而為了得到一個(gè)新的較優(yōu)特征子集,對(duì)冗余不相關(guān)、欠刻畫(huà)能力的特征進(jìn)行了剔除,達(dá)到減少特征個(gè)數(shù)、減少訓(xùn)練或者運(yùn)行時(shí)間、提高模型精確度的作用,....


圖2.3 特征選擇方法分類(lèi)

圖2.3 特征選擇方法分類(lèi)

在機(jī)器學(xué)習(xí)、大數(shù)據(jù)和數(shù)據(jù)挖掘等高新技術(shù)領(lǐng)域,特征選擇擁有著舉足輕重的影響。在特征選擇過(guò)程中,評(píng)價(jià)函數(shù)作為一個(gè)評(píng)價(jià)準(zhǔn)則,可以判斷一個(gè)特征子集是否較優(yōu),而依據(jù)評(píng)價(jià)準(zhǔn)則的不同,有關(guān)特征選擇方面的算法可以分為:過(guò)濾式模型(Filter)、封裝式模型(Wrapper)以及嵌入式模型(Emb....


圖3.1 Computer數(shù)據(jù)集標(biāo)記分布圖

圖3.1 Computer數(shù)據(jù)集標(biāo)記分布圖

研究發(fā)現(xiàn)在多標(biāo)記學(xué)習(xí)中,由于標(biāo)記對(duì)樣本的描述存在著差異性,即在每個(gè)標(biāo)記下正類(lèi)與負(fù)類(lèi)出現(xiàn)的頻率并不一樣,而這種標(biāo)記頻率分布可以為多標(biāo)記學(xué)習(xí)的研究提供一定的輔助信息從而提高分類(lèi)的精度;诖,本章提出一種MSIO算法:首先計(jì)算標(biāo)記空間中每個(gè)標(biāo)記下正標(biāo)記(正類(lèi))樣本和負(fù)標(biāo)記(負(fù)類(lèi))樣本....



本文編號(hào):4012635

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/4012635.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)ccbd7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
麻豆果冻传媒一二三区| 日韩人妻精品免费一区二区三区 | 国产色一区二区三区精品视频 | 东京热加勒比一区二区三区| 日韩精品毛片视频免费看| 日本中文在线不卡视频| 欧洲自拍偷拍一区二区| 日韩欧美一区二区不卡视频| 不卡一区二区高清视频| 加勒比日本欧美在线观看| 日本最新不卡免费一区二区| 内用黄老外示儒术出处| 国产欧美精品对白性色| 中文字幕日韩精品人一妻| av在线免费观看一区二区三区| 国产又粗又猛又黄又爽视频免费| 欧洲一区二区三区蜜桃| 久热这里只有精品九九| 欧美精品专区一区二区| 亚洲视频一级二级三级| 国产中文字幕一二三区| 欧美有码黄片免费在线视频| 亚洲香艳网久久五月婷婷| 欧美加勒比一区二区三区| 中文字幕一区久久综合| 97人妻精品一区二区三区男同| 老司机精品国产在线视频| 欧美日本亚欧在线观看| 在线懂色一区二区三区精品| 无套内射美女视频免费在线观看| 国产目拍亚洲精品区一区| 亚洲精品中文字幕无限乱码| 欧美一区二区三区不卡高清视| 久久99精品国产麻豆婷婷洗澡 | 国产91色综合久久高清| 亚洲天堂国产精品久久精品| 欧美国产日产综合精品| 四季av一区二区播放| 亚洲熟女乱色一区二区三区| 免费观看成人免费视频| 国产又黄又猛又粗又爽的片|