基于核稀疏和主成分分析的屬性選擇算法研究
發(fā)布時(shí)間:2021-01-08 00:58
隨著大數(shù)據(jù)和人工智能技術(shù)的蓬勃發(fā)展,社會(huì)各行業(yè)領(lǐng)域中都積累了大量的高維屬性數(shù)據(jù),高維屬性數(shù)據(jù)中都會(huì)存在大量相關(guān)的冗余屬性,高維屬性數(shù)據(jù)不僅會(huì)增加存儲(chǔ)空間的負(fù)擔(dān),而且占用了大量計(jì)算資源開銷,更嚴(yán)重的是:高維屬性數(shù)據(jù)會(huì)大大增加數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的難度。從高維屬性數(shù)據(jù)中提取有價(jià)值的特征信息已經(jīng)變得相當(dāng)?shù)睦щy。如何從這些海量的高維屬性數(shù)據(jù)中提取重要特征信息并挖掘出更為有價(jià)值的潛在信息目前已成為目前研究的一個(gè)熱點(diǎn)。以屬性選擇算法為代表的數(shù)據(jù)預(yù)處理技術(shù)是解決該問(wèn)題的關(guān)鍵。因此,本文針對(duì)已有的屬性選擇方法只是單純的考慮屬性與標(biāo)簽之間的線性關(guān)系,沒有考慮到屬性與標(biāo)簽之間非線性關(guān)系的缺點(diǎn),提出了基于核稀疏表示的屬性選擇算法。針對(duì)傳統(tǒng)的屬性選擇算法經(jīng)過(guò)屬性選擇后,樣本屬性之間仍然存在極高的相關(guān)性的缺點(diǎn),提出了基于主成分分析的屬性選擇算法。經(jīng)過(guò)理論推導(dǎo)和大量的實(shí)驗(yàn)證明,本文提出的兩個(gè)屬性選擇算法是有效的,在分類準(zhǔn)確率和穩(wěn)定性上都有較大的提升。具體如下:(1)基于核稀疏表示的屬性選擇算法(KSFS屬性選擇算法)。針對(duì)樣本屬性與類標(biāo)簽之間存在非線性角度分析,本文在第三章節(jié)中提出了一種新的將核函數(shù)與稀疏學(xué)習(xí)相結(jié)合...
【文章來(lái)源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Colon數(shù)據(jù)集
Ecoli數(shù)據(jù)集
Yale數(shù)據(jù)集
本文編號(hào):2963589
【文章來(lái)源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Colon數(shù)據(jù)集
Ecoli數(shù)據(jù)集
Yale數(shù)據(jù)集
本文編號(hào):2963589
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2963589.html
最近更新
教材專著