基于特征級圖學(xué)習(xí)的無監(jiān)督特征選擇算法研究
發(fā)布時間:2021-11-21 04:01
數(shù)據(jù)表示是機器學(xué)習(xí)、數(shù)據(jù)挖掘和模式識別等領(lǐng)域共性的基礎(chǔ)問題之一。隨著數(shù)據(jù)采集等相關(guān)技術(shù)的快速發(fā)展,許多實際應(yīng)用場景中普遍存在著高維大數(shù)據(jù)。同時,數(shù)據(jù)采集過程中不可避免的會引入部分低質(zhì)量的特征比如噪聲數(shù)據(jù)和異常特征等。這些高維數(shù)據(jù)一方面通過采用更高維度的特征使得對數(shù)據(jù)內(nèi)在結(jié)構(gòu)的刻畫能力得到增強,另一方面也引入更高的數(shù)據(jù)存儲計算成本并且給機器學(xué)習(xí)等相關(guān)算法的學(xué)習(xí)提出了更高的挑戰(zhàn)。研究人員近年來提出多種方法處理高維數(shù)據(jù),其中代表性技術(shù)包括數(shù)據(jù)降維和特征選擇。特征選擇技術(shù)根據(jù)是否依賴數(shù)據(jù)真實標(biāo)簽大致分為有監(jiān)督、半監(jiān)督和無監(jiān)督三類。無監(jiān)督特征選擇方法在進(jìn)行特征選擇時不依賴真實數(shù)據(jù)標(biāo)簽,因此有著較為廣闊的應(yīng)用前景并對算法提出更高的挑戰(zhàn)。近年來研究人員提出大量的無監(jiān)督特征選擇算法其中主要包括過濾式和嵌入式等兩大類方法。一般來說,過濾式方法超參數(shù)較少,算法實現(xiàn)較為簡單,性能較為有限;而嵌入式方法通常涉及較多的超參數(shù),算法過程相對復(fù)雜,經(jīng)過仔細(xì)調(diào)參后性能較高。盡管無監(jiān)督特征選擇領(lǐng)域近年來已經(jīng)提出了多種方法,但是這些算法依然存在一些缺點:(1)現(xiàn)有算法普遍采用基于向量的表示進(jìn)行特征選擇。當(dāng)數(shù)據(jù)存在低質(zhì)量特...
【文章來源】:山西大學(xué)山西省
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)工作
2.1 特征選擇概述
2.1.1 特征選擇過程
2.1.2 搜索策略
2.1.3 評價標(biāo)準(zhǔn)
2.2 特征選擇算法分類
2.3 無監(jiān)督特征選擇算法分類
2.3.1 過濾式無監(jiān)督特征選擇算法
2.3.2 嵌入式無監(jiān)督特征選擇算法
2.4 本章小結(jié)
第三章 特征級LLE構(gòu)圖的過濾式無監(jiān)督特征選擇算法
3.1 LLE算法
3.2 提出的算法
3.3 實驗結(jié)果與分析
3.3.1 對比方法
3.3.2 數(shù)據(jù)集選擇
3.3.3 參數(shù)設(shè)置
3.3.4 聚類結(jié)果分析
3.3.5 參數(shù)敏感性分析
3.4 本章小結(jié)
第四章 特征級鄰近圖重建的嵌入式無監(jiān)督特征選擇算法
4.1 算法模型
4.2 實驗結(jié)果與分析
4.2.1 對比方法
4.2.2 數(shù)據(jù)集選擇
4.2.3 參數(shù)設(shè)置
4.2.4 聚類結(jié)果分析
4.2.5 特征冗余性分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
個人簡況及聯(lián)系方式
本文編號:3508732
【文章來源】:山西大學(xué)山西省
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)工作
2.1 特征選擇概述
2.1.1 特征選擇過程
2.1.2 搜索策略
2.1.3 評價標(biāo)準(zhǔn)
2.2 特征選擇算法分類
2.3 無監(jiān)督特征選擇算法分類
2.3.1 過濾式無監(jiān)督特征選擇算法
2.3.2 嵌入式無監(jiān)督特征選擇算法
2.4 本章小結(jié)
第三章 特征級LLE構(gòu)圖的過濾式無監(jiān)督特征選擇算法
3.1 LLE算法
3.2 提出的算法
3.3 實驗結(jié)果與分析
3.3.1 對比方法
3.3.2 數(shù)據(jù)集選擇
3.3.3 參數(shù)設(shè)置
3.3.4 聚類結(jié)果分析
3.3.5 參數(shù)敏感性分析
3.4 本章小結(jié)
第四章 特征級鄰近圖重建的嵌入式無監(jiān)督特征選擇算法
4.1 算法模型
4.2 實驗結(jié)果與分析
4.2.1 對比方法
4.2.2 數(shù)據(jù)集選擇
4.2.3 參數(shù)設(shè)置
4.2.4 聚類結(jié)果分析
4.2.5 特征冗余性分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
個人簡況及聯(lián)系方式
本文編號:3508732
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3508732.html
最近更新
教材專著