關聯分類的改進及多標簽分類的特征選擇研究
發(fā)布時間:2023-04-05 20:47
分類問題是機器學習領域的一個重要研究方向,它通過學習數據發(fā)現其中的規(guī)律來構建一個分類模型,該模型將用于預測待分類數據的類別。傳統(tǒng)意義上的分類多指單標簽分類,即每個待分類樣本被分類器指定唯一的標簽作為類標簽,根據數據集的特性,又分為平衡數據和不平衡數據。準確率是評價算法性能好壞的一個重要指標,算法的準確率越高代表算法的分類性能越好。關聯分類算法是一種挖掘關聯規(guī)則用于分類的算法,具有規(guī)則多、分類精度較高的優(yōu)點。然而關聯分類算法雖然產生的規(guī)則多,但是其中高質量的規(guī)則少,尤其是針對不平衡數據難以有效地提取高質量地小類規(guī)則,不能很好的兼顧整體準確率和小類分類性能。此外,現實中許多數據往往具有不止一個標簽,這類數據被稱為多標簽數據,多標簽數據的分類的就是要為每一個樣本盡可能地標注出所有與其相關的標簽,但是多標簽數據往往數據量龐大且維數眾多,難以直接進行有效進行學習。因此需要對數據集進行降維。傳統(tǒng)的一些特征選擇算法對部分標簽沒有保留足夠的重要特征,導致分類算法難以有效對特征選擇后的數據集進行學習。本文針對以上問題在算法層面上做了以下三個研究。首先,針對傳統(tǒng)的關聯分類算法產生的冗余規(guī)則較多,而高質量規(guī)...
【文章頁數】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題的研究背景及意義
1.2 關聯分類的研究現狀
1.3 多標簽特征選擇的國內外研究現狀
1.4 論文主要研究內容與組織結構
第2章 基于多次學習和關聯度的關聯分類改進算法
2.1 關聯分類的不足
2.2 基于多次學習和關聯度的關聯分類算法IAMC
2.2.1 相關的標記及定義
2.2.2 IAMC算法分類器構建
2.3 實驗設計與結果
2.4 本章小結
第3章 基于各類支持度閾值獨立挖掘的關聯改進算法
3.1 改進的關聯分類算法ACCS
3.1.1 相關定義
3.1.2 ACCS算法的規(guī)則挖掘
3.1.3 規(guī)則排序、剪枝與新實例預測
3.1.4 算法的偽代碼及流程圖
3.2 實驗設計與結果
3.3 本章小結
第4章 基于標簽重要性的多標簽特征選擇算法
4.1 多標簽特征選擇算法研究
4.2 改進的基于標簽重要性的多標簽的特征選擇算法MILR
4.3 實驗設計與結果
4.4 本章小結
第5章 論文的總結和展望
5.1 論文總結
5.2 今后工作展望
參考文獻
致謝
攻讀碩士學位期間承擔的科研任務與主要成果
本文編號:3784103
【文章頁數】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題的研究背景及意義
1.2 關聯分類的研究現狀
1.3 多標簽特征選擇的國內外研究現狀
1.4 論文主要研究內容與組織結構
第2章 基于多次學習和關聯度的關聯分類改進算法
2.1 關聯分類的不足
2.2 基于多次學習和關聯度的關聯分類算法IAMC
2.2.1 相關的標記及定義
2.2.2 IAMC算法分類器構建
2.3 實驗設計與結果
2.4 本章小結
第3章 基于各類支持度閾值獨立挖掘的關聯改進算法
3.1 改進的關聯分類算法ACCS
3.1.1 相關定義
3.1.2 ACCS算法的規(guī)則挖掘
3.1.3 規(guī)則排序、剪枝與新實例預測
3.1.4 算法的偽代碼及流程圖
3.2 實驗設計與結果
3.3 本章小結
第4章 基于標簽重要性的多標簽特征選擇算法
4.1 多標簽特征選擇算法研究
4.2 改進的基于標簽重要性的多標簽的特征選擇算法MILR
4.3 實驗設計與結果
4.4 本章小結
第5章 論文的總結和展望
5.1 論文總結
5.2 今后工作展望
參考文獻
致謝
攻讀碩士學位期間承擔的科研任務與主要成果
本文編號:3784103
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3784103.html