基于隨機子空間的SVM分類算法研究
發(fā)布時間:2017-10-01 01:17
本文關鍵詞:基于隨機子空間的SVM分類算法研究
更多相關文章: 支持向量機 隨機子空間 核函數(shù) 分層抽樣 不平衡數(shù)據(jù)
【摘要】:支持向量機是在堅實理論基礎上發(fā)展起來的一種機器學習方法,它能很好的解決關于小樣本、非線性、高維度、局部極小等類似問題。目前,支持向量機作為一種有潛力的分類技術,在數(shù)據(jù)分類方面得到了廣泛的應用和研究。但早期提出的基于支持向量機的數(shù)據(jù)分類方法,在解決海量數(shù)據(jù)分類特別是不平衡的數(shù)據(jù)分類時會出現(xiàn)很多問題,嚴重影響著數(shù)據(jù)分類算法的計算效率和準確度。隨機子空間方法是為了適應特征數(shù)據(jù)篩選的挑戰(zhàn),其思想就是從大量特征數(shù)據(jù)中選出真正需要的特征,以降低數(shù)據(jù)集的特征維度或平衡特征分布,它對數(shù)據(jù)預處理方面有著突出的貢獻。對此,論文提出基于隨機子空間的SVM分類算法研究,主要的研究工作分為以下兩個方面:1.基于隨機特征子空間及加權核函數(shù)的SVM算法結合隨機子空間和核函數(shù)思想,提出基于隨機特征子空間及加權核函數(shù)的SVM算法。首先通過采用ReliefF算法計算特征權值,然后基于隨機特征子空間方法,根據(jù)特征權值選擇特征,最后將選出的特征及其權值對核函數(shù)中的內(nèi)積進行加權計算,從而減少了核函數(shù)中內(nèi)積加權的計算復雜度。在平衡數(shù)據(jù)集的分類研究中,該方法在一定程度上解決了傳統(tǒng)的SVM算法缺乏高效率和低準確率的問題。2.基于支持向量機的不平衡樣本集分類算法結合重采樣技術和分層抽樣方法,提出基于支持向量機的不平衡樣本集分類算法。該算法以支持向量機為基礎,首先利用分層抽樣方法,選出樣本的正、負特征,以平衡樣本底層特征分布,然后在此基礎上采用重采樣技術,對樣本數(shù)量進行平衡,因此從樣本底層特征分布和樣本數(shù)量上很好的解決了數(shù)據(jù)的不平衡。在不平衡數(shù)據(jù)集的分類研究中,該方法避免了僅考慮數(shù)據(jù)樣本數(shù)量不平衡而忽略樣本底層特征分布不平衡的現(xiàn)象,使不平衡數(shù)據(jù)對SVM分類器的影響程度得到進一步降低。
【關鍵詞】:支持向量機 隨機子空間 核函數(shù) 分層抽樣 不平衡數(shù)據(jù)
【學位授予單位】:山東師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP181
【目錄】:
- 摘要5-6
- ABSTRACT6-8
- 第一章 緒論8-12
- 1.1 研究背景和意義8
- 1.2 國內(nèi)外研究現(xiàn)狀8-10
- 1.3 本文主要內(nèi)容10
- 1.4 本文結構安排10-12
- 第二章 支持向量機12-22
- 2.1 最優(yōu)分類超平面12-14
- 2.2 SVM分類原理14-18
- 2.3 SVM核函數(shù)18-20
- 2.4 本章小結20-22
- 第三章 基于隨機特征子空間及加權核函數(shù)的SVM算法(RFSWK-SVM)22-33
- 3.1 RFSWK-SVM算法的相關理論22-27
- 3.1.1 隨機子空間22-23
- 3.1.2 特征選擇23-27
- 3.2 RFSWK-SVM算法思想27-30
- 3.3 實驗結果及分析30-32
- 3.4 本章小結32-33
- 第四章 基于支持向量機的不平衡樣本集分類算法(IDC-SVM)33-42
- 4.1 不平衡數(shù)據(jù)集的概述33-36
- 4.2 IDC-SVM算法的相關理論36-39
- 4.3 IDC-SVM算法思想39-40
- 4.4 實驗結果及分析40-41
- 4.5 本章小結41-42
- 第五章 總結與展望42-44
- 5.1 總結42-43
- 5.2 展望43-44
- 參考文獻44-48
- 作者簡介及學期間所取得的科研成果48-49
- 致謝49
本文編號:951503
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/951503.html
最近更新
教材專著