基于深度學習的分類算法研究及應用
發(fā)布時間:2017-05-26 19:10
本文關鍵詞:基于深度學習的分類算法研究及應用,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著信息技術的飛速發(fā)展,我們生活的時代充滿了大量的數(shù)據(jù),這其中包含著豐富的、有意義的信息等待挖掘。分類器是數(shù)據(jù)分析最常見的一類算法模型,首先通過對已知類別樣本學習來建立分類器模型,然后利用該模型預測未知類別樣本的標簽。例如可以根據(jù)大量正常電子郵件的特征檢測出垃圾郵件,通過網(wǎng)絡流量的正常數(shù)據(jù)監(jiān)測網(wǎng)絡攻擊行為等等。但是像垃圾郵件和網(wǎng)絡攻擊行為在生活中都是偶然發(fā)生的事件,這些數(shù)據(jù)難以收集。因此,我們僅能對易于收集的一類數(shù)據(jù)進行學習和特征描述,為其建立模型來區(qū)分它們和偶然事件,以達到預測數(shù)據(jù)類別的目的,我們將這類問題稱為數(shù)據(jù)分布不均的單分類問題。支持向量數(shù)據(jù)描述(SVDD)方法適合用來解決高維、樣本數(shù)據(jù)有限的單分類問題,并已取得了很好的效果,但是當目標數(shù)據(jù)分布不均、各處數(shù)據(jù)的密度相差較大時,SVDD的分類性能會受到影響。本文引入并行的思想對SVDD算法進行改進,提出一種SVDD與AP聚類算法相結合的SA_SVDD算法。算法首先對數(shù)據(jù)集進行聚類處理,使得到的每一個子類中的數(shù)據(jù)分布都較為緊湊,然后對每個子類分別進行邊界描述(即SVDD分類算法),最后以所有子類的邊界面作為最終的判別標準。SA_SVDD的參數(shù)可通過粒子群算法自適應優(yōu)化,因此該算法只需提供數(shù)據(jù)集,中間過程的參數(shù)全部根據(jù)具體的樣本自適應產(chǎn)生。通過對一些標準數(shù)據(jù)集驗證的結果表明,SA_SVDD算法的分類性能相比于經(jīng)典單分類算法有明顯的提高。為了降低算法的計算量、提高準確率,本文引入深度學習中稀疏自動編碼器(SAE)來對數(shù)據(jù)進行降維,提出一種深度學習與SA_SVDD算法融合的SAE_SVDD算法。其主要流程是首先利用SAE對數(shù)據(jù)進行特征壓縮達到降維的目的,降低數(shù)據(jù)集的稀疏性,使數(shù)據(jù)集中各個數(shù)據(jù)點相對密集;然后使用SA_SVDD算法對降維后的數(shù)據(jù)進行學習。本文的應用背景建立在孕婦產(chǎn)前抑郁癥調查的基礎上,數(shù)據(jù)通過調查表的形式獲得,并配以醫(yī)生的專業(yè)診斷,將其分為患有抑郁癥的孕婦和健康的孕婦。其數(shù)據(jù)特點是患病的孕婦數(shù)量較少,健康的孕婦數(shù)量較大,而描述孕婦每個數(shù)據(jù)的特征量較多,使用SA_SVDD算法對其分類運行時間過長,分類效果不佳,使用SAE_SVDD算法能有效解決上述問題。同時在UCI數(shù)據(jù)集上的實驗結果表明,相對于經(jīng)典單分類算法,SAE_SVDD在分類性能和計算時間上都有明顯的提高。
【關鍵詞】:深度學習 支持向量數(shù)據(jù)描述 參數(shù)優(yōu)化 自適應
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP181
【目錄】:
- 摘要4-5
- ABSTRACT5-10
- 第一章 緒論10-15
- 1.1 研究背景10-11
- 1.2 研究目的和意義11-12
- 1.3 研究現(xiàn)狀及分析12-13
- 1.4 本文組織與結構13-15
- 第二章 相關算法介紹15-26
- 2.1 支持向量數(shù)據(jù)描述(SVDD)15-18
- 2.1.1 SVDD模型15-17
- 2.1.2 研究現(xiàn)狀17-18
- 2.2 深度學習算法概述18-23
- 2.2.1 深度學習基本思想19-20
- 2.2.2 自動編碼器20-21
- 2.2.3 受限玻爾茲曼機21-22
- 2.2.4 稀疏自動編碼器22-23
- 2.3 聚類算法和優(yōu)化算法23-25
- 2.3.1 AP算法23-25
- 2.3.2 PSO算法25
- 2.4 本章小結25-26
- 第三章 基于深度學習的單分類算法SAE_SVDD26-36
- 3.1 自適應的支持向量數(shù)據(jù)描述算法26-27
- 3.2 參數(shù)自適應優(yōu)化27-33
- 3.3 SA_SVDD與深度學習結合的算法33-35
- 3.3.1 深度學習模型33-34
- 3.3.2 SAE_SVDD34-35
- 3.4 本章小結35-36
- 第四章 基于深度學習的分類算法的實驗及應用36-47
- 4.1 評估方法36-38
- 4.2 對比算法介紹38-39
- 4.3 SA_SVDD算法基于UCI數(shù)據(jù)集的測試39-42
- 4.3.1 實驗數(shù)據(jù)設置39
- 4.3.2 實驗結果39-42
- 4.4 SAE_SVDD算法基于UCI數(shù)據(jù)集的測試42-43
- 4.4.1 實驗數(shù)據(jù)設置42
- 4.4.2 實驗結果42-43
- 4.5 基于深度學習的分類算法在孕婦產(chǎn)前抑郁癥問題中的應用43-46
- 4.5.1 孕婦產(chǎn)前抑郁癥的應用背景43
- 4.5.2 孕婦產(chǎn)前抑郁癥的分析流程43-45
- 4.5.3 應用結果及分析45-46
- 4.6 本章小結46-47
- 第五章 總結與展望47-48
- 5.1 總結47
- 5.2 展望47-48
- 參考文獻48-51
- 作者簡介51-52
- 致謝52
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄭智捷;幻序合并分類算法[J];計算機學報;1984年05期
2 劉t
本文編號:397815
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/397815.html
最近更新
教材專著