基于深度學習的分類算法研究及應用

發(fā)布時間：2017-05-26 19:10

本文關鍵詞：基于深度學習的分類算法研究及應用，，由筆耕文化傳播整理發(fā)布。

【摘要】：隨著信息技術的飛速發(fā)展,我們生活的時代充滿了大量的數(shù)據(jù),這其中包含著豐富的、有意義的信息等待挖掘。分類器是數(shù)據(jù)分析最常見的一類算法模型,首先通過對已知類別樣本學習來建立分類器模型,然后利用該模型預測未知類別樣本的標簽。例如可以根據(jù)大量正常電子郵件的特征檢測出垃圾郵件,通過網(wǎng)絡流量的正常數(shù)據(jù)監(jiān)測網(wǎng)絡攻擊行為等等。但是像垃圾郵件和網(wǎng)絡攻擊行為在生活中都是偶然發(fā)生的事件,這些數(shù)據(jù)難以收集。因此,我們僅能對易于收集的一類數(shù)據(jù)進行學習和特征描述,為其建立模型來區(qū)分它們和偶然事件,以達到預測數(shù)據(jù)類別的目的,我們將這類問題稱為數(shù)據(jù)分布不均的單分類問題。支持向量數(shù)據(jù)描述(SVDD)方法適合用來解決高維、樣本數(shù)據(jù)有限的單分類問題,并已取得了很好的效果,但是當目標數(shù)據(jù)分布不均、各處數(shù)據(jù)的密度相差較大時,SVDD的分類性能會受到影響。本文引入并行的思想對SVDD算法進行改進,提出一種SVDD與AP聚類算法相結合的SA_SVDD算法。算法首先對數(shù)據(jù)集進行聚類處理,使得到的每一個子類中的數(shù)據(jù)分布都較為緊湊,然后對每個子類分別進行邊界描述(即SVDD分類算法),最后以所有子類的邊界面作為最終的判別標準。SA_SVDD的參數(shù)可通過粒子群算法自適應優(yōu)化,因此該算法只需提供數(shù)據(jù)集,中間過程的參數(shù)全部根據(jù)具體的樣本自適應產(chǎn)生。通過對一些標準數(shù)據(jù)集驗證的結果表明,SA_SVDD算法的分類性能相比于經(jīng)典單分類算法有明顯的提高。為了降低算法的計算量、提高準確率,本文引入深度學習中稀疏自動編碼器(SAE)來對數(shù)據(jù)進行降維,提出一種深度學習與SA_SVDD算法融合的SAE_SVDD算法。其主要流程是首先利用SAE對數(shù)據(jù)進行特征壓縮達到降維的目的,降低數(shù)據(jù)集的稀疏性,使數(shù)據(jù)集中各個數(shù)據(jù)點相對密集;然后使用SA_SVDD算法對降維后的數(shù)據(jù)進行學習。本文的應用背景建立在孕婦產(chǎn)前抑郁癥調查的基礎上,數(shù)據(jù)通過調查表的形式獲得,并配以醫(yī)生的專業(yè)診斷,將其分為患有抑郁癥的孕婦和健康的孕婦。其數(shù)據(jù)特點是患病的孕婦數(shù)量較少,健康的孕婦數(shù)量較大,而描述孕婦每個數(shù)據(jù)的特征量較多,使用SA_SVDD算法對其分類運行時間過長,分類效果不佳,使用SAE_SVDD算法能有效解決上述問題。同時在UCI數(shù)據(jù)集上的實驗結果表明,相對于經(jīng)典單分類算法,SAE_SVDD在分類性能和計算時間上都有明顯的提高。
【關鍵詞】：深度學習 支持向量數(shù)據(jù)描述 參數(shù)優(yōu)化 自適應
【學位授予單位】：吉林大學
【學位級別】：碩士
【學位授予年份】：2016
【分類號】：TP181
【目錄】：

摘要4-5
ABSTRACT5-10
第一章緒論10-15
1.1 研究背景10-11
1.2 研究目的和意義11-12
1.3 研究現(xiàn)狀及分析12-13
1.4 本文組織與結構13-15
第二章相關算法介紹15-26
2.1 支持向量數(shù)據(jù)描述（SVDD）15-18
2.1.1 SVDD模型15-17
2.1.2 研究現(xiàn)狀17-18
2.2 深度學習算法概述18-23
2.2.1 深度學習基本思想19-20
2.2.2 自動編碼器20-21
2.2.3 受限玻爾茲曼機21-22
2.2.4 稀疏自動編碼器22-23
2.3 聚類算法和優(yōu)化算法23-25
2.3.1 AP算法23-25
2.3.2 PSO算法25
2.4 本章小結25-26
第三章基于深度學習的單分類算法SAE_SVDD26-36
3.1 自適應的支持向量數(shù)據(jù)描述算法26-27
3.2 參數(shù)自適應優(yōu)化27-33
3.3 SA_SVDD與深度學習結合的算法33-35
3.3.1 深度學習模型33-34
3.3.2 SAE_SVDD34-35
3.4 本章小結35-36
第四章基于深度學習的分類算法的實驗及應用36-47
4.1 評估方法36-38
4.2 對比算法介紹38-39
4.3 SA_SVDD算法基于UCI數(shù)據(jù)集的測試39-42
4.3.1 實驗數(shù)據(jù)設置39
4.3.2 實驗結果39-42
4.4 SAE_SVDD算法基于UCI數(shù)據(jù)集的測試42-43
4.4.1 實驗數(shù)據(jù)設置42
4.4.2 實驗結果42-43
4.5 基于深度學習的分類算法在孕婦產(chǎn)前抑郁癥問題中的應用43-46
4.5.1 孕婦產(chǎn)前抑郁癥的應用背景43
4.5.2 孕婦產(chǎn)前抑郁癥的分析流程43-45
4.5.3 應用結果及分析45-46
4.6 本章小結46-47
第五章總結與展望47-48
5.1 總結47
5.2 展望47-48
參考文獻48-51
作者簡介51-52
致謝52

【相似文獻】

中國期刊全文數(shù)據(jù)庫前10條

1 鄭智捷;幻序合并分類算法[J];計算機學報;1984年05期

2 劉t

本文編號：397815

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/397815.html

上一篇：基于大數(shù)據(jù)技術的車輛監(jiān)控系統(tǒng)的優(yōu)化與實現(xiàn)
下一篇：公安局取保候審人員監(jiān)控系統(tǒng)的設計與實現(xiàn)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學習的分類算法研究及應用