天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于特征選擇的數(shù)據(jù)降維

發(fā)布時間:2021-06-24 04:09
  特征選擇是數(shù)據(jù)降維中最常用的手段,與之相對應的是特征生成,二者共同構(gòu)成數(shù)據(jù)降維的兩種主要方式。數(shù)據(jù)降維是應用統(tǒng)計、數(shù)據(jù)挖掘、機器學習、模式識別等領域中及其關(guān)鍵的問題。特征選擇有利于降低數(shù)據(jù)處理的時間復雜度和計算機存儲的空間復雜度,還可以提高學習模型的準確性、魯棒性以及泛化能力。本文從監(jiān)督學習和非監(jiān)督學習兩個方面對特征選擇算法進行分類和描述,主要利用信息論中關(guān)鍵概念互信息設計特征選擇算法。本文的主要內(nèi)容包括:(1)在監(jiān)督學習的特征選擇中,利用互信息作為工具,講述了Parzen Window特征選擇以及最大相關(guān)-最小冗余(MRMR)特征選擇算法。(2)在非監(jiān)督學習的特征選擇中,我們利用鄰域互信息作為特征間的相似性度量,新設計了一種,基于特征聚類的特征選擇算法。且該算法可直接處理混合數(shù)據(jù)(同時含有連續(xù)型特征和種類特征),而不需要做種類數(shù)據(jù)的數(shù)值化,也不需要做連續(xù)數(shù)據(jù)的離散化處理。(3)將鄰域互信息應用于Parzen Window和MRMR特征選擇,解決基于監(jiān)督學習混合數(shù)據(jù)的特征選擇。(4)利用UCI機器學習網(wǎng)頁上的數(shù)據(jù)集對算法進行測試和比較,并應用特征選擇算法分析來自中國統(tǒng)計年鑒2013上有... 

【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:62 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
1 緒論
    1.1 課題的意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 目前研究存在的不足
    1.4 本文的主要內(nèi)容與結(jié)構(gòu)
    1.5 本章總結(jié)
2 特征選擇的定義和必要性
    2.1 特征選擇的定義
    2.2 特征選擇的步驟
    2.3 特征選擇的必要性
    2.4 本章總結(jié)
3 基于監(jiān)督學習的特征選擇
    3.1 熵(entropy)和互信息(mutual information)
    3.2 互信息的估計和特征選擇
    3.3 本章總結(jié)
4 基于非監(jiān)督學習的特征選擇
    4.1 聚類
    4.2 相似性度量(similarity measure)
    4.3 鄰域互信息(Neighborhood Mutual Information, NMI)
    4.4 基于NMI的混合數(shù)據(jù)非監(jiān)督特征選擇
    4.5 本章總結(jié)
5 實驗設計和算法比較
    5.1 數(shù)據(jù)集以及評價標準
    5.2 算法比較
    5.3 統(tǒng)計數(shù)據(jù)實例分析
    5.4 本章總結(jié)
6 總結(jié)與展望
    6.1 全文總結(jié)
    6.2 本文的不足與未來的展望
致謝
參考文獻
附表


【參考文獻】:
期刊論文
[1]一種基于新的特征選擇的海量網(wǎng)絡文本挖掘算法研究[J]. 張人上,曲開社.  計算機應用研究. 2014(09)
[2]基于支持向量機的特征選擇算法綜述[J]. 代琨,于宏毅,馬學剛,李青.  信息工程大學學報. 2014(01)
[3]結(jié)合鄰域相關(guān)影像與最大相關(guān)性最小冗余性特征選擇的面向?qū)ο笞兓瘷z測[J]. 鄒利東,潘耀忠,朱文泉,周公器,李宜展.  中國圖象圖形學報. 2014(01)
[4]稀疏特征選擇在過程工業(yè)故障診斷中的應用[J]. 于春梅.  計算機工程與應用. 2014(18)
[5]特征選擇方法綜述[J]. 姚旭,王曉丹,張玉璽,權(quán)文.  控制與決策. 2012(02)
[6]基于模擬退火的多標記數(shù)據(jù)特征選擇[J]. 張永波,游錄金,陳杰新.  計算機工程與設計. 2011(07)
[7]一種特征選擇的動態(tài)規(guī)劃方法[J]. 章新華.  自動化學報. 1998(05)
[8]一種最優(yōu)特征集的選擇算法[J]. 朱明,王俊普,蔡慶生.  計算機研究與發(fā)展. 1998(09)
[9]最優(yōu)特征子集選擇問題[J]. 陳彬,洪家榮,王亞東.  計算機學報. 1997(02)



本文編號:3246337

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/3246337.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fbaa5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com