基于粗糙集理論—神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法研究

發(fā)布時間：2017-08-09 04:03

本文關鍵詞：基于粗糙集理論—神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法研究

【摘要】：隨著計算機技術、通信技術以及網(wǎng)絡技術的飛速發(fā)展，許多信息系統(tǒng)在運行過程中都會產(chǎn)生大量的流式數(shù)據(jù)。典型的例子包括電信呼叫數(shù)據(jù)、股票交易數(shù)據(jù)、互聯(lián)網(wǎng)通信數(shù)據(jù)、搜索引擎數(shù)據(jù)等。這種新的數(shù)據(jù)類型——數(shù)據(jù)流，是一種實時的、連續(xù)到達且速度快、規(guī)模宏大的數(shù)據(jù)有序序列。數(shù)據(jù)流上的分類就是通過單遍掃描數(shù)據(jù)流，提出一個分類模型或函數(shù)，并利用該模型將數(shù)據(jù)對象映射到某一個給定的類別中。對數(shù)據(jù)流數(shù)據(jù)進行分類時主要的困難在于：數(shù)據(jù)包含大量的冗余屬性，過多的屬性會影響模型的構建速度和分類精度；同時，由于數(shù)據(jù)連續(xù)不斷地持續(xù)到達，，分類模型必須隨著數(shù)據(jù)的快速流入而實現(xiàn)高效地更新，從而達到分類模型能夠正確地映射當前數(shù)據(jù)中的分類信息的目的。數(shù)據(jù)流數(shù)據(jù)的特殊性，決定了對數(shù)據(jù)流分類所采用的方法必須有別于傳統(tǒng)的數(shù)據(jù)挖掘分類方法，同時分類方法和技術在不同的學科領域都有著非常廣闊的應用前景，因此，研究穩(wěn)定的、快速的、準確的數(shù)據(jù)流分類方法具有巨大的理論價值和應用價值。本文將粗糙集理論和神經(jīng)網(wǎng)絡方法相結合，充分發(fā)揮了二者的優(yōu)勢互補性來應對數(shù)據(jù)流的高維性、數(shù)據(jù)量大等特點。粗糙集理論具有較強的不確定、不完整信息處理能力，并且只通過數(shù)據(jù)本身而無需任何多余的信息，就可以獲得數(shù)據(jù)之間的相關性并約簡屬性個數(shù)；神經(jīng)網(wǎng)絡具有很強的非線性映射能力，在處理非線性模式時其精確度優(yōu)于其他的數(shù)據(jù)挖掘方法，尤其適合處理大數(shù)據(jù)集數(shù)據(jù)，并且具有良好的容錯性、自適應性和抗噪聲干擾的能力。將二者的優(yōu)勢充分結合起來，能夠有效地降低神經(jīng)網(wǎng)絡輸入端的節(jié)點數(shù)，極大地簡化神經(jīng)網(wǎng)絡的復雜結構，從而提高神經(jīng)網(wǎng)絡模型的分類預測精度。另外，本文采用了滑動窗口技術來應對數(shù)據(jù)流流速快的問題，將數(shù)據(jù)流劃分成若干個大小相同的數(shù)據(jù)塊，每個數(shù)據(jù)塊訓練一個個體分類器，多個個體分類器組成一個集成分類器，利用集成方法能夠有效地降低模型的泛化誤差；并且，個體分類器的訓練速度一般要高于單一模型的更新速度，也更加適合處理高速產(chǎn)生的數(shù)據(jù)流。根據(jù)粗糙集理論、神經(jīng)網(wǎng)絡方法和集成學習理論，本文提出了一種基于粗糙集約簡、神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法，并且在實際數(shù)據(jù)上的對比仿真實驗得到了很好的分類預測效果，從而證明了該方法是可行且有效的。
【關鍵詞】：粗糙集 屬性約簡 神經(jīng)網(wǎng)絡 集成學習 數(shù)據(jù)流
【學位授予單位】：河北大學
【學位級別】：碩士
【學位授予年份】：2014
【分類號】：TP18;TP311.13
【目錄】：

摘要5-7
Abstract7-11
第1章緒論11-19
1.1 研究背景和意義11-13
1.1.1 研究背景11-12
1.1.2 研究意義12-13
1.2 國內(nèi)外研究現(xiàn)狀13-16
1.2.1 數(shù)據(jù)流分類研究現(xiàn)狀13-15
1.2.2 粗糙集神經(jīng)網(wǎng)絡研究現(xiàn)狀15-16
1.3 研究內(nèi)容及創(chuàng)新點16-17
1.3.1 研究內(nèi)容16-17
1.3.2 創(chuàng)新點17
1.4 本文的組織結構17-19
第2章相關理論基礎19-33
2.1 數(shù)據(jù)流19-24
2.1.1 數(shù)據(jù)流的定義及特點19-20
2.1.2 數(shù)據(jù)流模型20-21
2.1.3 數(shù)據(jù)流數(shù)據(jù)挖掘結構圖及其技術21-24
2.2 粗糙集24-27
2.2.1 粗糙集概述24-26
2.2.2 粗糙集的基本概念26-27
2.3 神經(jīng)網(wǎng)絡27-32
2.3.1 神經(jīng)網(wǎng)絡簡介27
2.3.2 神經(jīng)網(wǎng)絡模型和結構27-30
2.3.3 改進的 BP 神經(jīng)網(wǎng)絡30-31
2.3.4 BP 神經(jīng)網(wǎng)絡的結構設計31-32
2.4 本章小結32-33
第3章基于粗糙集和神經(jīng)網(wǎng)絡多分類器集成的數(shù)據(jù)流分類模型構建33-47
3.1 粗糙集和神經(jīng)網(wǎng)絡的結合33-36
3.1.1 兩種方法優(yōu)勢互補33-34
3.1.2 兩種方法結合的方式34-36
3.2 數(shù)據(jù)流分類預測模型的構建思想及流程圖36-38
3.2.1 模型構建思想36-37
3.2.2 模型流程圖37-38
3.3 構建模型38-46
3.3.1 數(shù)據(jù)預處理38-39
3.3.2 基于特征選擇的屬性約簡方法39-40
3.3.3 BP 神經(jīng)網(wǎng)絡各層參數(shù)的選擇40-41
3.3.4 集成分類器方法41-44
3.3.5 神經(jīng)網(wǎng)絡多分類器集成用于數(shù)據(jù)流分類44-46
3.4 本章小結46-47
第4章仿真實驗與結果分析47-54
4.1 實驗數(shù)據(jù)47
4.2 連續(xù)屬性離散化47-49
4.3 粗糙集屬性約簡49
4.4 對比實驗49-53
4.5 本章小結53-54
第5章總結與展望54-56
5.1 工作總結54
5.2 研究展望54-56
參考文獻56-59
致謝59-60
攻讀碩士學位期間科研及發(fā)表論文情況60

【參考文獻】

中國期刊全文數(shù)據(jù)庫前4條

1 歐陽震諍;羅建書;胡東敏;吳泉源;;一種不平衡數(shù)據(jù)流集成分類模型[J];電子學報;2010年01期

2 周志華,陳世福;神經(jīng)網(wǎng)絡集成[J];計算機學報;2002年01期

3 陳遵德;;Rough Set身經(jīng)網(wǎng)絡智能系統(tǒng)及其應用[J];模式識別與人工智能;1999年01期

4 金澈清,錢衛(wèi)寧,周傲英;流數(shù)據(jù)分析與管理綜述[J];軟件學報;2004年08期

中國博士學位論文全文數(shù)據(jù)庫前1條

1 楊顯飛;數(shù)據(jù)流集成分類器算法研究[D];哈爾濱工程大學;2011年

本文編號：643388

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/643388.html

上一篇：針對安全生產(chǎn)隱患的智能搜索引擎系統(tǒng)研究
下一篇：基于搜索關鍵詞關注度的商品房價格指數(shù)預測

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于粗糙集理論—神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法研究