基于粗糙集理論—神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法研究
發(fā)布時間:2017-08-09 04:03
本文關鍵詞:基于粗糙集理論—神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法研究
更多相關文章: 粗糙集 屬性約簡 神經(jīng)網(wǎng)絡 集成學習 數(shù)據(jù)流
【摘要】:隨著計算機技術、通信技術以及網(wǎng)絡技術的飛速發(fā)展,許多信息系統(tǒng)在運行過程中都會產(chǎn)生大量的流式數(shù)據(jù)。典型的例子包括電信呼叫數(shù)據(jù)、股票交易數(shù)據(jù)、互聯(lián)網(wǎng)通信數(shù)據(jù)、搜索引擎數(shù)據(jù)等。這種新的數(shù)據(jù)類型——數(shù)據(jù)流,是一種實時的、連續(xù)到達且速度快、規(guī)模宏大的數(shù)據(jù)有序序列。 數(shù)據(jù)流上的分類就是通過單遍掃描數(shù)據(jù)流,提出一個分類模型或函數(shù),并利用該模型將數(shù)據(jù)對象映射到某一個給定的類別中。對數(shù)據(jù)流數(shù)據(jù)進行分類時主要的困難在于:數(shù)據(jù)包含大量的冗余屬性,過多的屬性會影響模型的構建速度和分類精度;同時,由于數(shù)據(jù)連續(xù)不斷地持續(xù)到達,,分類模型必須隨著數(shù)據(jù)的快速流入而實現(xiàn)高效地更新,從而達到分類模型能夠正確地映射當前數(shù)據(jù)中的分類信息的目的。數(shù)據(jù)流數(shù)據(jù)的特殊性,決定了對數(shù)據(jù)流分類所采用的方法必須有別于傳統(tǒng)的數(shù)據(jù)挖掘分類方法,同時分類方法和技術在不同的學科領域都有著非常廣闊的應用前景,因此,研究穩(wěn)定的、快速的、準確的數(shù)據(jù)流分類方法具有巨大的理論價值和應用價值。 本文將粗糙集理論和神經(jīng)網(wǎng)絡方法相結合,充分發(fā)揮了二者的優(yōu)勢互補性來應對數(shù)據(jù)流的高維性、數(shù)據(jù)量大等特點。粗糙集理論具有較強的不確定、不完整信息處理能力,并且只通過數(shù)據(jù)本身而無需任何多余的信息,就可以獲得數(shù)據(jù)之間的相關性并約簡屬性個數(shù);神經(jīng)網(wǎng)絡具有很強的非線性映射能力,在處理非線性模式時其精確度優(yōu)于其他的數(shù)據(jù)挖掘方法,尤其適合處理大數(shù)據(jù)集數(shù)據(jù),并且具有良好的容錯性、自適應性和抗噪聲干擾的能力。將二者的優(yōu)勢充分結合起來,能夠有效地降低神經(jīng)網(wǎng)絡輸入端的節(jié)點數(shù),極大地簡化神經(jīng)網(wǎng)絡的復雜結構,從而提高神經(jīng)網(wǎng)絡模型的分類預測精度。 另外,本文采用了滑動窗口技術來應對數(shù)據(jù)流流速快的問題,將數(shù)據(jù)流劃分成若干個大小相同的數(shù)據(jù)塊,每個數(shù)據(jù)塊訓練一個個體分類器,多個個體分類器組成一個集成分類器,利用集成方法能夠有效地降低模型的泛化誤差;并且,個體分類器的訓練速度一般要高于單一模型的更新速度,也更加適合處理高速產(chǎn)生的數(shù)據(jù)流。 根據(jù)粗糙集理論、神經(jīng)網(wǎng)絡方法和集成學習理論,本文提出了一種基于粗糙集約簡、神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法,并且在實際數(shù)據(jù)上的對比仿真實驗得到了很好的分類預測效果,從而證明了該方法是可行且有效的。
【關鍵詞】:粗糙集 屬性約簡 神經(jīng)網(wǎng)絡 集成學習 數(shù)據(jù)流
【學位授予單位】:河北大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP18;TP311.13
【目錄】:
- 摘要5-7
- Abstract7-11
- 第1章 緒論11-19
- 1.1 研究背景和意義11-13
- 1.1.1 研究背景11-12
- 1.1.2 研究意義12-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-16
- 1.2.1 數(shù)據(jù)流分類研究現(xiàn)狀13-15
- 1.2.2 粗糙集神經(jīng)網(wǎng)絡研究現(xiàn)狀15-16
- 1.3 研究內(nèi)容及創(chuàng)新點16-17
- 1.3.1 研究內(nèi)容16-17
- 1.3.2 創(chuàng)新點17
- 1.4 本文的組織結構17-19
- 第2章 相關理論基礎19-33
- 2.1 數(shù)據(jù)流19-24
- 2.1.1 數(shù)據(jù)流的定義及特點19-20
- 2.1.2 數(shù)據(jù)流模型20-21
- 2.1.3 數(shù)據(jù)流數(shù)據(jù)挖掘結構圖及其技術21-24
- 2.2 粗糙集24-27
- 2.2.1 粗糙集概述24-26
- 2.2.2 粗糙集的基本概念26-27
- 2.3 神經(jīng)網(wǎng)絡27-32
- 2.3.1 神經(jīng)網(wǎng)絡簡介27
- 2.3.2 神經(jīng)網(wǎng)絡模型和結構27-30
- 2.3.3 改進的 BP 神經(jīng)網(wǎng)絡30-31
- 2.3.4 BP 神經(jīng)網(wǎng)絡的結構設計31-32
- 2.4 本章小結32-33
- 第3章 基于粗糙集和神經(jīng)網(wǎng)絡多分類器集成的數(shù)據(jù)流分類模型構建33-47
- 3.1 粗糙集和神經(jīng)網(wǎng)絡的結合33-36
- 3.1.1 兩種方法優(yōu)勢互補33-34
- 3.1.2 兩種方法結合的方式34-36
- 3.2 數(shù)據(jù)流分類預測模型的構建思想及流程圖36-38
- 3.2.1 模型構建思想36-37
- 3.2.2 模型流程圖37-38
- 3.3 構建模型38-46
- 3.3.1 數(shù)據(jù)預處理38-39
- 3.3.2 基于特征選擇的屬性約簡方法39-40
- 3.3.3 BP 神經(jīng)網(wǎng)絡各層參數(shù)的選擇40-41
- 3.3.4 集成分類器方法41-44
- 3.3.5 神經(jīng)網(wǎng)絡多分類器集成用于數(shù)據(jù)流分類44-46
- 3.4 本章小結46-47
- 第4章 仿真實驗與結果分析47-54
- 4.1 實驗數(shù)據(jù)47
- 4.2 連續(xù)屬性離散化47-49
- 4.3 粗糙集屬性約簡49
- 4.4 對比實驗49-53
- 4.5 本章小結53-54
- 第5章 總結與展望54-56
- 5.1 工作總結54
- 5.2 研究展望54-56
- 參考文獻56-59
- 致謝59-60
- 攻讀碩士學位期間科研及發(fā)表論文情況60
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 歐陽震諍;羅建書;胡東敏;吳泉源;;一種不平衡數(shù)據(jù)流集成分類模型[J];電子學報;2010年01期
2 周志華,陳世福;神經(jīng)網(wǎng)絡集成[J];計算機學報;2002年01期
3 陳遵德;;Rough Set身經(jīng)網(wǎng)絡智能系統(tǒng)及其應用[J];模式識別與人工智能;1999年01期
4 金澈清,錢衛(wèi)寧,周傲英;流數(shù)據(jù)分析與管理綜述[J];軟件學報;2004年08期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 楊顯飛;數(shù)據(jù)流集成分類器算法研究[D];哈爾濱工程大學;2011年
本文編號:643388
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/643388.html
最近更新
教材專著