天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于粗糙集理論—神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法研究

發(fā)布時間:2017-08-09 04:03

  本文關鍵詞:基于粗糙集理論—神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法研究


  更多相關文章: 粗糙集 屬性約簡 神經(jīng)網(wǎng)絡 集成學習 數(shù)據(jù)流


【摘要】:隨著計算機技術、通信技術以及網(wǎng)絡技術的飛速發(fā)展,許多信息系統(tǒng)在運行過程中都會產(chǎn)生大量的流式數(shù)據(jù)。典型的例子包括電信呼叫數(shù)據(jù)、股票交易數(shù)據(jù)、互聯(lián)網(wǎng)通信數(shù)據(jù)、搜索引擎數(shù)據(jù)等。這種新的數(shù)據(jù)類型——數(shù)據(jù)流,是一種實時的、連續(xù)到達且速度快、規(guī)模宏大的數(shù)據(jù)有序序列。 數(shù)據(jù)流上的分類就是通過單遍掃描數(shù)據(jù)流,提出一個分類模型或函數(shù),并利用該模型將數(shù)據(jù)對象映射到某一個給定的類別中。對數(shù)據(jù)流數(shù)據(jù)進行分類時主要的困難在于:數(shù)據(jù)包含大量的冗余屬性,過多的屬性會影響模型的構建速度和分類精度;同時,由于數(shù)據(jù)連續(xù)不斷地持續(xù)到達,,分類模型必須隨著數(shù)據(jù)的快速流入而實現(xiàn)高效地更新,從而達到分類模型能夠正確地映射當前數(shù)據(jù)中的分類信息的目的。數(shù)據(jù)流數(shù)據(jù)的特殊性,決定了對數(shù)據(jù)流分類所采用的方法必須有別于傳統(tǒng)的數(shù)據(jù)挖掘分類方法,同時分類方法和技術在不同的學科領域都有著非常廣闊的應用前景,因此,研究穩(wěn)定的、快速的、準確的數(shù)據(jù)流分類方法具有巨大的理論價值和應用價值。 本文將粗糙集理論和神經(jīng)網(wǎng)絡方法相結合,充分發(fā)揮了二者的優(yōu)勢互補性來應對數(shù)據(jù)流的高維性、數(shù)據(jù)量大等特點。粗糙集理論具有較強的不確定、不完整信息處理能力,并且只通過數(shù)據(jù)本身而無需任何多余的信息,就可以獲得數(shù)據(jù)之間的相關性并約簡屬性個數(shù);神經(jīng)網(wǎng)絡具有很強的非線性映射能力,在處理非線性模式時其精確度優(yōu)于其他的數(shù)據(jù)挖掘方法,尤其適合處理大數(shù)據(jù)集數(shù)據(jù),并且具有良好的容錯性、自適應性和抗噪聲干擾的能力。將二者的優(yōu)勢充分結合起來,能夠有效地降低神經(jīng)網(wǎng)絡輸入端的節(jié)點數(shù),極大地簡化神經(jīng)網(wǎng)絡的復雜結構,從而提高神經(jīng)網(wǎng)絡模型的分類預測精度。 另外,本文采用了滑動窗口技術來應對數(shù)據(jù)流流速快的問題,將數(shù)據(jù)流劃分成若干個大小相同的數(shù)據(jù)塊,每個數(shù)據(jù)塊訓練一個個體分類器,多個個體分類器組成一個集成分類器,利用集成方法能夠有效地降低模型的泛化誤差;并且,個體分類器的訓練速度一般要高于單一模型的更新速度,也更加適合處理高速產(chǎn)生的數(shù)據(jù)流。 根據(jù)粗糙集理論、神經(jīng)網(wǎng)絡方法和集成學習理論,本文提出了一種基于粗糙集約簡、神經(jīng)網(wǎng)絡集成的數(shù)據(jù)流分類方法,并且在實際數(shù)據(jù)上的對比仿真實驗得到了很好的分類預測效果,從而證明了該方法是可行且有效的。
【關鍵詞】:粗糙集 屬性約簡 神經(jīng)網(wǎng)絡 集成學習 數(shù)據(jù)流
【學位授予單位】:河北大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP18;TP311.13
【目錄】:
  • 摘要5-7
  • Abstract7-11
  • 第1章 緒論11-19
  • 1.1 研究背景和意義11-13
  • 1.1.1 研究背景11-12
  • 1.1.2 研究意義12-13
  • 1.2 國內(nèi)外研究現(xiàn)狀13-16
  • 1.2.1 數(shù)據(jù)流分類研究現(xiàn)狀13-15
  • 1.2.2 粗糙集神經(jīng)網(wǎng)絡研究現(xiàn)狀15-16
  • 1.3 研究內(nèi)容及創(chuàng)新點16-17
  • 1.3.1 研究內(nèi)容16-17
  • 1.3.2 創(chuàng)新點17
  • 1.4 本文的組織結構17-19
  • 第2章 相關理論基礎19-33
  • 2.1 數(shù)據(jù)流19-24
  • 2.1.1 數(shù)據(jù)流的定義及特點19-20
  • 2.1.2 數(shù)據(jù)流模型20-21
  • 2.1.3 數(shù)據(jù)流數(shù)據(jù)挖掘結構圖及其技術21-24
  • 2.2 粗糙集24-27
  • 2.2.1 粗糙集概述24-26
  • 2.2.2 粗糙集的基本概念26-27
  • 2.3 神經(jīng)網(wǎng)絡27-32
  • 2.3.1 神經(jīng)網(wǎng)絡簡介27
  • 2.3.2 神經(jīng)網(wǎng)絡模型和結構27-30
  • 2.3.3 改進的 BP 神經(jīng)網(wǎng)絡30-31
  • 2.3.4 BP 神經(jīng)網(wǎng)絡的結構設計31-32
  • 2.4 本章小結32-33
  • 第3章 基于粗糙集和神經(jīng)網(wǎng)絡多分類器集成的數(shù)據(jù)流分類模型構建33-47
  • 3.1 粗糙集和神經(jīng)網(wǎng)絡的結合33-36
  • 3.1.1 兩種方法優(yōu)勢互補33-34
  • 3.1.2 兩種方法結合的方式34-36
  • 3.2 數(shù)據(jù)流分類預測模型的構建思想及流程圖36-38
  • 3.2.1 模型構建思想36-37
  • 3.2.2 模型流程圖37-38
  • 3.3 構建模型38-46
  • 3.3.1 數(shù)據(jù)預處理38-39
  • 3.3.2 基于特征選擇的屬性約簡方法39-40
  • 3.3.3 BP 神經(jīng)網(wǎng)絡各層參數(shù)的選擇40-41
  • 3.3.4 集成分類器方法41-44
  • 3.3.5 神經(jīng)網(wǎng)絡多分類器集成用于數(shù)據(jù)流分類44-46
  • 3.4 本章小結46-47
  • 第4章 仿真實驗與結果分析47-54
  • 4.1 實驗數(shù)據(jù)47
  • 4.2 連續(xù)屬性離散化47-49
  • 4.3 粗糙集屬性約簡49
  • 4.4 對比實驗49-53
  • 4.5 本章小結53-54
  • 第5章 總結與展望54-56
  • 5.1 工作總結54
  • 5.2 研究展望54-56
  • 參考文獻56-59
  • 致謝59-60
  • 攻讀碩士學位期間科研及發(fā)表論文情況60

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前4條

1 歐陽震諍;羅建書;胡東敏;吳泉源;;一種不平衡數(shù)據(jù)流集成分類模型[J];電子學報;2010年01期

2 周志華,陳世福;神經(jīng)網(wǎng)絡集成[J];計算機學報;2002年01期

3 陳遵德;;Rough Set身經(jīng)網(wǎng)絡智能系統(tǒng)及其應用[J];模式識別與人工智能;1999年01期

4 金澈清,錢衛(wèi)寧,周傲英;流數(shù)據(jù)分析與管理綜述[J];軟件學報;2004年08期

中國博士學位論文全文數(shù)據(jù)庫 前1條

1 楊顯飛;數(shù)據(jù)流集成分類器算法研究[D];哈爾濱工程大學;2011年



本文編號:643388

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/643388.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶78f9d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com