概念漂移下數(shù)據(jù)流分類與回歸算法研究及應用
發(fā)布時間:2022-01-26 11:30
隨著數(shù)字地球的快速發(fā)展,越來越多的傳感器每時每刻都在產(chǎn)生著龐大的數(shù)據(jù)流,這些數(shù)據(jù)流中隱含了大量對生產(chǎn)生活有價值的信息,快速、有效地挖掘這些數(shù)據(jù)中的模式規(guī)律等信息是數(shù)據(jù)挖掘的主要目的。分類和回歸是數(shù)據(jù)挖掘領域的兩項主要任務,由于數(shù)據(jù)流本身的高速性、連續(xù)性、潛在無窮性、時間演化性等特點,傳統(tǒng)的靜態(tài)數(shù)據(jù)挖掘算法在處理數(shù)據(jù)流時很難達到滿意的效果。構建一種在線、快速、準確的增量式數(shù)據(jù)流分類、回歸算法是數(shù)據(jù)挖掘領域的重要研究方向。本文提出一種基于代表性原型的數(shù)據(jù)流分類算法:算法選出有限數(shù)量的最有代表性的樣本原型作為分類的訓練樣本集以代表數(shù)據(jù)流當前時刻最新的概念,并利用懶惰學習方法進行分類。算法通過錯誤率驅(qū)動的代表性學習方法在線更新代表性原型的權重以適應漸變概念漂移;通過保存誤分類樣本點,并利用局部誤分類監(jiān)控檢測突變概念漂移并更新模型,進而擺脫噪聲數(shù)據(jù)的影響;此外,算法通過快速最近鄰壓縮規(guī)則對代表性原型集合進行壓縮,限制代表性原型的數(shù)量,保證了算法運行的高效性。本文提出一種基于代表性樣本的數(shù)據(jù)流回歸算法:算法選出有代表性的樣本數(shù)據(jù)作為訓練集數(shù)據(jù),利用代表性樣本構建基于遞推最小二乘法的模型樹,對待預測...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 數(shù)據(jù)流挖掘研究現(xiàn)狀
1.2.1 數(shù)據(jù)流的定義
1.2.2 數(shù)據(jù)流數(shù)據(jù)處理方法
1.2.3 概念漂移檢測及處理方法
1.2.4 數(shù)據(jù)流分類算法研究進展
1.2.5 數(shù)據(jù)流回歸算法研究進展
1.3 徑流模擬研究現(xiàn)狀
1.4 研究內(nèi)容和技術路線
1.5 本文的主要貢獻與創(chuàng)新
1.6 本論文的結構安排
第二章 概念漂移下基于代表性原型的數(shù)據(jù)流分類算法(SPL)
2.1 SPL背景介紹
2.2 在線數(shù)據(jù)維護
2.2.1 增量式代表性學習與代表樣本集合更新
2.2.2 基于FCNN規(guī)則壓縮ISet
2.2.3 ISet更新
2.2.4 潛在概念集合及其更新
2.3 概念漂移檢測
2.4 算法概述
2.5 實驗評估
2.5.1 實驗設置
2.5.2 算法效果驗證
2.5.3 預測性能對比與分析
2.5.4 參數(shù)敏感性分析
2.6 本章小結
第三章 概念漂移下基于代表性樣本的數(shù)據(jù)流回歸算法(SIR)
3.1 基于代表性樣本的數(shù)據(jù)流回歸算法
3.2 基于遞推最小二乘法的模型樹構建
3.2.1 CART回歸樹
3.2.2 加權最小二乘法求解線性回歸
3.2.3 遞推最小二乘法增量式求解線性回歸
3.2.4 遞推最小二乘法模型樹
3.3 在線數(shù)據(jù)更新
3.4 基于SPC的概念漂移檢測
3.5 算法概述
3.6 實驗評估
3.6.1 算法效果驗證
3.6.2 預測性能對比
3.7 本章小結
第四章 基于SIR算法的流域徑流動態(tài)模擬
4.1 研究區(qū)域
4.2 數(shù)據(jù)說明與獲取
4.3 徑流模擬結果
4.4 與傳統(tǒng)機器學習方法對比
4.5 與水文模型對比
4.6 實驗結果及分析
4.7 本章小結
第五章 全文總結與展望
5.1 全文總結
5.2 后續(xù)工作展望
致謝
參考文獻
附錄
攻讀碩士學位期間取得的成果
【參考文獻】:
期刊論文
[1]分布式水文模型的回顧與展望[J]. 王澤群. 綠色科技. 2018(18)
[2]機器學習在徑流預測中的應用研究[J]. 蘇輝東,賈仰文,倪廣恒,龔家國,曹雪健,張明曦,牛存穩(wěn),張迪. 中國農(nóng)村水利水電. 2018(06)
[3]基于小波支持向量機耦合的月徑流預測方法[J]. 黃巧玲,粟曉玲. 水力發(fā)電學報. 2015(03)
[4]多隱層BP神經(jīng)網(wǎng)絡模型在徑流預測中的應用[J]. 崔東文. 水文. 2013(01)
[5]黃河中游水文變化趨勢及其對氣候變化的響應[J]. 張建云,王國慶,賀瑞敏,劉翠善. 水科學進展. 2009(02)
[6]基于徑流模擬的漢江上游區(qū)水資源對氣候變化響應的研究[J]. 朱利,張萬昌. 資源科學. 2005(02)
[7]徑流長期預報的人工神經(jīng)網(wǎng)絡方法[J]. 蔡煜東,姚林聲. 水科學進展. 1995(01)
博士論文
[1]流域水文建模及預報方法研究[D]. 郭俊.華中科技大學 2013
碩士論文
[1]環(huán)境下基于數(shù)據(jù)挖掘的徑流演化分析[D]. 張恒.電子科技大學 2018
[2]基于機器學習的渭河流域徑流預測系統(tǒng)研究[D]. 左崗崗.西安理工大學 2017
本文編號:3610416
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 數(shù)據(jù)流挖掘研究現(xiàn)狀
1.2.1 數(shù)據(jù)流的定義
1.2.2 數(shù)據(jù)流數(shù)據(jù)處理方法
1.2.3 概念漂移檢測及處理方法
1.2.4 數(shù)據(jù)流分類算法研究進展
1.2.5 數(shù)據(jù)流回歸算法研究進展
1.3 徑流模擬研究現(xiàn)狀
1.4 研究內(nèi)容和技術路線
1.5 本文的主要貢獻與創(chuàng)新
1.6 本論文的結構安排
第二章 概念漂移下基于代表性原型的數(shù)據(jù)流分類算法(SPL)
2.1 SPL背景介紹
2.2 在線數(shù)據(jù)維護
2.2.1 增量式代表性學習與代表樣本集合更新
2.2.2 基于FCNN規(guī)則壓縮ISet
2.2.3 ISet更新
2.2.4 潛在概念集合及其更新
2.3 概念漂移檢測
2.4 算法概述
2.5 實驗評估
2.5.1 實驗設置
2.5.2 算法效果驗證
2.5.3 預測性能對比與分析
2.5.4 參數(shù)敏感性分析
2.6 本章小結
第三章 概念漂移下基于代表性樣本的數(shù)據(jù)流回歸算法(SIR)
3.1 基于代表性樣本的數(shù)據(jù)流回歸算法
3.2 基于遞推最小二乘法的模型樹構建
3.2.1 CART回歸樹
3.2.2 加權最小二乘法求解線性回歸
3.2.3 遞推最小二乘法增量式求解線性回歸
3.2.4 遞推最小二乘法模型樹
3.3 在線數(shù)據(jù)更新
3.4 基于SPC的概念漂移檢測
3.5 算法概述
3.6 實驗評估
3.6.1 算法效果驗證
3.6.2 預測性能對比
3.7 本章小結
第四章 基于SIR算法的流域徑流動態(tài)模擬
4.1 研究區(qū)域
4.2 數(shù)據(jù)說明與獲取
4.3 徑流模擬結果
4.4 與傳統(tǒng)機器學習方法對比
4.5 與水文模型對比
4.6 實驗結果及分析
4.7 本章小結
第五章 全文總結與展望
5.1 全文總結
5.2 后續(xù)工作展望
致謝
參考文獻
附錄
攻讀碩士學位期間取得的成果
【參考文獻】:
期刊論文
[1]分布式水文模型的回顧與展望[J]. 王澤群. 綠色科技. 2018(18)
[2]機器學習在徑流預測中的應用研究[J]. 蘇輝東,賈仰文,倪廣恒,龔家國,曹雪健,張明曦,牛存穩(wěn),張迪. 中國農(nóng)村水利水電. 2018(06)
[3]基于小波支持向量機耦合的月徑流預測方法[J]. 黃巧玲,粟曉玲. 水力發(fā)電學報. 2015(03)
[4]多隱層BP神經(jīng)網(wǎng)絡模型在徑流預測中的應用[J]. 崔東文. 水文. 2013(01)
[5]黃河中游水文變化趨勢及其對氣候變化的響應[J]. 張建云,王國慶,賀瑞敏,劉翠善. 水科學進展. 2009(02)
[6]基于徑流模擬的漢江上游區(qū)水資源對氣候變化響應的研究[J]. 朱利,張萬昌. 資源科學. 2005(02)
[7]徑流長期預報的人工神經(jīng)網(wǎng)絡方法[J]. 蔡煜東,姚林聲. 水科學進展. 1995(01)
博士論文
[1]流域水文建模及預報方法研究[D]. 郭俊.華中科技大學 2013
碩士論文
[1]環(huán)境下基于數(shù)據(jù)挖掘的徑流演化分析[D]. 張恒.電子科技大學 2018
[2]基于機器學習的渭河流域徑流預測系統(tǒng)研究[D]. 左崗崗.西安理工大學 2017
本文編號:3610416
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3610416.html
最近更新
教材專著