在線核極限學習機的改進與應用研究
本文關鍵詞:在線核極限學習機的改進與應用研究,由筆耕文化傳播整理發(fā)布。
【摘要】:時間序列數(shù)據(jù)是一種廣泛存在的數(shù)據(jù)形式,來源于各種實際應用中。通過對時間序列數(shù)據(jù)的挖掘,可以為政府及企業(yè)制定決策規(guī)劃提供可靠的依據(jù),具有重要的現(xiàn)實意義。極限學習機(Extreme Learning Machine,ELM)算法是近幾年出現(xiàn)的一種新穎的機器學習算法,與傳統(tǒng)的機器學習算法相比,具有結構簡單,學習速度快以及良好的全局尋優(yōu)能力,在復雜系統(tǒng)建模、實時在線預測、大規(guī)模樣本學習等問題中表現(xiàn)出巨大潛力。本文在Reduced Kernel ELM(RKELM)算法及在線極限學習機(Online Sequential ELM,OS-ELM)算法的基礎上,提出一種在線核極限學習機(OS-KELM)算法,并就OS-KELM算法中的相關問題提出改進,同時根據(jù)時間序列數(shù)據(jù)的時效性特征,設計并實現(xiàn)了一種自適應集成在線核極限學習機(Adaptive Ensemble OS-KELM,AEOS-KELM)算法用于時間序列數(shù)據(jù)的在線預測。論文的主要工作有以下幾個方面:首先,本文介紹了極限學習機模型的概念、理論基礎、算法原理及國內外研究現(xiàn)狀,然后按照極限學習機的演化方向將其分為結構增長型極限學習機、結構遞減型極限學習機、正則化極限學習機、在線極限學習機及核極限學習機共五類,并分別就每一類極限學習機模型給出幾種典型的訓練算法,并分析其優(yōu)缺點為后續(xù)研究提供借鑒意義。其次,本文在RKELM算法及在線極限學習機(OS-ELM)算法的基礎上,提出一種在線核極限學習機(OS-KELM)算法,同時,本文將時間序列數(shù)據(jù)具有時效性的特征引入到在線核極限學習機的訓練中,通過引入懲罰權重來區(qū)分不同時刻數(shù)據(jù)對于預測的貢獻,對最新的歷史數(shù)據(jù)賦予較高的權重。但是,考慮最新的歷史數(shù)據(jù)可能是噪音數(shù)據(jù),因此,懲罰權重的設定不應該是固定,而是應該根據(jù)當前數(shù)據(jù)的特征自適應的改變,對此本文引入了懲罰權重的計算公式,該公式根據(jù)t時刻與t+1時刻數(shù)據(jù)的均值與方差自適應的改變懲罰權重,能夠有效的避免此類誤差的發(fā)生。另外,由于在線核極限學習機算法的預測準確率受核函數(shù)中參數(shù)的影響,本文根據(jù)果蠅算法(Fruit Fly Optimization Algorithm,FOA)原理及在線核極限學習機的特點提出改進的果蠅算法用于優(yōu)化在線核極限學習機;然后,由于在線核極限學習機是從訓練數(shù)據(jù)中以一定比例抽取部分數(shù)據(jù)用于核矩陣的運算,這就影響了在線核極限學習機的泛化能力,因此本文提出了自適應集成的在線核極限學習機,通過選擇泛化能力好,預測精度高的在線核極限學習機用于算法的集成預測以提高算法的穩(wěn)定性。最后,本文運用Matlab 2009b實驗平臺,編程實現(xiàn)了AE-OSKELM算法,并就仿真數(shù)據(jù)、UCI數(shù)據(jù)集及真實股價數(shù)據(jù)與經(jīng)典的機器學習算法,如BPNN、LS-SVM及ELM等算法在時間復雜度和預測準確性方面作對比以驗證本文算法的有效性。另外,在做對比實驗之前,本文通過大量實驗研究了各算法參數(shù)的設置,如BPNN、ELM和OSELM算法隱含層節(jié)點數(shù)的設置以及AE-OSKELM算法中核樣本比例的大小與時間復雜度及預測準確性的關系等。最后,通過實驗對比發(fā)現(xiàn)本文提出的算法具有較好的抗噪能力,能夠很好的擬合仿真數(shù)據(jù)、UCI數(shù)據(jù)集及真實股價數(shù)據(jù)的預測曲線,在相同的時間復雜度情況下具有最小的預測誤差。通過本文的研究,一方面是對極限學習機理論的總結和完善,通過對極限學習機理論及其發(fā)展的歸納總結為后續(xù)研究提供借鑒,同時,本文提出了AE-OSKELM算法豐富了極限學習機的理論研究;另一方面,將在線核極限學習機與時間序列預測相結合,并通過大量實驗驗證了AE-OSKELM算法的有效性,為股票價格及其他時間序列數(shù)據(jù)的挖掘提供一種較好的預測方法。
【關鍵詞】:核極限學習機 時間序列預測 機器學習 選擇性集成
【學位授予單位】:安徽財經(jīng)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:O211.61;TP181
【目錄】:
- 摘要4-6
- abstract6-10
- 1 緒論10-19
- 1.1 研究背景10
- 1.2 研究意義與目的10-12
- 1.2.1 研究意義10-11
- 1.2.2 研究目的11-12
- 1.3 極限學習機理論12-17
- 1.3.1 單隱含層前饋神經(jīng)網(wǎng)絡(SLFN)模型12-14
- 1.3.2 極限學習機原理14-15
- 1.3.3 極限學習機研究現(xiàn)狀15-17
- 1.4 本文創(chuàng)新點及組織結構17-18
- 1.4.1 文章創(chuàng)新點17-18
- 1.4.2 組織結構18
- 1.5 本章小結18-19
- 2 ELM理論及其發(fā)展19-32
- 2.1 結構增長型ELM算法19-22
- 2.1.1 I-ELM(Incremental ELM)算法19-20
- 2.1.2 CI-ELM(Convex Incremental ELM)算法20-21
- 2.1.3 EM-ELM(Error Minimized ELM)算法21-22
- 2.2 結構遞減型ELM算法22-24
- 2.2.1 P-ELM(Pruned ELM)算法22-23
- 2.2.2 OP-ELM (Optimally-Pruned ELM)算法23-24
- 2.3 正則化極限學習機24-26
- 2.3.1 RELM(Regularized ELM)算法24-25
- 2.3.2 TROP-ELM(LARS and Tikhonov Regularized ELM)算法25-26
- 2.4 在線極限學習機26-28
- 2.4.1 OS-ELM(Online Sequential ELM)算法26-27
- 2.4.2 FOS-ELM(Forgetting OS-ELM)算法27-28
- 2.5 核極限學習機28-31
- 2.5.1 KELM(Kernel ELM)算法28-29
- 2.5.2 NKELM(Nystrom Kernel ELM)算法29-30
- 2.5.3 RKELM(Reduced Kernel ELM)算法30-31
- 2.6 本章小結31-32
- 3 引入時效機制的在線核極限學習機的優(yōu)化與集成32-46
- 3.1 引入時效機制的在線核極限學習機32-36
- 3.1.1 在線核極限學習機原理32-33
- 3.1.2 時間序列概念及其時效性特征33-34
- 3.1.3 引入時效性的在線核極限學習機34-36
- 3.2 果蠅算法優(yōu)化在線核極限學習機模型36-42
- 3.2.1 果蠅算法原理36-38
- 3.2.2 果蠅算法參數(shù)設置及改進38-39
- 3.2.3 改進果蠅算法優(yōu)化在線核極限學習機模型39-42
- 3.3 自適應集成在線核極限學習機42-45
- 3.3.1 集成權重的自適應調整42-43
- 3.3.2 模型的選擇性集成43-45
- 3.4 本章小結45-46
- 4 AE-OSKELM算法的仿真實驗與應用46-61
- 4.1 實驗環(huán)境與配置46
- 4.2 仿真實驗46-53
- 4.2.1 仿真數(shù)據(jù)的生成47
- 4.2.2 算法參數(shù)的設置47-50
- 4.2.3 實驗與評估50-53
- 4.3 UCI數(shù)據(jù)集測試53-57
- 4.3.1 數(shù)據(jù)來源及預處理53-54
- 4.3.2 實驗評估54-57
- 4.4 股價預測應用57-60
- 4.4.1 數(shù)據(jù)來源及預處理57
- 4.4.2 實驗評估57-60
- 4.5 本章小結60-61
- 5 總結與展望61-64
- 5.1 工作總結61-62
- 5.2 不足與展望62-64
- 參考文獻64-69
- 附錄69-71
- 攻讀碩士學位期間科研成果71-72
- 致謝72
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 施久玉,杜金觀;有限個狀態(tài)時間序列的某些結果[J];應用數(shù)學學報;1990年01期
2 馮希杰;長江三峽及其鄰區(qū)斷裂活動時間序列[J];華南地震;1991年02期
3 王霞,郭嗣琮,劉淑娟;時間序列模糊滑動預測[J];遼寧工程技術大學學報(自然科學版);1999年03期
4 溫品人;時間序列預測法的實際應用分析[J];江蘇廣播電視大學學報;2001年06期
5 許清海;混沌投資時間序列的嬗變[J];漳州師范學院學報(自然科學版);2003年01期
6 程毛林;時間序列系統(tǒng)建模預測的一種新方法[J];數(shù)學的實踐與認識;2004年08期
7 高潔;長記憶時間序列適應性預測的應用[J];江南大學學報;2004年05期
8 高潔;孫立新;;長記憶時間序列的適應性預測誤差的譜密度[J];統(tǒng)計與決策;2006年13期
9 楊鐘瑾;;淺談時間序列的分析預測[J];中國科技信息;2006年14期
10 李健;孫廣中;許胤龍;;基于時間序列的預測模型應用與異常檢測[J];計算機輔助工程;2006年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 周家斌;張海福;楊桂英;;多維多步時間序列預報方法及其應用[A];中國現(xiàn)場統(tǒng)計研究會第九屆學術年會論文集[C];1999年
2 馬培蓓;紀軍;;基于時間序列的航空備件消耗預測[A];中國系統(tǒng)工程學會決策科學專業(yè)委員會第六屆學術年會論文集[C];2005年
3 盧世坤;李夕海;牛超;陳蛟;;時間序列的非線性非平穩(wěn)特性研究綜述[A];國家安全地球物理叢書(八)——遙感地球物理與國家安全[C];2012年
4 李強;;基于線性模型方法對時間序列中異常值的檢測及證券實證分析[A];加入WTO和中國科技與可持續(xù)發(fā)展——挑戰(zhàn)與機遇、責任和對策(上冊)[C];2002年
5 戴麗金;何振峰;;基于云模型的時間序列相似性度量方法[A];第八屆中國不確定系統(tǒng)年會論文集[C];2010年
6 謝美萍;趙希人;莊秀龍;;多維非線性時間序列的投影尋蹤學習逼近[A];'99系統(tǒng)仿真技術及其應用學術交流會論文集[C];1999年
7 張大斌;李紅燕;劉肖;張文生;;非線性時問序列的小波-模糊神經(jīng)網(wǎng)絡集成預測方法[A];第十五屆中國管理科學學術年會論文集(下)[C];2013年
8 黃云貴;;基于時間序列的電網(wǎng)固定資產(chǎn)投資規(guī)模研究[A];2012年云南電力技術論壇論文集(文摘部分)[C];2012年
9 李松臣;張世英;;時間序列高階矩持續(xù)和協(xié)同持續(xù)性研究[A];21世紀數(shù)量經(jīng)濟學(第8卷)[C];2007年
10 陳赫;羅聲求;;歷史橫斷面數(shù)據(jù)的時間序列化[A];科學決策與系統(tǒng)工程——中國系統(tǒng)工程學會第六次年會論文集[C];1990年
中國重要報紙全文數(shù)據(jù)庫 前6條
1 ;《時間序列與金融數(shù)據(jù)分析》[N];中國信息報;2004年
2 何德旭 王朝陽;時間序列計量經(jīng)濟學:協(xié)整與有條件的異方差自回歸[N];中國社會科學院院報;2003年
3 劉俏;讓數(shù)據(jù)坦白真相[N];21世紀經(jīng)濟報道;2003年
4 西南證券高級研究員 董先安邋德圣基金研究中心 郭奔宇;預計6月CPI同比上漲7.2%[N];證券時報;2008年
5 東證期貨 王愛華 楊衛(wèi)東;兩年漲跌輪回 秋季普遍下跌[N];期貨日報;2009年
6 任勇邋鄭重;中國對世界鋼材價格的影響實證分析[N];現(xiàn)代物流報;2007年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 張墨謙;遙感時間序列數(shù)據(jù)的特征挖掘:在生態(tài)學中的應用[D];復旦大學;2014年
2 張德成;滑坡預測預報研究[D];昆明理工大學;2015年
3 苗圣法;時間序列的模式檢測[D];蘭州大學;2015年
4 翁同峰;時間序列與復雜網(wǎng)絡之間等價性問題及表征應用研究[D];哈爾濱工業(yè)大學;2015年
5 楊婷婷;用Argo浮標結合衛(wèi)星觀測估算北太平洋經(jīng)向熱輸運[D];中國科學院研究生院(海洋研究所);2015年
6 王曉曄;時間序列數(shù)據(jù)挖掘中相似性和趨勢預測的研究[D];天津大學;2003年
7 李桂玲;時間序列的分割及不一致發(fā)現(xiàn)研究[D];華中科技大學;2012年
8 周勇;時間序列時序關聯(lián)規(guī)則挖掘研究[D];西南財經(jīng)大學;2008年
9 張勇;時間序列模式匹配技術研究[D];華中科技大學;2012年
10 董曉莉;時間序列數(shù)據(jù)挖掘相似性度量和周期模式挖掘研究[D];天津大學;2007年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 陳健;基于多變量相空間重構的投資組合策略研究[D];華南理工大學;2015年
2 蘭鑫;時間序列的復雜網(wǎng)絡轉換策略研究[D];西南大學;2015年
3 米曉將;區(qū)域尺度下月均氣溫的時空演化格局研究[D];昆明理工大學;2015年
4 張鳴敏;基于支持向量回歸的PM_(2.5)濃度預測研究[D];南京信息工程大學;2015年
5 林健;基于改進小世界回聲狀態(tài)網(wǎng)的時間序列預測[D];渤海大學;2015年
6 曹智麗;日氣溫和干旱指數(shù)支持向量回歸預測方法[D];南京信息工程大學;2015年
7 高雄飛;基于分形理論的土壤含水量時間序列特性分析[D];長安大學;2015年
8 姚茜;城市安全生產(chǎn)發(fā)展目標研究[D];中國地質大學(北京);2015年
9 謝翠穎;蘇州社會消費品零售總額簡析[D];蘇州大學;2015年
10 包仁義;基于時間序列的搜索引擎評估模型算法研究[D];東北師范大學;2015年
本文關鍵詞:在線核極限學習機的改進與應用研究,由筆耕文化傳播整理發(fā)布。
,本文編號:299150
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/299150.html