天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟(jì)論文 > 股票論文 >

基于小波消噪的聚類模式挖掘在股票收益率預(yù)測中的應(yīng)用

發(fā)布時間:2020-05-23 04:11
【摘要】:金融管理研究的一個顯著特點是數(shù)據(jù)分析量非常大、不確定性因素多,面對當(dāng)今時代的海量金融數(shù)據(jù),基于傳統(tǒng)的統(tǒng)計技術(shù)建立的模型假設(shè)條件多,在實際應(yīng)用中難以湊效。數(shù)據(jù)挖掘是20世紀(jì)90年代中期興起的統(tǒng)計決策新技術(shù),其過程是發(fā)現(xiàn)海量數(shù)據(jù)中有用的模式,目的在于使用所發(fā)現(xiàn)的模式幫助解釋當(dāng)前的行為或預(yù)測未來的結(jié)果,以人們?nèi)菀桌斫獾男问教峁┯杏玫臎Q策信息。 隨著IPO的重啟,我國的股票市場不斷的擴(kuò)張,股票交易數(shù)據(jù)規(guī)模越來越大,尋找股票價格有價值的模式信息也越來越困難。股票時間序列本質(zhì)上具有非線性、非平穩(wěn)、信噪比低的特點,數(shù)據(jù)挖掘是為了發(fā)現(xiàn)序列中隱含的一些本質(zhì)規(guī)律,高噪聲的存在一方面淡化規(guī)律的顯著性,另一方面也可能會提供一些假信息,從而嚴(yán)重影響數(shù)據(jù)挖掘的效果。 針對上述兩個關(guān)鍵問題,本文重點研究了基于小波消噪的聚類模式挖掘在股票收益率預(yù)測中的應(yīng)用。本文主要擬完成的研究工作包括以下幾個方面: (1)探討了數(shù)據(jù)挖掘技術(shù)應(yīng)用在金融領(lǐng)域的重要性和必要性;并就從海量金融數(shù)據(jù)中挖掘其隱含模式進(jìn)行可能性分析; (2)考慮到金融時間序列數(shù)據(jù)的高噪聲性,本文擬利用小波去噪方法對數(shù)據(jù)進(jìn)行預(yù)處理,并提出改進(jìn)的小波閡值去噪方法,選取合適的小波基函數(shù)、閾值準(zhǔn)則、閾值處理函數(shù)和分解層數(shù)對數(shù)據(jù)進(jìn)行去噪處理; (3)結(jié)合聚類分析方法和時態(tài)序列模式挖掘技術(shù)構(gòu)建聚類時態(tài)序列模式挖掘技術(shù)模型,改進(jìn)傳統(tǒng)的時態(tài)序列模式挖掘技術(shù)中的不足之處,優(yōu)化其算法,并利用隨機(jī)數(shù)據(jù)進(jìn)行模擬實驗,驗證其模式挖掘的效果; (4)利用構(gòu)建的聚類時態(tài)模式挖掘技術(shù)模型進(jìn)行實證研究,選取滬深兩市各20只股票,選取2005年1月31日到2007年12月31日的股票收盤價為數(shù)據(jù)樣本,將其中前一半數(shù)據(jù)作為模式挖掘?qū)ο?后一半數(shù)據(jù)作為模式驗證對象,判斷模式挖掘的有效性,并利用挖掘出的隱含模式對未來作出決策和預(yù)測。
【圖文】:

聚類,層次聚類,凝聚法


發(fā)現(xiàn)任意形狀的類。基于密度的聚類方法主要有基于高密度區(qū)域連接的DBSCAN、基于密度分度函數(shù)的DENCLUE和基于數(shù)據(jù)排序的OPTICS方法等。基于密度的聚類是對數(shù)據(jù)發(fā)生頻率的刻畫,如圖2一1所示。..勺補一一。一.。.一二.:圖2一1不同密度的聚類2.2.4層次聚類方法層次聚類法,也稱為系統(tǒng)聚類方法,是對給定的數(shù)據(jù)集按層次分解,形成一顆以數(shù)據(jù)子集為節(jié)點的樹。層次聚類法按照聚類的過程可分為凝聚(a路lomerative)和分裂(divisive)兩類方法。凝聚法就是把每個數(shù)據(jù)點看作一類,采用自底向上的方法,把最鄰近的點合為一類,再把這個類和其他最臨近的類結(jié)合,知道所有數(shù)據(jù)合并成一類或滿足某一個給定的閩值條件為止[32]。而分裂法則剛好相反,是把所有數(shù)據(jù)看作一類,采用自頂而下的方法,按兩個子類距離最大原則,將一個類分成若干子類,直到每個數(shù)據(jù)點自成一類或滿足給定的閉值條件為止。其中閩值條件一般是用戶希望得到的類的數(shù)目。AGNEs(agglomerative)和 nIANA(divisiveanal”15)(Kau加 anetal.1990)是早期的層次聚類法,前者屬于凝聚法,后者屬于分裂法。代表性的層次方法有CURE、Chameleon和BIRCH。AGNES和DIANA聚類過程如圖2一2所示。

層次聚類,聚類


發(fā)現(xiàn)任意形狀的類;诿芏鹊木垲惙椒ㄖ饕谢诟呙芏葏^(qū)域連接的DBSCAN、基于密度分度函數(shù)的DENCLUE和基于數(shù)據(jù)排序的OPTICS方法等;诿芏鹊木垲愂菍(shù)據(jù)發(fā)生頻率的刻畫,,如圖2一1所示。..勺補一一。一.。.一二.:圖2一1不同密度的聚類2.2.4層次聚類方法層次聚類法,也稱為系統(tǒng)聚類方法,是對給定的數(shù)據(jù)集按層次分解,形成一顆以數(shù)據(jù)子集為節(jié)點的樹。層次聚類法按照聚類的過程可分為凝聚(a路lomerative)和分裂(divisive)兩類方法。凝聚法就是把每個數(shù)據(jù)點看作一類,采用自底向上的方法,把最鄰近的點合為一類,再把這個類和其他最臨近的類結(jié)合,知道所有數(shù)據(jù)合并成一類或滿足某一個給定的閩值條件為止[32]。而分裂法則剛好相反,是把所有數(shù)據(jù)看作一類,采用自頂而下的方法,按兩個子類距離最大原則,將一個類分成若干子類,直到每個數(shù)據(jù)點自成一類或滿足給定的閉值條件為止。其中閩值條件一般是用戶希望得到的類的數(shù)目。AGNEs(agglomerative)和 nIANA(divisiveanal”15)(Kau加 anetal.1990)是早期的層次聚類法,前者屬于凝聚法,后者屬于分裂法。代表性的層次方法有CURE、Chameleon和BIRCH。AGNES和DIANA聚類過程如圖2一2所示。
【學(xué)位授予單位】:武漢理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2010
【分類號】:F224;F832.51

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 孫倩;;摭論“圖書情報學(xué)博客”的組織和管理模式[J];中國報業(yè);2011年06期

2 ;[J];;年期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相關(guān)會議論文 前10條

1 李潤恒;賈焰;金鑫;;一種面向網(wǎng)絡(luò)安全的序列模式挖掘方法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年

2 李晟;姜青山;郭順;王備戰(zhàn);;一種優(yōu)化的蛋白質(zhì)序列模式挖掘方法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年

3 朱輝生;李存華;;序列模式挖掘的研究與實現(xiàn)[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年

4 趙暢;楊冬青;唐世渭;郭迎春;;Web日志序列模式挖掘工具SPMiner的設(shè)計[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年

5 牛興雯;楊冬青;唐世渭;王騰蛟;;OSAF-tree——可迭代的移動序列模式挖掘及增量更新方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年

6 任家東;解玉潔;何海濤;張愛國;;基于改進(jìn)前綴樹PStree的最大序列模式挖掘[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年

7 劉琪;牛文靜;顧兆軍;;基于API調(diào)用序列的惡意代碼動態(tài)分析方法研究[A];2009年研究生學(xué)術(shù)交流會通信與信息技術(shù)論文集[C];2009年

8 竇赫男;劉正捷;夏季;;序列模式挖掘在網(wǎng)站可用性分析研究上的應(yīng)用[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2006)——第2屆中國人機(jī)交互學(xué)術(shù)會議(CHCI'06)論文集[C];2006年

9 何星星;謝伙生;;流數(shù)據(jù)中一種高效剪枝的頻繁序列挖掘算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年

10 周濤;;基于數(shù)據(jù)挖掘的入侵檢測日志分析技術(shù)研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會議程序冊[C];2010年

相關(guān)重要報紙文章 前1條

1 惠琳;數(shù)據(jù)挖掘 提升核心競爭力[N];首都建設(shè)報;2009年

相關(guān)博士學(xué)位論文 前10條

1 楊鈐雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大學(xué);2010年

2 謝飛;帶有通配符的序列模式挖掘研究[D];合肥工業(yè)大學(xué);2011年

3 劉維;生物序列模式挖掘與識別算法的研究[D];南京航空航天大學(xué);2010年

4 蘭秋軍;金融時間序列隱含模式挖掘方法及其應(yīng)用研究[D];湖南大學(xué);2005年

5 王濤;挖掘序列模式和結(jié)構(gòu)化模式的精簡集[D];華中科技大學(xué);2006年

6 宋世杰;基于序列模式挖掘的誤用入侵檢測系統(tǒng)及其關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2005年

7 金陽;基于概念格模型的序列模式挖掘算法研究[D];吉林大學(xué);2007年

8 熊峗;生物序列模式挖掘與聚類研究[D];復(fù)旦大學(xué);2007年

9 葉紅云;面向金融營銷問題的個性化推薦方法研究[D];合肥工業(yè)大學(xué);2011年

10 單莘;基于知識發(fā)現(xiàn)的告警相關(guān)性分析關(guān)鍵問題研究[D];北京郵電大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 王永強(qiáng);基于DF2Ls的序列模式挖掘研究[D];蘭州大學(xué);2011年

2 柳建芳;基于小波消噪的聚類模式挖掘在股票收益率預(yù)測中的應(yīng)用[D];武漢理工大學(xué);2010年

3 任芳;時間序列數(shù)據(jù)挖掘研究[D];遼寧師范大學(xué);2010年

4 魏龍;GML時空序列模式挖掘研究[D];江西理工大學(xué);2011年

5 竇赫男;序列模式挖掘在網(wǎng)站可用性分析研究上的應(yīng)用[D];大連海事大學(xué);2006年

6 祝效普;WEB用戶訪問序列模式挖掘[D];天津大學(xué);2005年

7 梁偉;Web使用挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];天津大學(xué);2004年

8 管恩政;序列模式挖掘算法研究[D];吉林大學(xué);2005年

9 仇大偉;基于序列數(shù)據(jù)庫的數(shù)據(jù)挖掘系統(tǒng)的設(shè)計和研究[D];山東科技大學(xué);2005年

10 郭躍斌;基于序列模式的正負(fù)關(guān)聯(lián)規(guī)則挖掘技術(shù)[D];山東輕工業(yè)學(xué)院;2008年



本文編號:2677129

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/jinrongzhengquanlunwen/2677129.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶78361***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com