基于Ada-CDT模型在股票漲跌多分類上的研究
發(fā)布時間:2021-07-13 12:04
股票是一種高風險且高收益的投資項目,投資者利用股票價格的變化得到差價收益。本文提出全新的模型對股票漲跌率進行三分類,根據結果為投資者在第二日開盤時提出買入、持中或賣出建議。本文提出一種全新的自適應級聯決策樹模型(Ada-CDT),將級聯結構和結合,本文的創(chuàng)新為:一、引入錯分代價系數對算法進行改進,增加實際意義;二、建立全新的模型,每層級聯結構由決策樹組成,弱分類器通過規(guī)則連接,這里的為引入代價系數后的改進算法;三、對股票漲跌率標簽進行研究,確定分類標簽閾值,選擇處作為標簽分類數值;并對同金融證券類型的股票進行相關性分析,選擇強相關性的股票進行實證分析。將新模型Ada-CDT應用于股票分類上,根據收益對股票進行三分類,以中信證券股票(代碼:600030)為基礎股票,再選擇其他同類型強相關性的13只股票進行實證分析,通過ROC曲線和AUC值來對模型進行評估,并對比四種算法。結果發(fā)現構建的模型在證券類股票上相較于其他算法有很好的分類效果。
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數】:48 頁
【學位級別】:碩士
【部分圖文】:
一goFo此st算法多粒度掃描
?第3章Ada-CDT模型的構建??圖3-2?Ada-CDT模型特征選取部分??如圖3-2所示,我們用固定長度大小為m的滑塊在特征集上進行滑動,特征集??中的總特征數為M。在這里要強調一下,由于特征之間有一定的相關性,所以我??們將M個特征打亂順序后隨機排列成一排,讓滑塊來滑動得到M?m?+1個特征子??集,為我們后續(xù)的級聯結構中每一級的訓練特征輸入做準備。??3.?2.?2級聯結構??在級聯結構中,每一級為一個?^強分類器。由第二章介紹知,??由若干個弱分類器組合而成,這里我們用的弱分類器為C4.5決策樹。??t?H?Rl?B??I?-?mu?-?匚二]?????1?al?.?□:!??a?*?<?*?<?*?<?栗??concatenate?議?|?|??I?L-l?L-l?i-l??Level?1?I?Level?2?|?I?Level?N??圖3-3?Ada-CDT模型級聯部分??由圖3-3所示,在級聯結構中,每一級所用的樣本均為同一個訓練樣本。在第??一層級聯結構中
?第3章Ada-CDT模型的構建??圖3-2?Ada-CDT模型特征選取部分??如圖3-2所示,我們用固定長度大小為m的滑塊在特征集上進行滑動,特征集??中的總特征數為M。在這里要強調一下,由于特征之間有一定的相關性,所以我??們將M個特征打亂順序后隨機排列成一排,讓滑塊來滑動得到M?m?+1個特征子??集,為我們后續(xù)的級聯結構中每一級的訓練特征輸入做準備。??3.?2.?2級聯結構??在級聯結構中,每一級為一個?^強分類器。由第二章介紹知,??由若干個弱分類器組合而成,這里我們用的弱分類器為C4.5決策樹。??t?H?Rl?B??I?-?mu?-?匚二]?????1?al?.?□:!??a?*?<?*?<?*?<?栗??concatenate?議?|?|??I?L-l?L-l?i-l??Level?1?I?Level?2?|?I?Level?N??圖3-3?Ada-CDT模型級聯部分??由圖3-3所示,在級聯結構中,每一級所用的樣本均為同一個訓練樣本。在第??一層級聯結構中
【參考文獻】:
期刊論文
[1]機構投資者對公司研發(fā)投入的影響研究——基于股票流動性視角[J]. 張根明,陳啟實. 財會通訊. 2019(09)
[2]調和平均優(yōu)化選擇劃分屬性的決策樹改進算法[J]. 王卓,聶斌,羅計根,杜建強,陳愛,周麗. 江西師范大學學報(自然科學版). 2018(04)
[3]股票價格預測中機器學習的應用[J]. 喻永生. 科技經濟導刊. 2018(12)
[4]基于投資者情緒的股票價格及成交量預測研究[J]. 陳曉紅,彭宛露,田美玉. 系統(tǒng)科學與數學. 2016(12)
[5]基于ARIMA模型的短期股票價格預測[J]. 吳玉霞,溫欣. 統(tǒng)計與決策. 2016(23)
[6]基于樣本權重的不平衡數據欠抽樣方法[J]. 熊冰妍,王國胤,鄧維斌. 計算機研究與發(fā)展. 2016(11)
[7]基于ARMA-GARCH模型的股票價格分析與預測[J]. 楊琦,曹顯兵. 數學的實踐與認識. 2016(06)
[8]基于C4.5決策樹的股票數據挖掘[J]. 王領,胡揚. 計算機與現代化. 2015(10)
[9]基于粒子群算法的決策樹SVM多分類方法研究[J]. 王道明,魯昌華,蔣薇薇,肖明霞,李必然. 電子測量與儀器學報. 2015(04)
[10]基于代價敏感的AdaBoost算法改進[J]. 王學玲,王建林. 計算機應用與軟件. 2013(10)
碩士論文
[1]一種新的不平衡數據處理方法在股票分類中的應用[D]. 張雨晴.北京交通大學 2018
[2]基于實時數據流處理的http數據分析可視化系統(tǒng)[D]. 潘冬.電子科技大學 2016
本文編號:3282026
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數】:48 頁
【學位級別】:碩士
【部分圖文】:
一goFo此st算法多粒度掃描
?第3章Ada-CDT模型的構建??圖3-2?Ada-CDT模型特征選取部分??如圖3-2所示,我們用固定長度大小為m的滑塊在特征集上進行滑動,特征集??中的總特征數為M。在這里要強調一下,由于特征之間有一定的相關性,所以我??們將M個特征打亂順序后隨機排列成一排,讓滑塊來滑動得到M?m?+1個特征子??集,為我們后續(xù)的級聯結構中每一級的訓練特征輸入做準備。??3.?2.?2級聯結構??在級聯結構中,每一級為一個?^強分類器。由第二章介紹知,??由若干個弱分類器組合而成,這里我們用的弱分類器為C4.5決策樹。??t?H?Rl?B??I?-?mu?-?匚二]?????1?al?.?□:!??a?*?<?*?<?*?<?栗??concatenate?議?|?|??I?L-l?L-l?i-l??Level?1?I?Level?2?|?I?Level?N??圖3-3?Ada-CDT模型級聯部分??由圖3-3所示,在級聯結構中,每一級所用的樣本均為同一個訓練樣本。在第??一層級聯結構中
?第3章Ada-CDT模型的構建??圖3-2?Ada-CDT模型特征選取部分??如圖3-2所示,我們用固定長度大小為m的滑塊在特征集上進行滑動,特征集??中的總特征數為M。在這里要強調一下,由于特征之間有一定的相關性,所以我??們將M個特征打亂順序后隨機排列成一排,讓滑塊來滑動得到M?m?+1個特征子??集,為我們后續(xù)的級聯結構中每一級的訓練特征輸入做準備。??3.?2.?2級聯結構??在級聯結構中,每一級為一個?^強分類器。由第二章介紹知,??由若干個弱分類器組合而成,這里我們用的弱分類器為C4.5決策樹。??t?H?Rl?B??I?-?mu?-?匚二]?????1?al?.?□:!??a?*?<?*?<?*?<?栗??concatenate?議?|?|??I?L-l?L-l?i-l??Level?1?I?Level?2?|?I?Level?N??圖3-3?Ada-CDT模型級聯部分??由圖3-3所示,在級聯結構中,每一級所用的樣本均為同一個訓練樣本。在第??一層級聯結構中
【參考文獻】:
期刊論文
[1]機構投資者對公司研發(fā)投入的影響研究——基于股票流動性視角[J]. 張根明,陳啟實. 財會通訊. 2019(09)
[2]調和平均優(yōu)化選擇劃分屬性的決策樹改進算法[J]. 王卓,聶斌,羅計根,杜建強,陳愛,周麗. 江西師范大學學報(自然科學版). 2018(04)
[3]股票價格預測中機器學習的應用[J]. 喻永生. 科技經濟導刊. 2018(12)
[4]基于投資者情緒的股票價格及成交量預測研究[J]. 陳曉紅,彭宛露,田美玉. 系統(tǒng)科學與數學. 2016(12)
[5]基于ARIMA模型的短期股票價格預測[J]. 吳玉霞,溫欣. 統(tǒng)計與決策. 2016(23)
[6]基于樣本權重的不平衡數據欠抽樣方法[J]. 熊冰妍,王國胤,鄧維斌. 計算機研究與發(fā)展. 2016(11)
[7]基于ARMA-GARCH模型的股票價格分析與預測[J]. 楊琦,曹顯兵. 數學的實踐與認識. 2016(06)
[8]基于C4.5決策樹的股票數據挖掘[J]. 王領,胡揚. 計算機與現代化. 2015(10)
[9]基于粒子群算法的決策樹SVM多分類方法研究[J]. 王道明,魯昌華,蔣薇薇,肖明霞,李必然. 電子測量與儀器學報. 2015(04)
[10]基于代價敏感的AdaBoost算法改進[J]. 王學玲,王建林. 計算機應用與軟件. 2013(10)
碩士論文
[1]一種新的不平衡數據處理方法在股票分類中的應用[D]. 張雨晴.北京交通大學 2018
[2]基于實時數據流處理的http數據分析可視化系統(tǒng)[D]. 潘冬.電子科技大學 2016
本文編號:3282026
本文鏈接:http://www.sikaile.net/jingjilunwen/jinrongzhengquanlunwen/3282026.html