基于百度指數(shù)和隨機森林的上證綜指預測
發(fā)布時間:2021-01-08 14:41
股市走勢預測是金融學、統(tǒng)計學、機器學習等多學科交叉研究的熱點學術問題。股市走勢并不完全由自身內(nèi)在規(guī)律決定,也會受到投資者的關注度的影響。本文研究了投資者關注與上海證券綜合指數(shù)之間的波動效應,提出了一種基于百度指數(shù)并結合隨機森林模型的上證指數(shù)走勢預測方法;谝延械某跏妓阉麝P鍵詞詞庫在百度指數(shù)網(wǎng)站獲取相應的關鍵詞的百度指數(shù),通過時差相關分析法篩選出具有預測意義的關鍵詞,將篩選后的關鍵詞的百度指數(shù)數(shù)據(jù)和上證指數(shù)的相關屬性數(shù)據(jù)作為預測模型的輸入數(shù)據(jù),通過隨機森林建立預測模型并實現(xiàn)對上證指數(shù)的預測。對比實驗證明引入百度指數(shù)后的預測模型比傳統(tǒng)的預測模型具有更高的準確率。
【文章來源】:軟件. 2020,41(06)
【文章頁數(shù)】:7 頁
【部分圖文】:
整體預測流程
本次實驗的預測結果與實際值對比圖
圖2 本次實驗的預測結果與實際值對比圖橫坐標是從1到60的自然數(shù),代表從2018年5月3號到2018年7月27號的日期,縱坐標表示大盤指數(shù)收盤值,藍色的散點為模型預測結果,黃色的散點為實際值。圖2為包含搜索指數(shù)數(shù)據(jù)的實驗結果,圖3為不包含百度指數(shù)數(shù)據(jù)的實驗結果。由圖可知,在加入百度指數(shù)后預測值走勢與真實值的走勢更為接近,比如在橫坐標為50的數(shù)據(jù)附近,真實值是一直呈下跌趨勢,加入百度指數(shù)后的預測值呈相同趨勢,但是沒有百度指數(shù)的預測值走勢不穩(wěn)定。從RMSE和MAPE指標來看,加入百度指數(shù)的實驗結果都比不加百度指數(shù)的實驗結果低,也就是具有更高的準確率?偟膩碚f,實際的上證指數(shù)的收盤值在某些時候有較大波動,這些波動會影響RMSE和MAPE指標,但是從實驗的數(shù)據(jù)集來看上證指數(shù)的漲跌幅,有98%的數(shù)據(jù)的漲跌幅在5%以內(nèi),也就是基本波動不會超過5%,本實驗使用百度指數(shù)的數(shù)據(jù)來預測的收盤值和真實值的誤差百分比都在5%以內(nèi),表明預測值具有一定可靠性和準確性。
【參考文獻】:
期刊論文
[1]基于文本挖掘和百度指數(shù)的投資者情緒指數(shù)研究[J]. 孟雪井,孟祥蘭,胡楊洋. 宏觀經(jīng)濟研究. 2016(01)
博士論文
[1]隨機森林算法優(yōu)化研究[D]. 曹正鳳.首都經(jīng)濟貿(mào)易大學 2014
碩士論文
[1]基于百度指數(shù)的投資者關注度對于股票市場表現(xiàn)的影響[D]. 繆杰.廈門大學 2014
[2]關注度對股票收益率的影響—中國證券市場的實證研究[D]. 王京晶.上海交通大學 2012
[3]基于搜索關鍵詞關注度的中國股票市場波動研究[D]. 孫文存.哈爾濱工業(yè)大學 2012
本文編號:2964779
【文章來源】:軟件. 2020,41(06)
【文章頁數(shù)】:7 頁
【部分圖文】:
整體預測流程
本次實驗的預測結果與實際值對比圖
圖2 本次實驗的預測結果與實際值對比圖橫坐標是從1到60的自然數(shù),代表從2018年5月3號到2018年7月27號的日期,縱坐標表示大盤指數(shù)收盤值,藍色的散點為模型預測結果,黃色的散點為實際值。圖2為包含搜索指數(shù)數(shù)據(jù)的實驗結果,圖3為不包含百度指數(shù)數(shù)據(jù)的實驗結果。由圖可知,在加入百度指數(shù)后預測值走勢與真實值的走勢更為接近,比如在橫坐標為50的數(shù)據(jù)附近,真實值是一直呈下跌趨勢,加入百度指數(shù)后的預測值呈相同趨勢,但是沒有百度指數(shù)的預測值走勢不穩(wěn)定。從RMSE和MAPE指標來看,加入百度指數(shù)的實驗結果都比不加百度指數(shù)的實驗結果低,也就是具有更高的準確率?偟膩碚f,實際的上證指數(shù)的收盤值在某些時候有較大波動,這些波動會影響RMSE和MAPE指標,但是從實驗的數(shù)據(jù)集來看上證指數(shù)的漲跌幅,有98%的數(shù)據(jù)的漲跌幅在5%以內(nèi),也就是基本波動不會超過5%,本實驗使用百度指數(shù)的數(shù)據(jù)來預測的收盤值和真實值的誤差百分比都在5%以內(nèi),表明預測值具有一定可靠性和準確性。
【參考文獻】:
期刊論文
[1]基于文本挖掘和百度指數(shù)的投資者情緒指數(shù)研究[J]. 孟雪井,孟祥蘭,胡楊洋. 宏觀經(jīng)濟研究. 2016(01)
博士論文
[1]隨機森林算法優(yōu)化研究[D]. 曹正鳳.首都經(jīng)濟貿(mào)易大學 2014
碩士論文
[1]基于百度指數(shù)的投資者關注度對于股票市場表現(xiàn)的影響[D]. 繆杰.廈門大學 2014
[2]關注度對股票收益率的影響—中國證券市場的實證研究[D]. 王京晶.上海交通大學 2012
[3]基于搜索關鍵詞關注度的中國股票市場波動研究[D]. 孫文存.哈爾濱工業(yè)大學 2012
本文編號:2964779
本文鏈接:http://www.sikaile.net/guanlilunwen/zhqtouz/2964779.html
最近更新
教材專著