基于LightGBM算法的股指漲跌預測方案
發(fā)布時間:2021-10-24 05:05
一直以來金融時間序列的預測問題都是投資者和學者的研究重點,但股市受多種復雜因素影響,預測難度較大。隨著計算機技術的發(fā)展,越來越多的機器學習方法應用于金融時間序列的預測問題中,尤其在股票價格指數漲跌預測中具有很強的適用性。本文以LightGBM算法為基礎構建股票指數漲跌預測模型,對滬深300指數和中證500指數的漲跌進行預測,選取12個技術指標作為輸入特征,第二天的漲跌作為輸出變量。同時,為了優(yōu)化模型的預測效果,運用邏輯回歸聯合LightGBM算法的方法,構建LR-LightGBM模型對兩個股指進行預測,利用網格搜索法對算法中的參數進行尋優(yōu),比較上述兩個模型的預測效果。本文選取2012年1月1日至2019年12月31日的交易日數據進行實證研究,結果顯示上述預測模型對股指漲跌的預測均有較好的適用性,對于滬深300指數的預測效果較好,并且邏輯回歸有助于提高LightGBM模型的預測準確率。然后基于LightGBM模型和LR-LightGBM模型的預測結果,構建量化擇時策略,以嘉實滬深300ETF為交易對象進行回測。從風險和收益方面,綜合比較兩個模型,發(fā)現基于LR-LightGBM模型的股指漲...
【文章來源】:上海師范大學上海市
【文章頁數】:52 頁
【學位級別】:碩士
【部分圖文】:
Sigmoid函數分布圖
上海師范大學碩士學位論文第4章基于LightGBM算法的股指漲跌預測方案設計31令TP、FP、TN、FN分別表示上述四種情況的實例的數量,樣本總數等于上述四種情況數量之和。二分類結果的混淆矩陣如表4.2所示:表4.2分類結果的混淆矩陣真實情況預測結果正例反例正例TP(真正例)FN(假反例)反例FP(假正例)TN(真反例)準確率(accuracy)和F1值是常用來度量分類結果,F1值是由精準率與召回率調和計算得到,F1值距離精準率與召回率中較小的值更近。計算公式如下(4-11)至(4-14)所示:準確率(accuracy)=TPTNTPFNFPTN(4-11)精準率(precison)=TPTPFP(4-12)召回率(recall)=TPTPFN(4-13)2**1precisionrecallFprecisionrecall(4-14)ROC曲線是常用的二分類模型評估標準,AUC(AreaUnderCurve)被定義為ROC曲線下的面積,數值不大于1。ROC曲線橫軸為負正類率(FPR),即分類器模型所分的正例中的本來為負例與所有負例之比,縱軸為真正類率(TPR),即分類器模型所分的正例中本來的正例與所有正例之比。AUC值越大的分類模型,正確率越高。如圖4.7所示,ROC曲線越靠近左上角,AUC值越大,模型精度越高。圖4.7ROC曲線圖
上海師范大學碩士學位論文第4章基于LightGBM算法的股指漲跌預測方案設計33圖4.8滬深300指數模型ROC曲線(左)和中證500指數模型ROC曲線(右)然后利用邏輯回歸聯合LightGBM算法,構建LR-LightGBM模型,同樣輸入12個連續(xù)技術指標,并分別預測滬深300指數和中證500指數的漲跌,最優(yōu)參數取值和預測結果如下表4.5所示。表4.5LR-LightGBM模型的參數取值參數名稱參數取值滬深300中證500max_depth77num_leaves2030learning_rate0.10.1feature_fraction0.80.8bagging_fraction0.80.8num_iterations20202從表4.6列出的預測結果可知,與LightGBM模型相比,LR-LightGBM模型預測效果更好,F1值和準確率提高明顯。其中,滬深300指數的預測精度提高3.4%左右,中證500指數的預測精度提高1.5%左右,說明聯合邏輯回歸可以在一定程度上優(yōu)化LightGBM模型的預測精度。表4.6LR-LightGBM模型預測結果預測結果滬深300中證500F1值0.57280.5419準確率0.57290.5523下圖4.9中展示了LR-LightGBM模型預測兩個指數的ROC曲線,AUC值分別為0.5840和0.5660,與LightGBM模型的AUC值相比均有所增加,再次印證LR-LightGBM模型的分類效果優(yōu)于LightGBM模型。將邏輯回歸模型的預測得分與技術指標一起輸入LightGBM訓練,提供了更多關于股指趨勢變動的信息,有助于提高預測模型的預測精度并且可以防止過擬合。此外,綜合兩個模型預測結果的F1值、準確率和AUC值可知,模型預測滬深300指數漲跌的效果略高于中證
【參考文獻】:
期刊論文
[1]基于機器學習的股票超額收益預測模型[J]. 蔡清權,馬雲勻,李金妹. 信息系統(tǒng)工程. 2019(09)
[2]股票市場短期趨勢的離散分類預測模型研究[J]. 李緗珍. 經濟研究導刊. 2019(26)
[3]茅臺股價一路走紅的基本面分析[J]. 劉濤. 中國集體經濟. 2018(28)
[4]基于偏最小二乘方法的ARIMA模型在股票指數預測中的應用[J]. 方坷昊,趙凌. 四川文理學院學報. 2018(05)
[5]基于EMD和ARMA模型的上證指數預測[J]. 吳振宇,喻敏,金吉,姜楠. 中國商論. 2018(16)
[6]GBDT組合模型在股票預測中的應用[J]. 張瀟,韋增欣,楊天山. 海南師范大學學報(自然科學版). 2018(01)
[7]基于ARIMA模型對上證指數趨勢的預測[J]. 李曉先. 遼寧經濟. 2017(07)
[8]基于C4.5決策樹的股票數據挖掘[J]. 王領,胡揚. 計算機與現代化. 2015(10)
[9]基于ARIMA模型對上證指數月度時間序列的分析和預測[J]. 崔遠遠,文忠橋. 棗莊學院學報. 2015(02)
[10]兼顧基本面與估值指標的價值投資策略實證研究——來自2000-2013年中國滬深A股市場的經驗數據[J]. 姚輝,武婷婷. 投資研究. 2014(11)
本文編號:3454633
【文章來源】:上海師范大學上海市
【文章頁數】:52 頁
【學位級別】:碩士
【部分圖文】:
Sigmoid函數分布圖
上海師范大學碩士學位論文第4章基于LightGBM算法的股指漲跌預測方案設計31令TP、FP、TN、FN分別表示上述四種情況的實例的數量,樣本總數等于上述四種情況數量之和。二分類結果的混淆矩陣如表4.2所示:表4.2分類結果的混淆矩陣真實情況預測結果正例反例正例TP(真正例)FN(假反例)反例FP(假正例)TN(真反例)準確率(accuracy)和F1值是常用來度量分類結果,F1值是由精準率與召回率調和計算得到,F1值距離精準率與召回率中較小的值更近。計算公式如下(4-11)至(4-14)所示:準確率(accuracy)=TPTNTPFNFPTN(4-11)精準率(precison)=TPTPFP(4-12)召回率(recall)=TPTPFN(4-13)2**1precisionrecallFprecisionrecall(4-14)ROC曲線是常用的二分類模型評估標準,AUC(AreaUnderCurve)被定義為ROC曲線下的面積,數值不大于1。ROC曲線橫軸為負正類率(FPR),即分類器模型所分的正例中的本來為負例與所有負例之比,縱軸為真正類率(TPR),即分類器模型所分的正例中本來的正例與所有正例之比。AUC值越大的分類模型,正確率越高。如圖4.7所示,ROC曲線越靠近左上角,AUC值越大,模型精度越高。圖4.7ROC曲線圖
上海師范大學碩士學位論文第4章基于LightGBM算法的股指漲跌預測方案設計33圖4.8滬深300指數模型ROC曲線(左)和中證500指數模型ROC曲線(右)然后利用邏輯回歸聯合LightGBM算法,構建LR-LightGBM模型,同樣輸入12個連續(xù)技術指標,并分別預測滬深300指數和中證500指數的漲跌,最優(yōu)參數取值和預測結果如下表4.5所示。表4.5LR-LightGBM模型的參數取值參數名稱參數取值滬深300中證500max_depth77num_leaves2030learning_rate0.10.1feature_fraction0.80.8bagging_fraction0.80.8num_iterations20202從表4.6列出的預測結果可知,與LightGBM模型相比,LR-LightGBM模型預測效果更好,F1值和準確率提高明顯。其中,滬深300指數的預測精度提高3.4%左右,中證500指數的預測精度提高1.5%左右,說明聯合邏輯回歸可以在一定程度上優(yōu)化LightGBM模型的預測精度。表4.6LR-LightGBM模型預測結果預測結果滬深300中證500F1值0.57280.5419準確率0.57290.5523下圖4.9中展示了LR-LightGBM模型預測兩個指數的ROC曲線,AUC值分別為0.5840和0.5660,與LightGBM模型的AUC值相比均有所增加,再次印證LR-LightGBM模型的分類效果優(yōu)于LightGBM模型。將邏輯回歸模型的預測得分與技術指標一起輸入LightGBM訓練,提供了更多關于股指趨勢變動的信息,有助于提高預測模型的預測精度并且可以防止過擬合。此外,綜合兩個模型預測結果的F1值、準確率和AUC值可知,模型預測滬深300指數漲跌的效果略高于中證
【參考文獻】:
期刊論文
[1]基于機器學習的股票超額收益預測模型[J]. 蔡清權,馬雲勻,李金妹. 信息系統(tǒng)工程. 2019(09)
[2]股票市場短期趨勢的離散分類預測模型研究[J]. 李緗珍. 經濟研究導刊. 2019(26)
[3]茅臺股價一路走紅的基本面分析[J]. 劉濤. 中國集體經濟. 2018(28)
[4]基于偏最小二乘方法的ARIMA模型在股票指數預測中的應用[J]. 方坷昊,趙凌. 四川文理學院學報. 2018(05)
[5]基于EMD和ARMA模型的上證指數預測[J]. 吳振宇,喻敏,金吉,姜楠. 中國商論. 2018(16)
[6]GBDT組合模型在股票預測中的應用[J]. 張瀟,韋增欣,楊天山. 海南師范大學學報(自然科學版). 2018(01)
[7]基于ARIMA模型對上證指數趨勢的預測[J]. 李曉先. 遼寧經濟. 2017(07)
[8]基于C4.5決策樹的股票數據挖掘[J]. 王領,胡揚. 計算機與現代化. 2015(10)
[9]基于ARIMA模型對上證指數月度時間序列的分析和預測[J]. 崔遠遠,文忠橋. 棗莊學院學報. 2015(02)
[10]兼顧基本面與估值指標的價值投資策略實證研究——來自2000-2013年中國滬深A股市場的經驗數據[J]. 姚輝,武婷婷. 投資研究. 2014(11)
本文編號:3454633
本文鏈接:http://www.sikaile.net/guanlilunwen/huobilw/3454633.html