天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度強化學(xué)習(xí)的股票投資組合管理及實證研究

發(fā)布時間:2023-11-14 19:54
  近年來,隨著Google DeepMind等人工智能研發(fā)團隊的不斷出現(xiàn),深度強化學(xué)習(xí)逐漸為人們所熟知。與此同時,我國股票交易市場逐漸向多樣化、便捷化與信息化方向迅速發(fā)展,這使得股票交易市場每天都在產(chǎn)生大量數(shù)據(jù)。為了解決傳統(tǒng)交易分析方法難以處理大量數(shù)據(jù)的缺陷,且避免人類投資者匱乏紀(jì)律性的非理性操作,具備科學(xué)性、系統(tǒng)性和準(zhǔn)確性的量化投資逐漸成為機構(gòu)投資研究者重點關(guān)注和發(fā)展的投資方式。量化投資是利用計算機對金融數(shù)據(jù)進行建模,挖掘數(shù)據(jù)中所蘊含的投資機會和交易信號,進而構(gòu)建動態(tài)、自適應(yīng)的投資策略,這與深度強化學(xué)習(xí)有異曲同工之妙,因此將二者結(jié)合起來用以解決現(xiàn)實金融問題是可行的。將深度強化學(xué)習(xí)應(yīng)用于量化投資領(lǐng)域,一方面拓寬了量化投資的研究思路與建模方法,另一方面促進了金融交易向智能化與自動化方向發(fā)展。為獲取最優(yōu)投資機會與交易信號,本文嘗試將深度強化學(xué)習(xí)(Deep Reinforcement Learning,DRL)方法應(yīng)用于量化投資領(lǐng)域,以解決股票市場投資組合的管理問題。本文以A2C、PPO與SAC三種基于執(zhí)行者/評論者的深度強化學(xué)習(xí)算法原理和框架為基礎(chǔ)搭建模型智能體,結(jié)合股票市場歷史真實價格、成...

【文章頁數(shù)】:87 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景及研究意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 研究內(nèi)容與論文框架
        1.2.1 研究內(nèi)容
        1.2.2 論文框架
    1.3 研究思路與研究方法
        1.3.1 研究思路
        1.3.2 研究方法
    1.4 本文創(chuàng)新之處
第二章 文獻綜述
    2.1 基于經(jīng)典機器學(xué)習(xí)算法的量化投資
    2.2 深度學(xué)習(xí)
        2.2.1 深度學(xué)習(xí)在非金融領(lǐng)域的研究
        2.2.2 深度學(xué)習(xí)在金融投資領(lǐng)域的研究
    2.3 強化學(xué)習(xí)
        2.3.1 基于價值的強化學(xué)習(xí)算法
        2.3.2 基于策略的強化學(xué)習(xí)算法
    2.4 深度強化學(xué)習(xí)
        2.4.1 基于評論者的深度強化學(xué)習(xí)算法
        2.4.2 基于執(zhí)行者的深度強化學(xué)習(xí)算法
        2.4.3 執(zhí)行者/評論者算法
第三章 深度強化學(xué)習(xí)理論基礎(chǔ)
    3.1 深度學(xué)習(xí)理論基礎(chǔ)
        3.1.1 深度學(xué)習(xí)
        3.1.2 深度神經(jīng)網(wǎng)絡(luò)
    3.2 強化學(xué)習(xí)理論基礎(chǔ)
        3.2.1 馬爾科夫決策過程
        3.2.2 動態(tài)規(guī)劃
        3.2.3 蒙特卡羅強化學(xué)習(xí)方法
        3.2.4 時序差分價值迭代
    3.3 深度強化學(xué)習(xí)方法理論基礎(chǔ)
        3.3.1 值函數(shù)非線性近似方法
        3.3.2 策略梯度方法
        3.3.3 執(zhí)行者/評論者方法
    3.4 本章小結(jié)
第四章 構(gòu)建深度強化學(xué)習(xí)投資組合管理模型
    4.1 交易過程深度強化學(xué)習(xí)建模的可行性分析
        4.1.1 交互過程
        4.1.2 幕數(shù)與日內(nèi)資產(chǎn)權(quán)重變化
        4.1.3 模擬交易具體事項
    4.2 狀態(tài)、動作與獎勵
        4.2.1 狀態(tài)
        4.2.2 動作
        4.2.3 獎勵
    4.3 智能體的構(gòu)建
        4.3.1 A2C
        4.3.2 PPO
        4.3.3 SAC
第五章 深度強化學(xué)習(xí)投資組合管理模型實證分析
    5.1 實驗設(shè)計
        5.1.1 訓(xùn)練與測試的區(qū)間劃分
        5.1.2 交易資產(chǎn)組合的選擇
        5.1.3 數(shù)據(jù)的獲取與預(yù)處理
        5.1.4 基準(zhǔn)與對照模型的設(shè)定
    5.2 實驗結(jié)果分析
        5.2.1 累計收益率曲線
        5.2.2 年化收益率
        5.2.3 年化波動率
        5.2.4 夏普比率
        5.2.5 最大回撤率
        5.2.6 Alpha值
        5.2.7 Beta值
        5.2.8 索提諾比率
    5.3 本章小結(jié)
總結(jié)與展望
    6.1 總結(jié)
    6.2 展望
參考文獻
致謝
攻讀碩士學(xué)位期間取得的科研成果



本文編號:3864102

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jingjilunwen/jingjiguanlilunwen/3864102.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶74085***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com