天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

一種自學習的智能五子棋算法的設計與實現(xiàn)

發(fā)布時間:2021-06-03 18:20
  強化學習長期以來的一個目標是創(chuàng)造一個能夠在具有挑戰(zhàn)性的領域,以超越人類的精通程度學習的算法.基于蒙特卡洛樹搜索與深度神經網(wǎng)絡設計一種自學習智能五子棋算法,無需人類知識,從零開始學習.其中深度神經網(wǎng)絡是由32個卷積層組成的深度殘差網(wǎng)絡;蒙特卡洛樹搜索可根據(jù)多次模擬博弈的結果預測最優(yōu)的移動方案.將五子棋規(guī)則與蒙特卡洛樹搜索和深度神經網(wǎng)絡相結合,蒙特卡洛樹搜索使用深度神經網(wǎng)絡評估落子位置和選擇移動,增強樹的搜索強度,提高落子質量,優(yōu)化自對弈迭代.通過蒙特卡洛樹搜索進行自對弈,訓練一個神經網(wǎng)絡來預測落子選擇以及游戲的贏家.經過兩天的訓練,該算法的埃洛等級分已經達到4000分,遠遠高于普通人類水平. 

【文章來源】:小型微型計算機系統(tǒng). 2020,41(06)北大核心CSCD

【文章頁數(shù)】:7 頁

【部分圖文】:

一種自學習的智能五子棋算法的設計與實現(xiàn)


蒙特卡洛樹搜索流程示例

一種自學習的智能五子棋算法的設計與實現(xiàn)


深度殘差網(wǎng)絡模型圖

一種自學習的智能五子棋算法的設計與實現(xiàn)


棋盤數(shù)據(jù)處理

【參考文獻】:
期刊論文
[1]隨機多選擇殘差網(wǎng)絡集成的遙感圖像分類算法[J]. 周強,徐宏偉,陳逸,孫玉寶.  小型微型計算機系統(tǒng). 2019(09)
[2]基于α-β剪枝樹算法的安卓五子棋程序設計與實現(xiàn)[J]. 宋萬洋.  現(xiàn)代信息科技. 2019(11)
[3]五子棋人工智能算法實現(xiàn)研究[J]. 孫世文.  中國新通信. 2018(23)
[4]基于深度強化學習的流媒體邊緣云會話調度策略[J]. 徐西建,王子磊,奚宏生.  計算機工程. 2019(05)

碩士論文
[1]五子棋人工智能算法設計與實現(xiàn)[D]. 劉瑞.華南理工大學 2012



本文編號:3211009

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3211009.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶c9d23***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com