五子棋人機博弈算法優(yōu)化研究與實現(xiàn)
發(fā)布時間:2020-12-12 19:14
計算機博弈,也稱機器博弈,是博弈論與計算機技術結合的產物,是人工智能領域的一個重要研究方向,同時也是兵棋推演、機器智能、智能決策系統(tǒng)等眾多人工智能應用領域的研究基礎和實驗田,長期以來一直受到國內外學者的廣泛關注。近年來,隨著以各類深度學習算法為代表的人工智能技術研究的日益深入,尤其以AlphaGo為代表的機器博弈系統(tǒng)取得的巨大成功,進一步推動了機器博弈理論與相關技術的快速發(fā)展。近代機器博弈研究主要以圍棋、象棋、五子棋等棋類人機博弈為主。其中,國際象棋的計算機博弈研究歷史最為悠久,并且經歷了一場波瀾壯闊的“搏殺”,尤其“深藍”計算機的勝利不僅給人類留下了深刻印象,同時總結出一套關于國際象棋機器博弈的過程建模、狀態(tài)表示、著法生成、棋局評估、博弈樹搜索、開局庫與殘局庫開發(fā)、系統(tǒng)測試與參數優(yōu)化等核心技術要點,為后續(xù)相關研究確定了研究方向。鑒于五子棋作為生活中最為普及的棋類之一,具有規(guī)則簡單易懂和典型零和完備信息博弈的所有特點,便于開展深入研究和快速評估博弈算法的優(yōu)劣,為此本文以五子棋博弈為研究對象,針對零和完備信息博弈問題開展了博弈樹搜索算法優(yōu)化和系統(tǒng)自學習能力訓練等方面的相關研究,主要研究內...
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數】:81 頁
【學位級別】:碩士
【部分圖文】:
圖1」技術路線圖??Fig.?1.1?The?technology?roadmap??1.4論文組織結構??
及計算,使機器能夠像人腦一樣,實現(xiàn)對各類數據的學習、分類和識別。為了模擬細胞??結構,模型中設置了權值來實現(xiàn)調整神經元之間的連接程度,通過一層層的計算處理實??現(xiàn)了信息的傳遞。人工神經網絡根據模型內部的架構層次和激勵函數的不同,網絡的輸??出也會有所不同。關于人工神經網絡的重要概念和模型算法分述如下。??3.1.1感知機模型??感知機模型在1958年被提出用于模擬神經元的內部結構,最初的結構只有簡單的??兩層神經元,輸入層接受模型的輸入信息,通過內部結構的權值運算后再經過激活函數??得到最終的輸出值[29]。??感知機其類型屬于標準的二分類模型,模型的輸入是樣本的特征,輸出是樣本的類??型,其結構如圖3.1所示。??
?五子棋人機博弈算法優(yōu)化研宄與實現(xiàn)???/(x)?=?max(0,x)?(3.4)??函數圖像如圖3.3所示:??ReLU函數??6.5?:??5.5?/??/??35??2.5??15????.?0-5?/?'??-6?-4?-2?-0.5?0?2?4?6??‘圖3.3?ReLU函數圖像??Fig.?3.3?ReLU?Function?Image??由函數圖像看出,當輸入值小于等于0時,則輸出0;當輸入大于0時,則輸出??_y?=?x。相比較于上面兩個函數,ReLU函數在第一象限中,斜率保持不變,整體呈持上??升狀態(tài),該分段公式中只存在線性公式,而其它的兩個函數都需要指數運算,這樣計算??速度就會快很多。??ReLU函數的缺點也很明顯,當輸入是負數時,函數的值一直為0,也就是說一旦??輸入的是負數,激活函數就會失效。在模型訓練中調整梯度也就會為零,并且該函數函??數的輸出不是原點對稱的,在訓練調整的過程中效率低下,后期的優(yōu)化也會變得十分困??難。??針對上述存在的問題,有學者提出了?Leaky?ReLU函數來解決神經元無效的問題,??將該函數直接分為兩段,與ReLU不同地方在于當輸入值小于0時,不再是直接歸0,??而是取一個斜率較小的線性函數具體見公式(3.5):??fjv,?X?^?0??Leaky:〇:〇:)二j?”?(3.5)??[ox,x<?0??類似的還有公式(3.6)的Softplus函數,也是在ReLU函數的基礎改進得到的:??Softplus:漢(x)?=?log(l?+?ev)?(3.6)??-20?-??
【參考文獻】:
期刊論文
[1]愛恩斯坦棋計算機博弈算法研究與改進[J]. 楊昌杰,陳柯成,劉躍元,王京. 無線互聯(lián)科技. 2018(15)
[2]計算機博弈的研究與發(fā)展[J]. 王亞杰,邱虹坤,吳燕燕,李飛,楊周鳳. 智能系統(tǒng)學報. 2016(06)
[3]六子棋中基于局部“路”掃描方式的博弈樹生成算法[J]. 李學俊,王小龍,吳蕾,劉慧婷. 智能系統(tǒng)學報. 2015(02)
[4]愛恩斯坦棋靜態(tài)攻防策略的研究[J]. 周文敏,李淑琴. 電腦知識與技術. 2014(05)
[5]愛恩斯坦棋算法設計與分析[J]. 李占宇,李淑琴,顧磊,史玉峰,周文敏. 信息技術與信息化. 2014(01)
[6]蘇拉卡爾塔博弈系統(tǒng)中評估函數的研究[J]. 李淑琴,李靜波,韓裕華,陶思拓. 北京信息科技大學學報(自然科學版). 2012(06)
[7]UCT算法在計算機圍棋中的應用與改進[J]. 周明明,高航,趙國安. 數據采集與處理. 2012(S2)
[8]計算機博弈中估值算法與博弈訓練的研究[J]. 呂艷輝,宮瑞敏. 計算機工程. 2012(11)
[9]一種改進的基于博弈樹模型的五子棋系統(tǒng)[J]. 楊云強,吳姣. 科學技術與工程. 2012(05)
[10]一類非完備信息博弈的信息模型[J]. 馬驍,王軒,王曉龍. 計算機研究與發(fā)展. 2010(12)
博士論文
[1]計算機博弈問題的復雜性、理論解及相關搜索算法研究[D]. 高強.東北大學 2016
[2]模糊神經網絡學習算法及收斂性研究[D]. 李龍.大連理工大學 2010
碩士論文
[1]基于卷積神經網絡的射線圖像識別系統(tǒng)的研究[D]. 李玉.北華航天工業(yè)學院 2019
[2]基于卷積神經網絡的表情識別研究[D]. 陳航.南京郵電大學 2018
[3]基于卷積神經網絡的蘋果表面?zhèn)套R別研究[D]. 高友文.南京郵電大學 2018
[4]國際跳棋完備信息博弈關鍵技術研究與系統(tǒng)設計[D]. 楊周鳳.沈陽航空航天大學 2018
[5]雙人博弈問題中的蒙特卡洛樹搜索算法的改進[D]. 季輝.中國科學技術大學 2017
[6]五子棋計算機博弈系統(tǒng)的研究與設計[D]. 張效見.安徽大學 2017
[7]基于Alpha-Beta剪枝算法的黑白棋游戲的設計與開發(fā)[D]. 王增財.內蒙古大學 2016
[8]基于BP神經網絡的五子棋自學習系統(tǒng)的設計與實現(xiàn)[D]. 陳橋.燕山大學 2016
[9]六子棋博弈中搜索技術的研究與實現(xiàn)[D]. 汪坤兵.安徽大學 2016
[10]愛恩斯坦棋計算機博弈系統(tǒng)的研究與實現(xiàn)[D]. 光洋.安徽大學 2016
本文編號:2913127
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數】:81 頁
【學位級別】:碩士
【部分圖文】:
圖1」技術路線圖??Fig.?1.1?The?technology?roadmap??1.4論文組織結構??
及計算,使機器能夠像人腦一樣,實現(xiàn)對各類數據的學習、分類和識別。為了模擬細胞??結構,模型中設置了權值來實現(xiàn)調整神經元之間的連接程度,通過一層層的計算處理實??現(xiàn)了信息的傳遞。人工神經網絡根據模型內部的架構層次和激勵函數的不同,網絡的輸??出也會有所不同。關于人工神經網絡的重要概念和模型算法分述如下。??3.1.1感知機模型??感知機模型在1958年被提出用于模擬神經元的內部結構,最初的結構只有簡單的??兩層神經元,輸入層接受模型的輸入信息,通過內部結構的權值運算后再經過激活函數??得到最終的輸出值[29]。??感知機其類型屬于標準的二分類模型,模型的輸入是樣本的特征,輸出是樣本的類??型,其結構如圖3.1所示。??
?五子棋人機博弈算法優(yōu)化研宄與實現(xiàn)???/(x)?=?max(0,x)?(3.4)??函數圖像如圖3.3所示:??ReLU函數??6.5?:??5.5?/??/??35??2.5??15????.?0-5?/?'??-6?-4?-2?-0.5?0?2?4?6??‘圖3.3?ReLU函數圖像??Fig.?3.3?ReLU?Function?Image??由函數圖像看出,當輸入值小于等于0時,則輸出0;當輸入大于0時,則輸出??_y?=?x。相比較于上面兩個函數,ReLU函數在第一象限中,斜率保持不變,整體呈持上??升狀態(tài),該分段公式中只存在線性公式,而其它的兩個函數都需要指數運算,這樣計算??速度就會快很多。??ReLU函數的缺點也很明顯,當輸入是負數時,函數的值一直為0,也就是說一旦??輸入的是負數,激活函數就會失效。在模型訓練中調整梯度也就會為零,并且該函數函??數的輸出不是原點對稱的,在訓練調整的過程中效率低下,后期的優(yōu)化也會變得十分困??難。??針對上述存在的問題,有學者提出了?Leaky?ReLU函數來解決神經元無效的問題,??將該函數直接分為兩段,與ReLU不同地方在于當輸入值小于0時,不再是直接歸0,??而是取一個斜率較小的線性函數具體見公式(3.5):??fjv,?X?^?0??Leaky:〇:〇:)二j?”?(3.5)??[ox,x<?0??類似的還有公式(3.6)的Softplus函數,也是在ReLU函數的基礎改進得到的:??Softplus:漢(x)?=?log(l?+?ev)?(3.6)??-20?-??
【參考文獻】:
期刊論文
[1]愛恩斯坦棋計算機博弈算法研究與改進[J]. 楊昌杰,陳柯成,劉躍元,王京. 無線互聯(lián)科技. 2018(15)
[2]計算機博弈的研究與發(fā)展[J]. 王亞杰,邱虹坤,吳燕燕,李飛,楊周鳳. 智能系統(tǒng)學報. 2016(06)
[3]六子棋中基于局部“路”掃描方式的博弈樹生成算法[J]. 李學俊,王小龍,吳蕾,劉慧婷. 智能系統(tǒng)學報. 2015(02)
[4]愛恩斯坦棋靜態(tài)攻防策略的研究[J]. 周文敏,李淑琴. 電腦知識與技術. 2014(05)
[5]愛恩斯坦棋算法設計與分析[J]. 李占宇,李淑琴,顧磊,史玉峰,周文敏. 信息技術與信息化. 2014(01)
[6]蘇拉卡爾塔博弈系統(tǒng)中評估函數的研究[J]. 李淑琴,李靜波,韓裕華,陶思拓. 北京信息科技大學學報(自然科學版). 2012(06)
[7]UCT算法在計算機圍棋中的應用與改進[J]. 周明明,高航,趙國安. 數據采集與處理. 2012(S2)
[8]計算機博弈中估值算法與博弈訓練的研究[J]. 呂艷輝,宮瑞敏. 計算機工程. 2012(11)
[9]一種改進的基于博弈樹模型的五子棋系統(tǒng)[J]. 楊云強,吳姣. 科學技術與工程. 2012(05)
[10]一類非完備信息博弈的信息模型[J]. 馬驍,王軒,王曉龍. 計算機研究與發(fā)展. 2010(12)
博士論文
[1]計算機博弈問題的復雜性、理論解及相關搜索算法研究[D]. 高強.東北大學 2016
[2]模糊神經網絡學習算法及收斂性研究[D]. 李龍.大連理工大學 2010
碩士論文
[1]基于卷積神經網絡的射線圖像識別系統(tǒng)的研究[D]. 李玉.北華航天工業(yè)學院 2019
[2]基于卷積神經網絡的表情識別研究[D]. 陳航.南京郵電大學 2018
[3]基于卷積神經網絡的蘋果表面?zhèn)套R別研究[D]. 高友文.南京郵電大學 2018
[4]國際跳棋完備信息博弈關鍵技術研究與系統(tǒng)設計[D]. 楊周鳳.沈陽航空航天大學 2018
[5]雙人博弈問題中的蒙特卡洛樹搜索算法的改進[D]. 季輝.中國科學技術大學 2017
[6]五子棋計算機博弈系統(tǒng)的研究與設計[D]. 張效見.安徽大學 2017
[7]基于Alpha-Beta剪枝算法的黑白棋游戲的設計與開發(fā)[D]. 王增財.內蒙古大學 2016
[8]基于BP神經網絡的五子棋自學習系統(tǒng)的設計與實現(xiàn)[D]. 陳橋.燕山大學 2016
[9]六子棋博弈中搜索技術的研究與實現(xiàn)[D]. 汪坤兵.安徽大學 2016
[10]愛恩斯坦棋計算機博弈系統(tǒng)的研究與實現(xiàn)[D]. 光洋.安徽大學 2016
本文編號:2913127
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/2913127.html
最近更新
教材專著