中國象棋計(jì)算機(jī)博弈中搜索算法的研究與改進(jìn)
本文關(guān)鍵詞:機(jī)器自學(xué)習(xí)博弈策略研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
《河北大學(xué)》 2010年
中國象棋計(jì)算機(jī)博弈中搜索算法的研究與改進(jìn)
郭秀麗
【摘要】: 在人工智能領(lǐng)域,機(jī)器博弈始終是一個(gè)重要的組成部分。自從計(jì)算機(jī)問世以來,人們?yōu)榱俗層?jì)算機(jī)具有與人類棋手一樣的博弈能力,進(jìn)行了大量的研究和實(shí)驗(yàn)。機(jī)器棋手和人類棋手之間也展開了長達(dá)幾十年的競賽。其中最廣為人知的要數(shù)“深藍(lán)”在國際象棋上所取得的成就!吧钏{(lán)”的成功標(biāo)志著計(jì)算機(jī)棋手戰(zhàn)勝人類頂級(jí)大師已經(jīng)從夢(mèng)想變成了現(xiàn)實(shí)。 而中國象棋的計(jì)算機(jī)博弈研究比國際象棋要落后三、四十年。雖然起步晚,但也取得了一定的成績,出現(xiàn)了一大批具有高水平的象棋程序。本文針對(duì)中國象棋博弈系統(tǒng)進(jìn)行研究,介紹了中國象棋計(jì)算機(jī)博弈的關(guān)鍵技術(shù),總結(jié)并比較了不同的搜索算法、搜索策略在實(shí)戰(zhàn)中的不同效果,分析了評(píng)估函數(shù)和輔助搜索機(jī)制在系統(tǒng)中所起的作用,并在研究的基礎(chǔ)上實(shí)現(xiàn)了基于最佳優(yōu)先搜索策略的算法,設(shè)計(jì)并改進(jìn)了符合此算法的評(píng)估函數(shù),使系統(tǒng)能夠達(dá)到一定的實(shí)戰(zhàn)水平。實(shí)驗(yàn)結(jié)果表明這種改進(jìn)的評(píng)估函數(shù)對(duì)于最佳優(yōu)先搜索的算法而言是有效的。
【關(guān)鍵詞】:
【學(xué)位授予單位】:河北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類號(hào)】:O225
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 王驕,王濤,羅艷紅,徐心和;中國象棋計(jì)算機(jī)博弈系統(tǒng)評(píng)估函數(shù)的自適應(yīng)遺傳算法實(shí)現(xiàn)[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年10期
2 馬占欣;李亞;陸玉昌;;用遺傳算法解決博弈問題[J];河南科學(xué);2007年02期
3 魏欽剛;王驕;徐心和;南曉斐;;中國象棋計(jì)算機(jī)博弈開局庫研究與設(shè)計(jì)[J];智能系統(tǒng)學(xué)報(bào);2007年01期
4 徐心和;王驕;;中國象棋計(jì)算機(jī)博弈關(guān)鍵技術(shù)分析[J];小型微型計(jì)算機(jī)系統(tǒng);2006年06期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 莫建文;機(jī)器自學(xué)習(xí)博弈策略研究與實(shí)現(xiàn)[D];廣西師范大學(xué);2002年
2 付強(qiáng);基于激勵(lì)學(xué)習(xí)的中國象棋研究[D];長沙理工大學(xué);2006年
3 危春波;中國象棋博弈系統(tǒng)的研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2008年
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李春貴,吳滄浦,劉永信;一種集成規(guī)劃的SARSA(λ)強(qiáng)化學(xué)習(xí)算法[J];北京理工大學(xué)學(xué)報(bào);2002年03期
2 林海,孫吉貴;預(yù)測(cè)及其主要模型的實(shí)現(xiàn)系統(tǒng)[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2002年04期
3 王曉鵬;王驕;徐心和;鄭新穎;;中國象棋與國際象棋比較分析[J];重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年01期
4 王驕,王濤,羅艷紅,徐心和;中國象棋計(jì)算機(jī)博弈系統(tǒng)評(píng)估函數(shù)的自適應(yīng)遺傳算法實(shí)現(xiàn)[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年10期
5 呂志來,張保會(huì),哈恒旭;一種變結(jié)構(gòu)的時(shí)間序列預(yù)測(cè)算法及其在電力系統(tǒng)暫態(tài)穩(wěn)定預(yù)測(cè)中的應(yīng)用[J];電工技術(shù)學(xué)報(bào);2002年03期
6 秦斌 ,王欣 ,吳敏;基于RBF神經(jīng)網(wǎng)絡(luò)的鐵水硅含量預(yù)報(bào)模型[J];電氣傳動(dòng);2002年03期
7 殷萇茗,陳煥文,謝麗娟;樣本有限關(guān)聯(lián)值遞歸Q學(xué)習(xí)算法及其收斂性證明[J];計(jì)算機(jī)研究與發(fā)展;2002年09期
8 顧國昌,仲宇,張汝波;一種新的多智能體強(qiáng)化學(xué)習(xí)算法及其在多機(jī)器人協(xié)作任務(wù)中的應(yīng)用[J];機(jī)器人;2003年04期
9 謝志鵬,蔡燦輝;游戲地圖最短路徑搜索設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2005年24期
10 朱全民;陳松喬;;五子棋算法的研究與思考[J];計(jì)算技術(shù)與自動(dòng)化;2006年02期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 胡光華;;平均準(zhǔn)則TD策略迭代算法[A];中國運(yùn)籌學(xué)會(huì)第六屆學(xué)術(shù)交流會(huì)論文集(上卷)[C];2000年
2 胡光華;殷英;李世云;;即時(shí)差分策略迭代算法[A];中國運(yùn)籌學(xué)會(huì)第七屆學(xué)術(shù)交流會(huì)論文集(下卷)[C];2004年
3 王直杰;方建安;邵世煌;;一種增強(qiáng)式學(xué)習(xí)算法及其在控制中的應(yīng)用[A];1996中國控制與決策學(xué)術(shù)年會(huì)論文集[C];1996年
4 王洪巖;朱峰;張雪峰;李玉倩;安爽;徐心和;;一種基于粗神經(jīng)網(wǎng)絡(luò)的中國象棋機(jī)器博弈評(píng)估實(shí)現(xiàn)[A];2007中國控制與決策學(xué)術(shù)年會(huì)論文集[C];2007年
5 徐心和;石鴻雁;;一個(gè)空戰(zhàn)實(shí)例中的混合對(duì)策問題[A];2007中國控制與決策學(xué)術(shù)年會(huì)論文集[C];2007年
6 朱峰;張雪峰;徐心和;;關(guān)于機(jī)器博弈中的逐步展開型對(duì)策的一點(diǎn)討論[A];2007中國控制與決策學(xué)術(shù)年會(huì)論文集[C];2007年
7 陳春林;陳宗海;卓睿;;分層式強(qiáng)化學(xué)習(xí)的定性空間表達(dá)[A];’2004系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2004年
8 徐義春;韓芳;;結(jié)合TD(0)的馬爾可夫鏈擾動(dòng)分析求解算法[A];’2004系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2004年
9 任燚;陳宗海;;一種強(qiáng)化學(xué)習(xí)算法應(yīng)用于多移動(dòng)機(jī)器人的覓食實(shí)例研究[A];’2004系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2004年
10 徐心和;王浩;孔凡禹;;事件對(duì)策理論及在棋類游戲中的應(yīng)用[A];2007年中國智能自動(dòng)化會(huì)議論文集[C];2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張濤;非線性系統(tǒng)控制策略的研究[D];浙江大學(xué);2001年
2 徐昕;增強(qiáng)學(xué)習(xí)及其在移動(dòng)機(jī)器人導(dǎo)航與控制中的應(yīng)用研究[D];國防科學(xué)技術(shù)大學(xué);2002年
3 佘震宇;復(fù)雜經(jīng)濟(jì)系統(tǒng)演化建模研究[D];天津大學(xué);2003年
4 李四明;基于智能Agent的網(wǎng)上農(nóng)業(yè)信息挖掘研究[D];中國農(nóng)業(yè)大學(xué);2003年
5 趙黎明;災(zāi)害管理系統(tǒng)研究[D];天津大學(xué);2003年
6 仲宇;分布式強(qiáng)化學(xué)習(xí)理論及在多機(jī)器人中的應(yīng)用研究[D];哈爾濱工程大學(xué);2003年
7 張雙民;群體Agent合作求解方法的研究[D];清華大學(xué);2004年
8 楊東勇;多機(jī)器人協(xié)作的學(xué)習(xí)與進(jìn)化方法[D];浙江大學(xué);2005年
9 王醒策;基于強(qiáng)化學(xué)習(xí)和群集智能方法的多機(jī)器人協(xié)作協(xié)調(diào)研究[D];哈爾濱工程大學(xué);2005年
10 莊曉東;多移動(dòng)機(jī)器人運(yùn)動(dòng)控制策略的強(qiáng)化學(xué)習(xí)研究[D];中國海洋大學(xué);2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王醒策;基于強(qiáng)化學(xué)習(xí)的多機(jī)器人編隊(duì)方法研究[D];哈爾濱工程大學(xué);2002年
2 張必勇;強(qiáng)化學(xué)習(xí)在用戶學(xué)習(xí)中的應(yīng)用研究[D];太原理工大學(xué);2003年
3 趙秀粉;藍(lán)牙技術(shù)及多代理技術(shù)在車間控制系統(tǒng)中的應(yīng)用研究[D];重慶大學(xué);2003年
4 宋梅萍;多移動(dòng)機(jī)器人協(xié)作任務(wù)的分布式?jīng)Q策控制系統(tǒng)[D];哈爾濱工程大學(xué);2003年
5 鄒丹;自主式水下機(jī)器人運(yùn)動(dòng)規(guī)劃技術(shù)[D];哈爾濱工程大學(xué);2003年
6 莫建文;機(jī)器自學(xué)習(xí)博弈策略研究與實(shí)現(xiàn)[D];廣西師范大學(xué);2002年
7 羅寧泉;增強(qiáng)學(xué)習(xí)在共面雙機(jī)空戰(zhàn)格斗中的應(yīng)用[D];沈陽工業(yè)大學(xué);2003年
8 滕軼棟;移動(dòng)通信系統(tǒng)信道分配算法研究[D];浙江工業(yè)大學(xué);2004年
9 陳雪江;基于強(qiáng)化學(xué)習(xí)的多機(jī)器人協(xié)作機(jī)制研究[D];浙江工業(yè)大學(xué);2004年
10 孫光余;強(qiáng)化學(xué)習(xí)及其在空中攔截中的應(yīng)用[D];沈陽工業(yè)大學(xué);2004年
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王驕,王濤,羅艷紅,徐心和;中國象棋計(jì)算機(jī)博弈系統(tǒng)評(píng)估函數(shù)的自適應(yīng)遺傳算法實(shí)現(xiàn)[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年10期
2 嚴(yán)小衛(wèi),莫建文;智能五子棋的設(shè)計(jì)與實(shí)現(xiàn)[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);1999年04期
3 廖家平,舒軍,王粟;基于 PDC-PROLOG 自學(xué)習(xí)機(jī)器博弈[J];湖北工學(xué)院學(xué)報(bào);1997年04期
4 陳煥文,謝麗娟,謝建平;一類值函數(shù)激勵(lì)學(xué)習(xí)的遺忘算法[J];計(jì)算機(jī)研究與發(fā)展;2001年04期
5 李寧,高陽,陸鑫,陳世福;一種基于強(qiáng)化學(xué)習(xí)的學(xué)習(xí)Agent[J];計(jì)算機(jī)研究與發(fā)展;2001年09期
6 陸鑫,高陽,李寧,陳世福;基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)算法研究[J];計(jì)算機(jī)研究與發(fā)展;2002年08期
7 殷萇茗,陳煥文,謝麗娟;樣本有限關(guān)聯(lián)值遞歸Q學(xué)習(xí)算法及其收斂性證明[J];計(jì)算機(jī)研究與發(fā)展;2002年09期
8 張偉,王一川,石純一;Agent組織規(guī)則的再勵(lì)學(xué)習(xí)[J];計(jì)算機(jī)研究與發(fā)展;2003年03期
9 謝克明,郭紅波,謝剛,續(xù)欣瑩;人工免疫算法及其應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2005年20期
10 莫建文,林士敏,張順嵐;基于TD強(qiáng)化學(xué)習(xí)智能博弈程序的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2004年S1期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 王騏;博弈樹搜索算法的研究及改進(jìn)[D];浙江大學(xué);2006年
2 張賾;計(jì)算機(jī)中國象棋博弈中的二次估值方法及其優(yōu)化的研究[D];東北大學(xué);2006年
《中國學(xué)術(shù)期刊(光盤版)》電子雜志社有限公司
同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司
地址:北京清華大學(xué) 84-48信箱 大眾知識(shí)服務(wù)
京ICP證040441號(hào)
互聯(lián)網(wǎng)出版許可證 新出網(wǎng)證(京)字008號(hào)
出版物經(jīng)營許可證 新出發(fā)京批字第直0595號(hào)
訂購熱線:400-819-9993 010-62982499
服務(wù)熱線:010-62985026 010-62791813
在線咨詢:
傳真:010-62780361
京公網(wǎng)安備11010802020475號(hào)
本文關(guān)鍵詞:機(jī)器自學(xué)習(xí)博弈策略研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):154479
本文鏈接:http://www.sikaile.net/kejilunwen/rengongzhinen/154479.html