天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

強化學(xué)習(xí)及其在電腦圍棋中的應(yīng)用

發(fā)布時間:2017-10-19 03:21

  本文關(guān)鍵詞:強化學(xué)習(xí)及其在電腦圍棋中的應(yīng)用


  更多相關(guān)文章: 強化學(xué)習(xí) 函數(shù)近似 核方法 神經(jīng)網(wǎng)絡(luò) 加性模型 深度強化學(xué)習(xí)


【摘要】:強化學(xué)習(xí)是一類特殊的機器學(xué)習(xí),通過與所在環(huán)境的自主交互來學(xué)習(xí)決策策略,使得策略收到的長期累積獎賞最大.最近,在圍棋和電子游戲等領(lǐng)域,強化學(xué)習(xí)被成功用于取得人類水平的操作能力,受到了廣泛關(guān)注.本文將對強化學(xué)習(xí)進(jìn)行簡要介紹,重點介紹基于函數(shù)近似的強化學(xué)習(xí)方法,以及在圍棋等領(lǐng)域中的應(yīng)用.
【作者單位】: 南京郵電大學(xué)計算機學(xué)院/軟件學(xué)院;南京大學(xué)計算機軟件新技術(shù)國家重點實驗室;
【關(guān)鍵詞】強化學(xué)習(xí) 函數(shù)近似 核方法 神經(jīng)網(wǎng)絡(luò) 加性模型 深度強化學(xué)習(xí)
【基金】:國家自然科學(xué)基金(61403208;61375061) 南京郵電大學(xué)引進(jìn)人才科研啟動基金(NY214014)資助~~
【分類號】:TP181
【正文快照】: 引用格式陳興國,俞揚.強化學(xué)習(xí)及其在電腦圍棋中的應(yīng)用.自動化學(xué)報,2016,42(5):685-695Reinforcement Learning and Its Application to the Game of GoCHEN Xing-Guo1,2強化學(xué)習(xí)(Reinforcement learning,RL)是機器學(xué)習(xí)的子領(lǐng)域[1].在強化學(xué)習(xí)中,機器(常被稱為智能體/Agent)被

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前2條

1 王皓;高陽;陳興國;;強化學(xué)習(xí)中的遷移:方法和進(jìn)展[J];電子學(xué)報;2008年S1期

2 高陽,陳世福,陸鑫;強化學(xué)習(xí)研究綜述[J];自動化學(xué)報;2004年01期

【共引文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 陳興國;俞揚;;強化學(xué)習(xí)及其在電腦圍棋中的應(yīng)用[J];自動化學(xué)報;2016年05期

2 高雪瑩;唐昊;苗剛中;平兆武;;儲能系統(tǒng)能量調(diào)度與需求響應(yīng)聯(lián)合優(yōu)化控制[J];系統(tǒng)仿真學(xué)報;2016年05期

3 謝巖松;金海東;陳冬火;;基于函數(shù)近似的知識遷移[J];軟件;2016年02期

4 楊娜;李漢舟;;服務(wù)機器人導(dǎo)航技術(shù)研究進(jìn)展[J];機電工程;2015年12期

5 欒詠紅;章鵬;;強化學(xué)習(xí)方法的對比分析[J];計算機時代;2015年12期

6 谷學(xué)靜;高貝貝;朱朝月;;基于人工情感的Q-學(xué)習(xí)算法在機器人行為決策中的應(yīng)用[J];自動化與儀表;2015年07期

7 戈軍;周蓮英;;基于SARSA(λ)的實時交通信號控制模型[J];計算機工程與應(yīng)用;2015年24期

8 馬磊;張文旭;戴朝華;;多機器人系統(tǒng)強化學(xué)習(xí)研究綜述[J];西南交通大學(xué)學(xué)報;2014年06期

9 傅啟明;劉全;尤樹華;黃蔚;章曉芳;;一種新的基于值函數(shù)遷移的快速Sarsa算法[J];電子學(xué)報;2014年11期

10 崔軍曉;朱蒙婷;王海燕;章鵬;王輝;;基于強化學(xué)習(xí)的值迭代算法[J];電腦知識與技術(shù);2014年31期

【二級參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前3條

1 高陽,陸鑫,李寧,陳世福;一種自適應(yīng)概率規(guī)劃規(guī)則抽取算法[J];南京大學(xué)學(xué)報(自然科學(xué)版);2003年02期

2 李寧,高陽,陸鑫,陳世福;一種基于強化學(xué)習(xí)的學(xué)習(xí)Agent[J];計算機研究與發(fā)展;2001年09期

3 高陽,周志華,何佳洲,陳世福;基于Markov對策的多Agent強化學(xué)習(xí)模型及算法研究[J];計算機研究與發(fā)展;2000年03期

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 李秀英;;網(wǎng)絡(luò)環(huán)境下學(xué)生學(xué)習(xí)的特點[J];教師;2009年04期

2 夏定海,黃智英;教會學(xué)習(xí) 學(xué)會學(xué)習(xí) 終身學(xué)習(xí)[J];發(fā)明與革新;2000年06期

3 黃啟兵;汪芳;;論網(wǎng)絡(luò)時代學(xué)習(xí)與創(chuàng)新的統(tǒng)一[J];教學(xué)研究;2002年03期

4 陳相安;把檔案部門建成學(xué)習(xí)型組織[J];中國檔案;2003年09期

5 顧新,蔡兵,李久平;學(xué)習(xí)與學(xué)習(xí)型社會[J];軟科學(xué);2004年02期

6 鄭軍;試論編輯的學(xué)習(xí)特征[J];中國編輯;2005年06期

7 邱曉榮,孔一童;試論網(wǎng)絡(luò)環(huán)境中的合作學(xué)習(xí)[J];當(dāng)代教育論壇;2005年02期

8 冷平,王仁蓉,刁永鋒;網(wǎng)絡(luò)學(xué)習(xí)的成功要素探析[J];教育信息化;2005年03期

9 張建光;朱秀娥;張笑雙;;網(wǎng)絡(luò)學(xué)習(xí)社區(qū)的特征和構(gòu)建[J];中國教育技術(shù)裝備;2006年03期

10 徐曉涌;;創(chuàng)建學(xué)習(xí)型企業(yè)莫入誤區(qū)[J];中國郵政;2006年02期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 韓文;;讓合作學(xué)習(xí)在逆境中重生[A];中華教育理論與實踐科研論文成果選編(第2卷)[C];2010年

2 呂啟春;;淺談小學(xué)數(shù)學(xué)中的小組合作學(xué)習(xí)[A];2014年1月現(xiàn)代教育教學(xué)探索學(xué)術(shù)交流會論文集[C];2014年

3 杜俊娟;;用學(xué)習(xí)動機培養(yǎng)策略課題的學(xué)習(xí)對體育教師進(jìn)行研究性學(xué)習(xí)培養(yǎng)的實驗研究[A];第七屆全國體育科學(xué)大會論文摘要匯編(一)[C];2004年

4 瞿春波;;淺議合作學(xué)習(xí)之誤區(qū)[A];校園文學(xué)編輯部寫作教學(xué)年會論文集[C];2007年

5 時龍;;把握分析學(xué)情是改進(jìn)教學(xué)和促進(jìn)學(xué)習(xí)的基礎(chǔ)[A];2012·學(xué)術(shù)前沿論叢——科學(xué)發(fā)展:深化改革與改善民生(下)[C];2012年

6 韋彩紅;;如何組織學(xué)生共享學(xué)習(xí)成果[A];中華教育理論與實踐科研論文成果選編(第2卷)[C];2010年

7 格保耿;;培養(yǎng)學(xué)生學(xué)習(xí)物理的興趣[A];2014年5月現(xiàn)代教育教學(xué)探索學(xué)術(shù)交流會論文集[C];2014年

8 鈕榮榮;;關(guān)于小學(xué)數(shù)學(xué)教學(xué)中小組合作學(xué)習(xí)的幾點思考[A];2014年6月現(xiàn)代教育教學(xué)探索學(xué)術(shù)交流會論文集[C];2014年

9 陳妙;;讓數(shù)學(xué)課堂效率得到真正的提高——淺談新課改下學(xué)生學(xué)習(xí)興趣的培養(yǎng)[A];中華教育理論與實踐科研論文成果選編(第3卷)[C];2010年

10 黃春妙;;淺談?wù)Z文課堂合作學(xué)習(xí)的有效把握[A];中華教育理論與實踐科研論文成果選編(第3卷)[C];2010年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 農(nóng)行浙江東陽支行 吳新國 周龍飛;銀行如何創(chuàng)建學(xué)習(xí)型組織[N];上海金融報;2003年

2 西北師范大學(xué) 李瑾瑜;校長:如何引領(lǐng)和促進(jìn)教師學(xué)習(xí)[N];中國教育報;2008年

3 永壽縣店頭中學(xué) 劉俊鋒;大力提倡合作學(xué)習(xí) 全面促進(jìn)有效教學(xué)[N];咸陽日報;2009年

4 本報評論員;要在真學(xué)習(xí)上下功夫[N];酒泉日報;2009年

5 本報記者 李天然;學(xué)習(xí)應(yīng)該是一種終身行為[N];大連日報;2010年

6 劉繼芳;淺議建設(shè)學(xué)習(xí)型黨組織中的“學(xué)習(xí)”內(nèi)涵[N];伊犁日報(漢);2010年

7 哈爾濱市第五醫(yī)院 蒙碩;淺談醫(yī)院創(chuàng)建學(xué)習(xí)型黨組織[N];黑龍江日報;2010年

8 翟愛霞;淺談如何深入推進(jìn)學(xué)習(xí)型黨組織建設(shè)[N];太行日報;2011年

9 李振 上海交通大學(xué)國際與公共事務(wù)學(xué)院;制度變遷中的制度學(xué)習(xí)[N];中國社會科學(xué)報;2012年

10 重慶市教育評估院院長、中國高等教育學(xué)會學(xué)習(xí)科學(xué)研究分會常務(wù)副會長 龔春燕;實施新學(xué)習(xí),建設(shè)學(xué)習(xí)型社會[N];中國教育報;2013年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 徐峰;基于社會網(wǎng)絡(luò)的大學(xué)生學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)研究[D];江西財經(jīng)大學(xué);2014年

2 付亦寧;本科生深層學(xué)習(xí)過程及其教學(xué)策略研究[D];蘇州大學(xué);2014年

3 張鈺e,

本文編號:1058755


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/1058755.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0bbfb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com