码迷,mamicode.com
首页 > 其他好文 > 详细

DQN 相关论文。

时间:2019-01-18 13:58:03      阅读:1111      评论:0      收藏:0      [点我收藏+]

标签:定时   double   bsp   info   图片   force   learn   替换   swa   

技术分享图片

 

 

 

开山之作: 《Playing Atari with Deep Reinforcement Learning》(NIPS)

http://export.arxiv.org/pdf/1312.5602

技术分享图片

 

 

《Human-level control through deep reinforcementlearnin》 https://www.cs.swarthmore.edu/~meeden/cs63/s15/nature15b.pdf

使用2个网络,减少了相关性,每隔一定时间,替换参数。

技术分享图片

《Deep Reinforcement Learning with Double Q-learning》  https://arxiv.org/pdf/1509.06461.pdf

 

技术分享图片

 

DQN 相关论文。

标签:定时   double   bsp   info   图片   force   learn   替换   swa   

原文地址:https://www.cnblogs.com/zle1992/p/10287200.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!