码迷,mamicode.com
首页 > 其他好文 > 详细

Deep RL Bootcamp Lecture 4B Policy Gradients Revisited

时间:2018-05-01 13:54:05      阅读:168      评论:0      收藏:0      [点我收藏+]

标签:想法   技术分享   game   otc   hub   rev   tps   PQ   view   

 https://drive.google.com/file/d/0BxXI_RttTZAhTUpqUFdEZ3BXNFE/view

技术分享图片

 

 

技术分享图片

 

game of Pong is a MDP.

 

 

 

技术分享图片

技术分享图片

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

 

技术分享图片

 

 

 

 

 

技术分享图片

 

 

 

 

 

 技术分享图片

 

 

 

 

 

 技术分享图片

 

 

 

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 

 

 

 技术分享图片

技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

技术分享图片

 

 

 

 技术分享图片

 

 

 

 

 技术分享图片

 

 

 

技术分享图片

 

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

技术分享图片

 

 

 

 

 技术分享图片

 

 

 

技术分享图片

 

 

技术分享图片

 

 

 技术分享图片

 

 

 技术分享图片

 

 

 

技术分享图片

 

 

 

 

 

终于一睹AK真容了,很有想法,很幽默

 http://karpathy.github.io/

 技术分享图片

 

Deep RL Bootcamp Lecture 4B Policy Gradients Revisited

标签:想法   技术分享   game   otc   hub   rev   tps   PQ   view   

原文地址:https://www.cnblogs.com/ecoflex/p/8976042.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!