码迷,mamicode.com
首页 > 其他好文 > 详细

Understanding dopamine and reinforcement learning: The dopamine reward prediction error hypothesis

时间:2020-07-10 15:33:11      阅读:68      评论:0      收藏:0      [点我收藏+]

标签:war   inf   了解   框架   ict   理论   font   height   play   

郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!

技术图片

 

Abstract

  在中脑多巴胺能神经元的研究中取得了许多最新进展。要了解这些进步以及它们之间的相互关系,需要对作为解释框架并指导正在进行的实验探究的计算模型有深刻的理解。现在,理论和实验的这种相互交织非常清楚地表明,中脑多巴胺神经元的阶段性活动为突触改变提供了一个整体机制。这些突触改变反过来又为特定类别的强化学习机制提供了机械基础,而强化学习机制现在似乎已成为人类和动物行为的基础。这篇综述既描述了该结论的关键经验性发现,也描述了得出此结论的奇妙的理论进展。

Understanding dopamine and reinforcement learning: The dopamine reward prediction error hypothesis

标签:war   inf   了解   框架   ict   理论   font   height   play   

原文地址:https://www.cnblogs.com/lucifer1997/p/13279164.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!