码迷,mamicode.com
首页 >  
搜索关键字:mc    ( 470个结果
增强学习笔记 第七章 多步Bootstrap
多步TD是介于单步TD和MC之间的一种方法 7.1 多步TD预测 首先,定义n-step return: 得出n步迭代更新: 其中$G_t^{(n)}$满足下列误差递减性质: 当n取一个折衷值的时候,平方误差最小 7.2 n步Sarsa 将状态价值换为动作价值,重新描述$G_t^{(n)}$: 以及 ...
分类:其他好文   时间:2017-10-05 12:18:21    阅读次数:128
增强学习笔记 第六章 TD方法
TD是一个结合DP和MC之间的方法。TD不需要环境模型,但是又可以bootstrap。 6.1 TD预测 典型的TD(0)预测方程: 看第三章关于状态价值的等式: MC用的是第一行,它之所以为估计,因为不知道$G_t$的期望值,而使用的采样来做的平均。 DP用的是最后一行,它之所以为估计,是因为不知 ...
分类:其他好文   时间:2017-10-04 00:16:54    阅读次数:279
增强学习笔记 第五章 蒙特卡洛方法
5.1 蒙特卡洛预测 分为两种:First-Visit MC和Every-Visit MC,前者用的更多。后者用于函数近似和Eligibility Traces 5.2 蒙特卡洛评估action value 如果没有模型(即不知道每个a会得到什么样的s),则应该使用action value而不是st ...
分类:其他好文   时间:2017-10-03 20:36:48    阅读次数:202
json转datatable
public static DataTable JsonToDataTable(string strJson) { DataTable tb = null; //获取数据 Regex rg = new Regex(@"(?<={)[^}]+(?=})"); MatchCollection mc = ...
分类:Web程序   时间:2017-09-30 20:00:22    阅读次数:269
Egret之MC逐帧动画
此处Egret逐帧动画借助Flash以及TextureMerger工具来生成文件(1:动画描述文件Json,动画图集文件)本人以一只飞行的鸟为例先看Flash,如下flash的项目名称为fly.fla舞台帧信息,A和B为帧标签打开texturemerger,选择egretmovieclip。将fly.swf拖入到编辑区,取名Bird,如下:..
分类:其他好文   时间:2017-09-25 11:28:10    阅读次数:549
Leetcode168ExcelSheetColumnTitle
048oh晨742q炙0http://www.facebolw.com/space/2105727 199巢mc那必62http://www.facebolw.com/space/2105728 T9倩4匚0磁陶8tjhttp://www.facebolw.com/space/2105729 L仿昧 ...
分类:其他好文   时间:2017-09-24 03:17:21    阅读次数:157
luogu p1867【Mc生存】经验值
原题链接:https://www.luogu.org/problem/show?pid=1867 今天看到这个题原来做过没A的时候,心里想:这不就是个模拟吗,看我2min切了它。。。 然后就硬生生调了0.5h,用出了各种大招,freopen,double,数组,中间结果,才将其拿下。。。。。。 思路 ...
分类:其他好文   时间:2017-09-21 21:02:00    阅读次数:171
有return的情况下try catch finally的执行顺序
http://www.cnblogs.com/lanxuezaipiao/p/3440471.html?cm_mc_uid=89442383850615035911861&cm_mc_sid_50200000=1505491196 1、不管有木有出现异常,finally块中代码都会执行;2、当try ...
分类:其他好文   时间:2017-09-16 00:28:43    阅读次数:209
sql
# coding=gbkimport mysql.connector as mc # 导入数据库包def getPasswd(user): # 把获取密码的方法封装成函数 # 首先创建一个数据库连接方法 co = mc.connect( host = "192.168.15.158", port = ...
分类:数据库   时间:2017-09-09 10:42:37    阅读次数:173
洛谷——P2822 组合数问题
https://www.luogu.org/problem/show?pid=2822 题目描述 组合数C_n^mC?n?m??表示的是从n个物品中选出m个物品的方案数。举个例子,从(1,2,3) 三个物品中选择两个物品可以有(1,2),(1,3),(2,3)这三种选择方法。根据组合数的定 义,我们 ...
分类:其他好文   时间:2017-09-02 10:30:58    阅读次数:166
470条   上一页 1 ... 13 14 15 16 17 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!