线性逼近: 相比较于非线性逼近,线性逼近的好处是只有一个最优值,因此可以收敛到全局最优。其中为状态s处的特征函数,或者称为基函数。 常用的基函数的类型为: 增量式方法参数更新过程随机性比较大,尽管计算简单,但样本数据的利用效率并不高。而批的方法,尽管计算复杂,但计算效率高。 批处理方法: 深度强化学... ...
分类:
其他好文 时间:
2017-08-26 13:43:49
阅读次数:
221
Greedy Candidates Problem Code: GCAC Greedy Candidates Problem Code: GCAC Greedy Candidates Problem Code: GCAC The placements/recruitment season is go ...
分类:
其他好文 时间:
2017-08-07 22:11:35
阅读次数:
165
i (PCRE_CASELESS) 如果设置了这个修饰符, 模式中的字母会进行大小写不敏感匹配. m (PCRE_MULTILINE) 默认情况下, PCRE认为目标字符串是由单行字符组成的(然而实际上它可能会包含多行), "行首"元字符(^)仅匹配字符串的开始位置, 而"行末"元字符($)仅匹配字 ...
分类:
Web程序 时间:
2017-07-19 14:45:25
阅读次数:
239
题意: 有n个小兵,每一个小兵有a【i】血量,第一个人每次仅仅能对一个小兵砍一滴血,第二个人每次对全部生存的小兵砍一滴血。最后看第一个人最多能够砍杀几个小兵。 思路: 这个就是游戏中所说的垫刀问题。首先是不一样的越多那么第一个人所补得刀数就越多。 那么就要考虑要多少刀把当前的小兵的血量砍得和别人不一 ...
分类:
其他好文 时间:
2017-07-19 10:38:38
阅读次数:
135
Greedy. 证明: Let's say we have job 1, 2, ..., n, and they have time and fine as t1, f1, t2, f2, ..., tn, fn and they are in the order of t1/f1 <= t2/f2 ...
分类:
其他好文 时间:
2017-07-09 10:58:04
阅读次数:
168
http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=2829 Mike is very lucky, as he has two beautiful numbers, 3 and 5. But he is so greedy th ...
分类:
其他好文 时间:
2017-07-06 14:30:21
阅读次数:
170
present a file by binary character code,let the less characters can be presented simplier. ...
分类:
其他好文 时间:
2017-06-25 10:01:35
阅读次数:
126
many activities will use the same place, every activity ai has its' start time si and finish time fi.let the number of activities to be as many as pos ...
分类:
其他好文 时间:
2017-06-24 14:40:51
阅读次数:
263
搜索匹配的 HTML 标记(greedy) <?php// \\2 是一个逆向引用的例子,其在 PCRE 中的含义是// 必须匹配正则表达式本身中第二组括号内的内容,本例中// 就是 ([\w]+)。因为字符串在双引号中,所以需要// 多加一个反斜线。$html = "<b>bold text</b ...
分类:
Web程序 时间:
2017-06-22 19:43:06
阅读次数:
145