强化学习基本要素
马尔科夫决策过程
策略学习(Policy Learning)
时序差分方法(TD method)
Q-Learning算法
Actor-Critic方法
DQN
DDPG
推荐系统强化学习建模
附录 ...
分类:
编程语言 时间:
2019-10-13 12:45:44
阅读次数:
105
一、防止DDOS、CC攻击 http { limit_conn_zone $binary_remote_addr zone=perip:10m; limit_conn_zone $server_name zone=perserver:10m server { limit_conn perip 10; ...
分类:
其他好文 时间:
2019-10-09 16:04:03
阅读次数:
180
1. 重复的随机数 废话不多说,首先我们来看使用seed的一个很神奇的现象。 go func (rng rngSource) Seed(seed int64) { rng.tap = 0 rng.feed = rngLen rngTap seed = seed % int32max if seed ...
分类:
其他好文 时间:
2019-10-08 20:33:26
阅读次数:
154
系统设计考点 考点聚焦 系统设计考点 什么是系统设计? 系统设计需要掌握哪些知识? 如何设计和实现一个后端系统服务的设计? 什么是系统设计?(System Design) 系统设计是一个定义系统架构,模块,接口和数据满足特定需求的过程 eg: 设计一个短网址服务,评论服务,Feed流系统,抢红包系统 ...
分类:
其他好文 时间:
2019-10-03 12:53:31
阅读次数:
93
[TOC] 论文 : Densely Connected Convolutional Networks ,CVPR 2017 摘要 Recent work has shown that convolutional networks can be substantially deeper, more ...
分类:
Web程序 时间:
2019-09-29 12:37:52
阅读次数:
136
import tensorflow as tf import numpy as np import matplotlib.pyplot as plt # numpy生成200个随机点 x_data = np.linspace(-0.5,0.5,200)[:,np.newaxis] noise = n... ...
分类:
其他好文 时间:
2019-09-28 23:54:48
阅读次数:
216
Attention Is All You Need Transformer 模型整体架构 Multi-head attention Self-Attention Self-Attention工作原理 Self-Attention算法细节 Step1 Step2 Step3&4 Step5 Step6 ...
分类:
其他好文 时间:
2019-09-24 17:47:39
阅读次数:
75
Git 在编辑文件添加时出现如图提示: 原因:CRLF -- Carriage-Return Line-Feed 回车换行 解决方法: Git提供了一个换行符检查功能(core.safecrlf),可以在提交时检查文件是否混用了不同风格的换行符。这个功能的选项如下: false - 不做任何检查 w ...
提出问题 一个网友的博客,记录他在一次面试时,碰到面试官要求他在白板上用TensorFlow写一个简单的网络实现异或(XOR)功能。这个本身并不难,单层感知器不能解决异或问题是学习神经网络中的一个常识,而简单的两层神经网络却能将其轻易解决。但这个问题的难处在于,我们接触TensorFlow通常直接拿 ...
分类:
其他好文 时间:
2019-09-13 13:39:00
阅读次数:
132
Like everyone else, cows like to stand close to their friends when queuing for feed. FJ has N (2 <= N <= 1,000) cows numbered 1..N standing along a st ...
分类:
其他好文 时间:
2019-08-30 22:57:03
阅读次数:
121