1.用梯度下降算法来训练或者学习训练集上的参数w和b,如下所示,第一行是logistic回归算法,第二行是成本函数J,它被定义为1/m的损失函数之和,损失函数可以衡量你的算法的效果,每一个训练样例都输出y,把它和基本真值标签y进行比较 右边展示了完整的公式,成本函数衡量了参数w和b在训练集上的效果。 ...
分类:
其他好文 时间:
2019-01-21 22:49:14
阅读次数:
190
一、固定阈值分割 cv2.threshold()用来实现阈值分割,有4个参数: 参数1:要处理的原图,一般是灰度图 参数2:设定的阈值 参数3:最大阈值,一般是255 参数4:阈值的方式,主要有5种,详情:ThresholdTypes 理解这5种阈值方式: 固定阈值将整幅图片分成两类值,它并不适用于 ...
分类:
编程语言 时间:
2019-01-19 18:55:28
阅读次数:
320
LeNet5 LeNet5 诞生于 1994 年,是最早的卷积神经网络之一,并且推动了深度学习领域的发展。自从 1988 年开始,在许多次成功的迭代后,这项由 Yann LeCun 完成的开拓性成果被命名为 LeNet5(参见:Gradient-Based Learning Applied to D ...
分类:
其他好文 时间:
2019-01-16 21:42:00
阅读次数:
194
Deep_Deterministic_Policy_Gradient 逻辑梳理: 1、DDPG是AC 模型,输入包括(S,R,S_,A) 2、Actor intput:(S) output: a loss :max(q) q 来自Critic 3、Critic input : S 、A output ...
分类:
其他好文 时间:
2019-01-09 23:27:07
阅读次数:
394
Policy Gradient 可以直接预测出动作,也可以预测连续动作,但是无法单步更新。 QLearning 先预测出Q值,根据Q值选动作,无法预测连续动作、或者动作种类多的情况,但是可以单步更新。 一句话概括 Actor Critic 方法: 结合了 Policy Gradient (Actor ...
分类:
其他好文 时间:
2019-01-09 13:30:44
阅读次数:
1020
一、概念 逻辑回归(Logistic Regression,LR)是一种广义的线性回归分析模型,属于监督学习算法,需要打标数据,可以用在回归、二分类和多分类等问题上,最常用的是二分类。 线性回归就是通过一条曲线区分不同的数据集,在二分类问题上会有一条直线对其进行区分,如下: 逻辑回归需要每组数据都是 ...
分类:
编程语言 时间:
2019-01-07 10:37:53
阅读次数:
189
层级:z-index:10; 大的在上面(可以为负) 动画样式:渐变过渡动画 线性渐变 background: linear-gradient(red, blue); 默认从上到下可多个颜色 background: linear-gradient(rgba(255,0,0,0), rgba(255, ...
分类:
Web程序 时间:
2019-01-07 00:11:05
阅读次数:
230
Policy Gradient综述: Policy Gradient,通过学习当前环境,直接给出要输出的动作的概率值。 Policy Gradient 不是单步更新,只能等玩完一个epoch,再更新参数,所以是一个off-policy 数学推导 最大化R,,用梯度下降,需要求R的梯度。 vt的计算 ...
分类:
其他好文 时间:
2019-01-05 22:41:56
阅读次数:
281
主要用到css3中的gradient这个属性 但这是用用背景,如果要让字体也有渐变效果需要加写修饰 ...
分类:
其他好文 时间:
2019-01-05 19:49:22
阅读次数:
198