degugging:make sure gradient descent is working correctlycost function(J(θ)) of Number of iteration运行错误的图象是什么样子的运行正确的图象是什么样子的how to choose learning ra...
分类:
系统相关 时间:
2015-05-24 17:00:58
阅读次数:
141
feature scaling:缩小或扩大feature的值,使所有的feature处于类似的范围,这样进行gradient descnet时更快趋向最小值.因为不同的feature的范围相差很大时,它的cost function的等值线是椭圆的,但当它们相近时,等值线接近于圆,这样趋向最小值是,圆...
分类:
系统相关 时间:
2015-05-23 18:21:19
阅读次数:
220
今天太长姿势了,什么叫懂了也写不出代码说的不就是我吗,就那么几行代码居然叽叽歪歪写了一个小时。首先exercise要实现的是softmax的cost function和gradient,如下图:(1)(2)(3)下面就来仔细分析怎么不借助for循环高效的实现上面三个函数。首先P是一个关键,因为在J和...
分类:
其他好文 时间:
2015-05-23 16:43:39
阅读次数:
187
在设置背景颜色半透明经常用CSS的rgba和filter,写法类似这样:background:rgba(5,7,12,0.9);filter:progid:DXImageTransform.Microsoft.gradient(startcolorstr=#e505070c,endcolorstr=...
分类:
其他好文 时间:
2015-05-23 14:06:10
阅读次数:
165
table th{ border:1px solid #CCCCCC; background-color:#FFFFFF; FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff...
分类:
Web程序 时间:
2015-05-21 12:14:50
阅读次数:
146
随机梯度下降(Stochastic gradient descent)和 批量梯度下降(Batch gradient descent )的公式对比、实现对比分类:梯度下降最优化2013-05-25 21:2122978人阅读评论(16)收藏举报梯度下降最优化迭代梯度下降(GD)是最小化风险函数、损失...
分类:
其他好文 时间:
2015-05-21 12:07:43
阅读次数:
156
1. 梯度下降法 导数为0, 所以直接沿导数方向。 learning rate 过小:,过大。 越靠近极值,梯度下降步长越小。 用上所有的training数据,叫batch gradient descent. 计算梯度时要用同一个时刻的值,不能用更新后的值。 迭代停止条件:2. feat...
分类:
系统相关 时间:
2015-05-19 22:23:26
阅读次数:
219
IE系列filter: progid:DXImageTransform.Microsoft.Gradient(startColorStr='#FF0000',endColorStr='#F9F900',gradientType='0');参数:startColorStr起始颜色 endColorSt...
分类:
Web程序 时间:
2015-05-19 16:18:06
阅读次数:
245
android自定义View绘制的时候,会有很多情况下要与字体打交道,涉及到字体宽度、高度的时候要特别注意一下几个概念,见图:
baseLine:一行文字的底线。
Ascent: 字符顶部到baseLine的距离。
Descent: 字符底部到baseLine的距离。
Leading: 字符行间距。
Jav...
分类:
移动开发 时间:
2015-05-15 15:34:23
阅读次数:
159
.btn-warning { color: #fff; text-shadow: 0 -1px 0 rgba(0,0,0,0.25); background-color: #faa732; background-image: -moz-linear-gradient(top,#fbb450,...
分类:
其他好文 时间:
2015-05-15 13:24:39
阅读次数:
132