搜索关键字：随机梯度，搜索到219个结果！码迷,mamicode.com！

python3-梯度下降法

梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（GradientDescent）是最常采用的方法之一，另一种常用的方法是最小二乘法。在求解损失函数的最小值时，可以通过梯度下降法来一步步的迭代求解，得到最小化的损失函数和模型参数值。反过来，如果我们需要求解损失函数的最大值，这时就需要用梯度上升法来迭代了。在机器学习中

分类：编程语言时间：2018-12-12 17:38:25 阅读次数：180

完爆 Best Fit，看阿里如何优化 Sigma 在线调度策略节约亿级成本

2018 年“双 11”的交易额又达到了一个历史新高度 2135 亿。相比十年前，我们的交易额增长了 360 多倍，而交易峰值增长了 1200 多倍。相对应的，系统数呈现爆发式增长。系统在支撑“双 11”过程中的复杂度和难度呈现指数级形式上升趋势。

分类：其他好文时间：2018-12-11 19:49:40 阅读次数：197

随机梯度下降批尺寸的影响

随机梯度下降批尺寸有什么影响呢？？？当数据量足够大的时候可以适当的减小batch_size,由于数据量太大，内存不够。但盲目减少会导致无法收敛，batch_size=1时为在线学习，也是标准的SGD，这样学习，如果数据量不大，noise数据存在时，模型容易被noise带偏，如果数据量足够大，no ...

分类：其他好文时间：2018-12-08 21:10:27 阅读次数：315

各种优化器Optimizer的总结与比较

1.梯度下降法(Gradient Descent) 梯度下降法是最基本的一类优化器，目前主要分为三种梯度下降法：标准梯度下降法(GD, Gradient Descent) 随机梯度下降法(SGD, Stochastic Gradient Descent) 批量梯度下降法(BGD, Batch Gr ...

分类：其他好文时间：2018-12-07 21:17:40 阅读次数：733

Gluon sgd

从最简单的线性回归来说，小批量随机梯度下降的时候，X，y 从迭代器中取出，也是bach_size大小的数据集，那么网络的计算，同样也是小批量的。即代码 l = loss(net(X),y) 包含了，小批量数据集，每一个数据丢到网络中，计算出返回值以后，和真实值得损失。 ...

分类：其他好文时间：2018-12-01 18:40:19 阅读次数：215

[转]TensorFlow如何进行时序预测

TensorFlow 是一个采用数据流图（data flow graphs），用于数值计算的开源软件库。节点（Nodes）在图中表示数学操作，图中的线（edges）则表示在节点间相互联系的多维数据数组，即张量（tensor）。它灵活的架构让你可以在多种平台上展开计算，例如台式计算机中的一个或多个CP ...

分类：其他好文时间：2018-11-25 20:34:25 阅读次数：190

tensorflow-滑动平均模型

随机梯度下降算法训练时，使用滑动平均模型可以提高模型健壮性。在Tensorflow中提供了tf.train.ExponentialMovingAverage来实现滑动平均模型。在初始化ExponentialMovingAverage时，需要提供一个衰减率。控制模型更新速度，它对每个变量会维护一个影子变量，这个影子变量的初始值就是相应变量的初始值，而每次运行变量更新时，影子变量的值会更新为：$$sh

分类：其他好文时间：2018-11-22 10:42:35 阅读次数：299

随机梯度下降分类器和回归器

随机梯度下降分类器并不是一个独立的算法，而是一系列利用随机梯度下降求解参数的算法的集合。 from sklearn.linear_model import SGDClassifier clf = SGDClassifier(loss="hinge", penalty="l2") loss funct ...

分类：其他好文时间：2018-11-16 22:35:16 阅读次数：258

机器学习之感知机

感知机： 1.感知机关键在于损失函数最小化 2.当初值和分类点选择顺序不同时，算得的结果不同。 3.当线性不可分时，感知机算法不收敛，迭代结果震荡。 4.感知机和随机梯度下降。 5.pocket algorithm 口袋算法：每次梯度下降时和“口袋”比较，将损失更小的放到“口袋”里。 6.voted ...

分类：其他好文时间：2018-11-09 16:12:10 阅读次数：169

卷积神经网络分类与回归任务的应用简介

location 对输入图像定位，找到盒子坐标（x,y,w,h)；Clssificaion and Location的最后一层是的特征做两件事，一个是分类，一个是定位。训练时使用已有的模型，也就是最后一层全联接之前所有的参数都用已有模型的，然后在这个基础上进行微调（fine tune），使其向着想 ...

分类：其他好文时间：2018-11-08 23:24:07 阅读次数：446

共219条上一页 1 ... 5 6 7 8 9 ... 22 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)