搜索关键字：梯度下降法，搜索到389个结果！码迷,mamicode.com！

python3-梯度下降法

梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（GradientDescent）是最常采用的方法之一，另一种常用的方法是最小二乘法。在求解损失函数的最小值时，可以通过梯度下降法来一步步的迭代求解，得到最小化的损失函数和模型参数值。反过来，如果我们需要求解损失函数的最大值，这时就需要用梯度上升法来迭代了。在机器学习中

分类：编程语言时间：2018-12-12 17:38:25 阅读次数：180

python实现梯度下降法

# coding:utf-8 import numpy as np import matplotlib.pyplot as plt x = np.arange(-5/2,5/2,0.01) y = -x**3+x**2+np.e+x**4 dy = lambda x:-3*x**2+2*x+4*x*... ...

分类：编程语言时间：2018-12-07 23:21:20 阅读次数：250

各种优化器Optimizer的总结与比较

1.梯度下降法(Gradient Descent) 梯度下降法是最基本的一类优化器，目前主要分为三种梯度下降法：标准梯度下降法(GD, Gradient Descent) 随机梯度下降法(SGD, Stochastic Gradient Descent) 批量梯度下降法(BGD, Batch Gr ...

分类：其他好文时间：2018-12-07 21:17:40 阅读次数：733

二叔看ML第一：梯度下降

原理梯度下降是一个很常见的通过迭代求解函数极值的方法，当函数非常复杂，通过求导寻找极值很困难时可以通过梯度下降法求解。梯度下降法流程如下： ![image.png 10.8kB][1] 上图中，用大写字母表示向量，用小写字母表示标量。假设某人想入坑，他站在某点，他每移动一小步，都朝着他所在点的梯 ...

分类：其他好文时间：2018-11-25 13:23:24 阅读次数：206

反向传播常用优化器

"github博客传送门" "csdn博客传送门" 计算出损失值后,这个损失值越小越好,梯度下降的算法就用在这里,帮助寻找最小的那个损失值,从而反推出 w 和 b 达到优化模型的效果常用的梯度下降法可以分为: 1. 批量梯度下降:遍历全部数据集算一次损失,计算量大,计算速度慢,不支持在线学习 2. ...

分类：其他好文时间：2018-11-04 14:49:48 阅读次数：185

梯度下降法、随机梯度下降法、小批量梯度下降法

本文以二维线性拟合为例，介绍批量梯度下降法、随机梯度下降法、小批量梯度下降法三种方法，求解拟合的线性模型参数。需要拟合的数据集是 $(X_1, y_1), (X_2, y_2)..., (X_n, y_n)$，其中$X^i=(x_1^i, x_2^i)$，表示2个特征，$y^j$是对应的回归值。 ...

分类：其他好文时间：2018-10-25 00:15:11 阅读次数：161

论文阅读 SNAPSHOT ENSEMBLES

引入 1. 随机梯度下降的特点随机梯度下降法 (Stochastic Gradient Descent)作为深度学习中主流使用的最优化方法, 有以下的优点: 躲避和逃离假的鞍点和局部极小点的能力这篇论文认为, 这些局部极小也包含着一些有用的信息, 能够帮助提升模型的能力. 2. 局部 ...

分类：其他好文时间：2018-10-07 12:08:29 阅读次数：841

优化算法—梯度下降

转自：https://www.cnblogs.com/shixiangwan/p/7532858.html 梯度下降法，是当今最流行的优化（optimization）算法，亦是至今最常用的优化神经网络的方法。本文旨在让你对不同的优化梯度下降法的算法有一个直观认识，以帮助你使用这些算法。我们首先会考察 ...

分类：编程语言时间：2018-10-05 22:40:08 阅读次数：297

深度卷积网络原理—实例讲解梯度下降法参数更新过程

首先，先回顾梯度下降公式：（下面利用均方差MSE损失来进行演示）梯度下降的训练公式：接下来，按照上面的公式进行求最大值的案例讲解令，学习速率为0.1，初始化参数w1=0，w2=0，b=0 样本一：x1=0.1，x2=0.8 输出： OUT=w1x1 + w2x2 + b =0*0.1 + 0* ...

分类：其他好文时间：2018-10-04 10:57:46 阅读次数：511

TensorFlow 实现线性回归

1、生成高斯分布的随机数导入numpy模块，通过numpy模块内的方法生成一组在方程周围小幅波动的随机坐标。代码如下：运行上述代码，输出图形如下： 2、采用TensorFlow来获取上述方程的系数首先搭建基本的预估模型y = w * x + b，然后再采用梯度下降法进行训练，通过最小化损失函 ...

分类：其他好文时间：2018-10-01 01:11:29 阅读次数：238

共389条上一页 1 ... 11 12 13 14 15 ... 39 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)