【cs229-Lecture4】Newton’s method

时间：2014-09-10 15:30:40 阅读：317 评论：0 收藏：0 [点我收藏+]

标签：style blog http 使用 ar strong 2014 art 问题

之前我们在求Logistic回归时，用的是梯度上升算法，也就是要使得似然函数最大化，利用梯度上升算法，不断的迭代。这节课引出牛顿方法，它的作用和梯度上升算法的一样的，不同的是牛顿方法所需的迭代次数更少，收敛速度更快。

红色曲线是利用牛顿法迭代求解，绿色曲线是利用梯度下降法求解。

牛顿法：wiki

牛顿法（Newton‘s method）又称为牛顿-拉弗森方法（Newton-Raphson method），它是一种在实数域和复数域上近似求解方程的方法。方法使用函数 $bubuko.com,布布扣$ 的泰勒级数的前面几项来寻找方程 $bubuko.com,布布扣$ 的根。

首先，选择一个接近函数 $bubuko.com,布布扣$ 零点的 $bubuko.com,布布扣$ ，计算相应的 $bubuko.com,布布扣$ 和切线斜率 $bubuko.com,布布扣$ （这里 $bubuko.com,布布扣$ 表示函数 $bubuko.com,布布扣$ 的导数）。然后我们计算穿过点 $bubuko.com,布布扣$ 并且斜率为 $bubuko.com,布布扣$ 的直线和 $bubuko.com,布布扣$ 轴的交点的 $bubuko.com,布布扣$ 坐标，也就是求如下方程的解：

$bubuko.com,布布扣$

我们将新求得的点的 $bubuko.com,布布扣$ 坐标命名为 $bubuko.com,布布扣$ ，通常 $bubuko.com,布布扣$ 会比 $bubuko.com,布布扣$ 更接近方程 $bubuko.com,布布扣$ 的解。因此我们现在可以利用 $bubuko.com,布布扣$ 开始下一轮迭代。迭代公式可化简为如下所示：

$bubuko.com,布布扣$

已经证明，如果 $bubuko.com,布布扣$ 是连续的，并且待求的零点 $bubuko.com,布布扣$ 是孤立的，那么在零点 $bubuko.com,布布扣$ 周围存在一个区域，只要初始值 $bubuko.com,布布扣$ 位于这个邻近区域内，那么牛顿法必定收敛。并且，如果 $bubuko.com,布布扣$ 不为0, 那么牛顿法将具有平方收敛的性能. 粗略的说，这意味着每迭代一次，牛顿法结果的有效数字将增加一倍。