NG的课件1也讲到了牛顿法,它对应的update rule是
H对应Hessian矩阵
给出了关于牛顿法更详细的解释:
将函数做泰勒展开
对比单变量函数泰勒展开公式:
考虑我们需要找一阶导数是0的位置
和ng课件给出的一致。
牛顿法和梯度下降相比收敛更加快速,但是每次迭代的计算量更大(n+1,n+1)维度的hessian矩阵的计算,但是如果n不是特别大那么整体来看牛顿法更快。
本文共 189 字,大约阅读时间需要 1 分钟。
NG的课件1也讲到了牛顿法,它对应的update rule是
H对应Hessian矩阵
给出了关于牛顿法更详细的解释:
将函数做泰勒展开
对比单变量函数泰勒展开公式:
考虑我们需要找一阶导数是0的位置
和ng课件给出的一致。
牛顿法和梯度下降相比收敛更加快速,但是每次迭代的计算量更大(n+1,n+1)维度的hessian矩阵的计算,但是如果n不是特别大那么整体来看牛顿法更快。
转载地址:http://tiohx.baihongyu.com/