d2l-优化算法

1. 优化和深度学习

优化和深度学习的目标是不同的：

例如：

深度学习模型的目标函数通常有许多局部最优解。随着目标函数解的梯度接近或变为0时，迭代可能会停止。
最终得到的数值解可能只是局部最优解，而非全局最优解。
一定程度的噪声可能会使参数跳出局部最小值，这是小批量随机梯度下降的优点之一。

除了局部最小值，鞍点(saddle point)是梯度消失的另一个原因。
鞍点是指函数的所有梯度消失，但既不是全局最小值，也不是局部最小值的位置。
例如\(f(x) = x^3\)，在\(x = 0\)处，函数的一阶和二阶倒数消失。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/896878.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！