李宏毅机器学习笔记：梯度下降

前言本文是基于台湾李宏毅机器学习的笔记，本文主要记录关于梯度下降的知识点一、梯度下降梯度下降法简介梯度下降的优化目标是使得损失函数L最小，其中θ为参数，假设 θ 有里面有两个参数 θ1, θ2 随机选取初始值，η为学习率梯度下降遇到的问题梯度下降过程中可能会遇到马鞍点，局部最小点，下降速率过慢等等情况，如下图所示，这些情况导致的后果就是梯度约等于或等于0，即梯度消失，在深度学习中，对于梯度消失问题

YuriFan

665人浏览 · 2021-08-01 17:35:41

YuriFan · 2021-08-01 17:35:41 发布

前言

本文是基于台湾李宏毅机器学习的笔记，本文主要记录关于梯度下降的知识点

一、梯度下降

梯度下降法简介

梯度下降的优化目标是使得损失函数L最小，其中θ为参数，假设 θ 有里面有两个参数 θ1, θ2 随机选取初始值，η为学习率

梯度下降遇到的问题

梯度下降过程中可能会遇到马鞍点，局部最小点，下降速率过慢等等情况，如下图所示，这些情况导致的后果就是梯度约等于或等于0，即梯度消失，在深度学习中，对于梯度消失问题尤其看重，梯度消失意味着网络失去了活性相当于网络死亡。

二、梯度下降优化

调整优化的Batch大小

调整训练的优化的batch大小其实主要的区别在于速度和精度上，在优化上如果一次性大批次进行梯度下降优化造成的结果就是速率上很快但是不能保证精确性，因此使用更小的批次进行优化虽然牺牲了速度但是提高了精度

动量法

动量法事实上可以看作给原来的梯度下降法加入了惯性，可以看作一个具有惯性的小球，在梯度越陡的地方随着惯性下降速度也增加，即当前的速度会考虑上一步。

自适应优化

RMSprop是基于随机梯度下降法改进的自适应梯度下降，对于不同的参数需要不同的学习速率，并且对于最近的梯度给予更大的影响对于更早的梯度给予更小的影响

技术共进，成长同行——讯飞AI开发者社区

更多推荐

机器学习与人工智能

python# 创建基类# 定义一对多关系# 定义多对一关系# 定义多对多关系（通过关联表）# 关联表（用于多对多关系）SQLAlchemy ORM提供了强大而灵活的数据库操作方式，通过本文的介绍，您应该能够：安装和配置SQLAlchemy定义数据模型和关系执行基本的CRUD操作构建复杂查询管理数据库事务遵循最佳实践SQLAlchemy还有更多高级特性，如混合属性、事件监听、自定义查询等，值得进一

讯飞AI开发者社区

人工智能吉他教学研究：基于Liberlive与TemPolor的产品与教学思考[特殊字符]

讯飞AI开发者社区

C++与人工智能框架

重新排列范围，使得指定位置的元素等于排序后的元素，并且左边的元素都不大于它，右边的元素都不小于它。算法的原理是 “覆盖” 要删除的元素，将保留的元素移到前面，返回新的逻辑尾迭代器，但。对范围内的每个元素应用一个函数，并将结果存储在另一个范围内。移除范围内连续的重复元素，返回新的逻辑结尾迭代器。旋转范围内的元素，使中间元素成为新的第一个元素。这些算法不会改变它们所操作的容器中的元素。这些算法会修改它