pytorch什么是梯度

目录

  • 1.导数、偏微分、梯度
    • 1.1 导数
    • 1.2 偏微分
    • 1.3 梯度
  • 2. 通过梯度求极小值
  • 3. learning rate
  • 3. 局部最小值
  • 4. Saddle point鞍点

1.导数、偏微分、梯度

1.1 导数

对于y=x 2 2 2 的导数,描述了y随x值变化的一个变化趋势,导数是个标量反应的是变化的程度,标量的长度反应变化率的大小。

1.2 偏微分

偏微分是函数对它的自变量变化率的描述程度,也是标量,是给定自变量的方向,有多少个自变量就有多少个偏微分
z = y 2 2 2 + x 2 2 2
求z对y的偏微分时,把x看成常量

1.3 梯度

梯度是函数所有自变量偏微分组成的向量,梯度既有大小又有方向,大小表示函数在当前点的一个增长速率,方向表示函数在当前点的一个增长方向。
在这里插入图片描述
在这里插入图片描述

2. 通过梯度求极小值

如下例子:
在这里插入图片描述
上述例子中的function相当于z=x 2 2 2+y 2 2 2,z对x求导时,y看成常数因此导数为0,同样z对y求导时,x看成常数,因此导数为0。

3. learning rate

为了使梯度变化不至于太快,还要再y’上乘以一个learning rate即学习率
在这里插入图片描述

3. 局部最小值

如下图:从不同的初始化方向,可能找到的是局部最小值,比如从图中箭头方向搜索。
在这里插入图片描述

4. Saddle point鞍点

如下图:指示的点即为鞍点,像马鞍一样,此时x方向取得最小值,y方向取得最大值
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/517481.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL NDB Cluster 基于Nginx stream的负载均衡配置

安装nginx https://nginx.org/en/download.html 首先从nginx官网中下载nginx 1.12.2.tar.gz 解压nginx.1.22.2.tar.gz之后,执行以下命令基于stream编译Nginx,使得Nginx能够提供tcp代理的功能 ./configure --with-stream make make install配置Nginx …

Linux——线程(2)

在上一篇博客中我介绍了Linux中的线程是什么样的,就如同进程可以通过 fork创建,可以被终止,可以退出一样,线程也可以被我们用户控制,这 篇博客我会介绍线程的控制,并且基于线程的控制所产生的一些问题进行 …

Unity3d调用C++ dll中的函数

一、生成dll 1.新建dll工程 2. 不用管dllmain.cpp,添加自定义Helper.h和Helper.cpp 3.添加要在外部调用的方法 //头文件 #define DLLEXPORT extern "C" __declspec(dllexport) DLLEXPORT int _stdcall Addition(int x, int y); DLLEXPORT int _stdcal…

泰华信号隔离器一进二出分配转换配电变送器有源4-20mA 0-10V输出

品牌:泰工华控 信号隔离器,高精度,高线性度,低温漂。好品质源于用心,我们专心打造好的隔离器。 您需要一款这样的隔离器,转换精度高,响应速度快,耐压隔离高,三端隔离技…

腾讯QQ推出AI聊天搭子;零一万物01AI宣布开源Yi-9B模型

🦉 AI新闻 🚀 腾讯QQ推出AI聊天搭子,进军AI对话领域 摘要:腾讯QQ合作筑梦岛和混元助手,推出了AI对话功能“AI聊天搭子”,提供多种虚拟角色与用户实时互动,目前已开启测试。此外,抖…

Java | 在消息对话框中显示文本

首先需要导入JOptionPane类,JOptionPane类属于Swing组件中的一种,其导入方式如下: import javax.swing.JOptionPane;可以使用JOptionPane的showMessageDialog方法显示消息文本。 参数格式: JOptionPane.showMessageDialog(paren…

面试题个人总结(面经)

自我介绍 你好,我叫XXX,是今天面试初级蓝队的人员,我毕业于XXXX,专业为网络空间安全,我曾经在XXXXX实习过,有过大概一年左右的工作经验,还有过一定的护网经验,去年在XXX厂商护过网,…

JUC总结

文章目录 java中线程的6种状态 静态变量、实例变量、局部变量的线程安全问题: 为什么会出现线程安全问题:在多个线程对共享资源读写操作,就会出现问题 synchronized 锁升级: sleep 和 wait 的区别 park和unpark 是unsafe中…

JAVA实战开源项目:超市商品管理系统(Vue+SpringBoot)

目录 一、摘要1.1 简介1.2 项目录屏 二、研究内容2.1 数据中心模块2.2 超市区域模块2.3 超市货架模块2.4 商品类型模块2.5 商品档案模块 三、系统设计3.1 用例图3.2 时序图3.3 类图3.4 E-R图 四、系统实现4.1 登录4.2 注册4.3 主页4.4 超市区域管理4.5 超市货架管理4.6 商品类型…

软件测试实战,Web项目网页bug定位详细分析总结(详全)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 1、前置条件 1&a…

stable diffusion的额外信息融入方式

conditioning怎么往sd中添加,一般有三种,一种是直接和latent拼一下,另外很多是在unet结构Spatialtransformers上加,和文本特征一样,通过cross-attention往unet上加,这里还需要注意一点,在文本嵌…

企业举办活动发布会的意义是什么?如何利用媒体宣传

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 企业举办活动发布会的意义与媒体宣传策略 一、发布会的意义: 信息传递:直接向公众和利益相关者发布重要信息。品牌塑造:展示企业文化和创新&#xff…