深度学习记录--梯度检验

数值逼近

为了对梯度进行检验,需要计算近似误差值来接近梯度

对于单边误差和双边误差公式,其中双边误差与真实梯度相差更小,故一般采用双边误差公式

双边误差

公式:g(\theta )=\frac{f(\theta+\varepsilon)-f(\theta-\varepsilon )}{2\varepsilon}

梯度检验(gradient checking)

对于成本函数,求出\theta^{[i]}的导数,计算出双边误差d\Theta^{[i]}=\frac{J(\theta1,\theta2,...,\theta i+\varepsilon,...)-J(\theta1,\theta2,...,\theta i-\varepsilon,...)}{2\varepsilon},再将两者进行比较

比较方法:

s=\left \| d\Theta_{approx}-d\Theta \right \|_{2},判断s的大小

s<10^{-7},则误差很小,效果很好

s<10^{-5},则误差一般,效果一般

s<10^{-3},则误差较大,需要考虑是否错误较多


梯度检验的注意事项

不要在训练中使用梯度检验,它只适用于调试

梯度检验的计算时间较长,且通常在backprop后向传播中进行

当梯度检验得出偏差过大时,要对所有参数进行检查

使用正则化时,要记住在梯度检验中保留正则项

不要在梯度检验的过程中使用dropout

在每次迭代过程中,dropout会随机消除隐层单元的不同子集,J函数难以明确计算

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/411436.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

canvas绘制美队盾牌

查看专栏目录 canvas示例教程100专栏&#xff0c;提供canvas的基础知识&#xff0c;高级动画&#xff0c;相关应用扩展等信息。canvas作为html的一部分&#xff0c;是图像图标地图可视化的一个重要的基础&#xff0c;学好了canvas&#xff0c;在其他的一些应用上将会起到非常重…

记一次 .NET某道闸收费系统 内存溢出分析

一&#xff1a;背景 1. 讲故事 前些天有位朋友找到我&#xff0c;说他的程序几天内存就要爆一次&#xff0c;不知道咋回事&#xff0c;找不出原因&#xff0c;让我帮忙看一下&#xff0c;这种问题分析dump是最简单粗暴了&#xff0c;拿到dump后接下来就是一顿分析。 二&…

力扣1929.数组串联

前言 虽然力扣对我来说很难&#xff0c;但只要每天刷一点&#xff0c;就会慢慢增强能力&#xff0c;总有一天刷动力扣的难题&#xff0c;所以说&#xff0c;今天也是刷力扣的一天。 &#x1f606;&#x1f606; /** * Note: The returned array must be malloced, assume call…

全新商业版SEO关键词按日计费系统/关键词排名优化+会员/网站/关键词管理+搭建教程

源码简介&#xff1a; 全新商业版SEO关键词按日计费系统&#xff0c;它不仅有关键词排名优化功能&#xff0c;还有会员管理、网站管理、关键词管理、关键词查价、公众号查询、财务管理和在线充值等功能&#xff0c;并且附带了搭建教程。 系统不仅具备关键词排名优化功能&…

STM32WLE5JC介绍

32位 ARM Cotrex-M4 CPU 32MHz晶体振荡器 32 kHz RTC振荡器与校准 20x32位备份寄存器 引导程序支持USART和SPI接口 介绍 STM32WLE5/E4xx远程无线和超低功耗器件嵌入了强大的超低功耗LPWAN兼容无线电解决方案&#xff0c;支持以下调制&#xff1a;LoRa&#xff0c;&#xff08…

Zookeeper启动报错常见问题以及常用zk命令

Zk常规启动的命令如下 sh bin/zkServer.sh start 启动过程如果存在失败&#xff0c;是没办法直接看出什么问题&#xff0c;只会报出来 Starting zookeeper … FAILED TO START 可以用如下命令启动&#xff0c;便于查看zk启动过程中的详细错误 sh bin/zkServer.sh start-for…

鸿蒙开发-ArkUI框架实战【日历应用 】

对于刚刚接触OpenHarmony应用开发的开发者&#xff0c;最快的入门方式就是开发一个简单的应用&#xff0c;下面记录了一个日历应用的开发过程&#xff0c;通过日历应用的开发&#xff0c;来熟悉基本图形的绘制&#xff0c;ArkUI的组件的使用&#xff0c;UI组件生命周期&#xf…

pg数据库计算两个时间戳相差的天数

需要使用DATE_PART函数&#xff0c;关于DATE_PART的相关描述&#xff0c;可以参考这里进行学习。 select DATE_PART(day,timestamp1 - timestamp2) as days_difference from tablename;

YOLOv5改进 | 二次创新篇 | 升级版本Dyhead检测头替换DCNv3 实现完美升级(全网独家首发)

一、本文介绍 本文给大家带来的改进机制是在DynamicHead上替换DCNv3模块,其中DynamicHead的核心为DCNv2,但是今年新更新了DCNv3其作为v2的升级版效果肯定是更好的,所以我将其中的核心机制替换为DCNv3给Dyhead相当于做了一个升级,效果也比之前的普通版本要好,这个机制我认…

Pixels:重新定义游戏体验的区块链农场游戏

数据源&#xff1a;Pixels Dashboard 作者&#xff1a;lesleyfootprint.network 最近&#xff0c;Pixels 通过从 Polygon 转移到 Sky Mavis 旗下的 Ronin 网络&#xff0c;完成了一次战略性的转变。 Pixels 每日交易量 Pixels 在 Ronin 网络上的受欢迎程度急剧上升&#xf…

黑马程序员-瑞吉外卖-day3

目录 1.基于Swagger的knife4j 2.代码开发 依赖 然后在WebMvcConfig 设置静态资源映射 在LoginCheckFilter中设置不需要处理的请求路径 3.启动类的优化 1.基于Swagger的knife4j 里面方便我们测试什么的 2.代码开发 依赖 <!--swagger 及knife4j--><dependency>&l…

社交商业革命:Facebook Shops的崛起

近年来&#xff0c;社交媒体逐渐演变为不仅仅是社交的平台&#xff0c;更是商业活动的重要场所。在这个潮流的浪潮中&#xff0c;Facebook Shops的崛起正引领着一场社交商业的革命&#xff0c;为企业和消费者带来了全新的体验。 点击添加图片描述&#xff08;最多60个字&#x…