(done) LSTM 详解 (包括它为什么能缓解梯度消失)

RNN 参考视频:https://www.bilibili.com/video/BV1e5411K7oW/?p=2&spm_id_from=pageDriver&vd_source=7a1a0bc74158c6993c7355c5490fc600

LSTM 参考视频:https://www.bilibili.com/video/BV1qM4y1M7Nv?p=5&vd_source=7a1a0bc74158c6993c7355c5490fc600

斯坦福教授讲解的 RNN 和 LSTM:https://www.bilibili.com/video/BV1s64y1P7Qm?p=9&vd_source=7a1a0bc74158c6993c7355c5490fc600 (这个视频并没有提到 LSTM 的反向传播推导,skip)


先来复习一下 RNN,以下是 RNN 网络模型结构的示图:
在这里插入图片描述

需要注意的是,RNN 神经网络中的激活函数通常使用 tanh,原因参考这篇博客 【sigmod Relu tanh三种常见的激活函数】
链接在:https://blog.csdn.net/purple_love/article/details/134487378


首先要理解 LSTM 的 motivation:已知 RNN 模型能够处理时间序列信息。但是它有一个问题,RNN 模型在进行反向传播算法训练的时候,对于距离 “cur_time” 较远的信息存在 “梯度消失” 问题,所以 RNN 只具备短期记忆、不具备长期记忆。此外,RNN 也很难区分哪些信息是重要的,哪些信息是不重要的。因此,需要对 RNN 模型进行改良。而其中,最成功的改良产品就是 LSTM。

如下图,是 LSTM 的网络结构
在这里插入图片描述
可以和 RNN 的网络结构对比一下:
在这里插入图片描述

为了理解 LSTM,我们要同时理解它的前向传播过程和反向传播过程,让我们看看下面的三张图片:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

如下图是对 LSTM 的反向传播的手算推导,可以证明 LSTM 能够缓解梯度消失问题
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/671342.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【python】条件语句与循环语句

目录 一.条件语句 1.定义 2.条件语句格式 (1)if (2)if-else (3)elif功能 (4)if嵌套使用 3.猜拳游戏 二.循环语句 1. while循环 2.while嵌套 3.for循环 4.break和conti…

【数据结构初阶】希尔排序

鼠鼠最近学习了希尔排序,做个笔记! 希尔排序也是插入排序的一种捏!本篇博客也是用排升序来举例捏! 希尔排序是基于直接插入排序的,是由大佬D.L.Shell提出的。 目录 1.希尔排序 1.1.预排序 1.2.直接插入排序 2.希…

浅析扩散模型与图像生成【应用篇】(二十一)——DALLE·2

21. Hierarchical Text-Conditional Image Generation with CLIP Latents 该文提出一种基于层级式扩散模型的由文本生成图像的方法,也就是大名鼎鼎的DALLE2。在DALLE2之前呢,OpenAI团队已经推出了DALLE和GLIDE两个文生图模型了,其中DALLE是基…

[机器学习-02] 数据可视化神器:Matplotlib和Seaborn工具包实战图形大全

目录 引言 正文 01-Matplotlib包的使用示例 1)Matplotlib导入方式 2)折线图绘制 3)散点图绘制 4)柱状图绘制 5)饼图绘制 6)等高线图绘制 7)箱线图绘制 8)较为复杂…

各城市-人口就业和工资数据(1978-2022年)

这份数据收集了1978年至2022年间300多个地级市的人口、就业和工资等数据。涵盖的指标包括从业人员数量、平均工资水平、人口密度等,通过这些数据可以深入了解中国各地城市的人口结构、就业状况以及工资水平的变化趋势。这些数据对于研究城市发展、劳动力市场以及区域…

HCIP-Datacom-ARST必选题库_BGP【道题】

1.关于summary automatic命令和BGP聚合的描述,错误的是? 该命令用于实现自动聚合,其优先级高于手动聚合 配置该命令后,BGP将按自然网段聚合路由 该命令用来使能对本地引入的路由进行自动聚合 配置该命令后,BGP只向对等体发送聚合后的路由 1.关于summary automatic命令和BGP聚…

PHP+MySQL组合开发微信公众号小程序二合一分销商城源码系统 带完整的安装代码包以及搭建教程

在当今数字化时代,电子商务的迅猛发展为各行各业带来了无限的商机和挑战。为了满足企业对线上销售平台的多样化需求,我们基于PHP和MySQL技术,开发了一款微信公众号小程序二合一分销商城源码系统。该系统不仅具备高度的可扩展性和稳定性&#…

Java新手必看:快速上手FileOutPutStream类

哈喽,各位小伙伴们,你们好呀,我是喵手。运营社区:C站/掘金/腾讯云;欢迎大家常来逛逛 今天我要给大家分享一些自己日常学习到的一些知识点,并以文字的形式跟大家一起交流,互相学习,一…

【Redis】RDB持久化和AOF 持久化

分布式缓存 单点 Redis 的问题 数据丢失(持久化)并发能力不如集群(主从集群、读写分离)Redis宕机导致服务不可用(Redis哨兵)存储能力差(分片集群) Redis 持久化 RDB 持久化 什么…

小微公司可用的开源ERP系统

项目介绍 华夏ERP是基于SpringBoot框架和SaaS模式的企业资源规划(ERP)软件,旨在为中小企业提供开源且易用的ERP解决方案。它专注于提供进销存、财务和生产功能,涵盖了零售管理、采购管理、销售管理、仓库管理、财务管理、报表查询…

linux 调试-kdb 调试内核-1

目标:打印bcm2835_spi_transfer_one 是如何从用户空间开始调用的 1. kernel 配置 KDB配置选项 添加 spi 控制器驱动 和 spi 设备驱动 2. 调试流程 调试内核-系统启动之后 1. 开发板进入kdb,等待pc 连接 rootraspberrypi:~# echo "ttyS0,115200"…

文件加密软件排行榜前五:好用的文件加密软件推荐

后台有很多老板留言,说最近机密数据外泄的事情频发,让自己开始有了危机意识,想要提前针对企业安全问题采取措施,比方说选一款适合防泄密软件,但是不知道如何选择。 下面介绍几款软件,让大家了解一下市面上常…