Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling

news/2025/1/23 12:01:27/文章来源:https://blog.csdn.net/kuxingseng123/article/details/131604800

感想：由于看不懂官方代码的原因，自己这方面耽误了一段时间，一方面，在AI与经济学之间犹豫了许久，另一方面，工作了半年，也没发工资，没空找培训代码的课程，所以停止更新了三四个月，现在想通了。路要一步一步的走。事情也要一点一点的去深耕细作。今天，AI又重新搞起来啦，先从研读论文开始吧！

摘要

* RNNs中不同类型的循环单元。特别关注，实现门机制的复杂的单元。比如：LSTM、GRU。

传统的循环单元： tanh 单元。

介绍

数据集： three polyphonic music datasets

two internal datasets

背景：RNN

* RNN是传统前馈神经网络的拓展，传统前馈神经网络能够处理a variable-length sequence input

RNN处理变长序列，通过使用:a recurrent hidden state 循环隐藏状态。

RNN更新循环隐藏状态 $h_t$

传统的循环隐藏状态更新方程：

$h_{t} = g(wx_{t }+ Uh_{t - 1})$

a smooth, bounded function（平滑有界函数)

一个生成式RNN的输出是一个序列下一个元素的概率分布。给定当前状态 $h_{t}$ 生成时模型可以捕获可变长度的模型分布。只需用一个特别的输出标记一个序列的末尾就可以实现可变长度。

RNN很难捕捉到长短时依赖（Long-term dependencies） : 梯度消失或梯度爆炸。

解决方法： simple clipped gradient 裁剪的梯度。

设计比通常激励函数更复杂的激励函数。一个简单非线性元素级别的仿射变换

通过门单元实现的： LSTM单元、GRU单元。

门循环神经网络

Hochreiter and Schmidhuber（1997）：提出LSTM。

本文使用的：

the implementation of LSTM as used in Graves（2013）

$o_t^j$ 是一个输出门。计算公式如下：

记忆单元： $c^j_t$

通过部分已经存在记忆部分来更新，增加一个新的记忆内容。

遗忘门： $f^j_t$

门循环单元（GRU）

每个循环单元可以自适应的捕捉不同时间刻度下的依赖。GRU具有调节信息流动的门单元，但是没有一个单独的记忆单元。

讨论

LSTM和GRU共有的特征从t时刻到t+1时刻的更新。

实验

模型

LSTM units

, GRUs

tanh units

结果和分析

论文思路

在同一数据集上比较两个门单元：LSTM、GRU，并对其表现进行评价其优劣。

解决问题：训练RNN捕捉长期依赖时，经常出现梯度消失和梯度爆炸。

报课之前，先自己总结论文写作思路以及解决问题，不但的积累！争取在老师的辅导下冲刺二区。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/18993.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

wx.getUserProfile too frequently 问题

wx.getUserProfile too frequently 问题

接口调用频率规范概念介绍小程序wx接口可分为“普通接口”和“限频接口”。 “限频接口”指的是一个用户在一段时间内不允许频繁调用的wx接口，此类接口一般会调用到微信后台系统资源，为了保护系统，同时防止用户资源被滥用，开…

阅读更多...

软件测试基础概念

软件测试基础概念

什么是需求什么是需求？简单来说就是我想吃饭，这件事就是我的需求，我不想上课，这也是我的需求。对于软件测试来说，需求可以分为用户需求和软件需求。用户需求用户需求简单可以理解为甲方提出的要求，如…

阅读更多...

git基础教程(linux)

git基础教程(linux)

1.git简介 git 分布式版本控制 git两大特点： 版本控制：支持多人同时开发分布式： 2.安装与配置安装 sudo apt-get install git安装成功，运行如下命令： git3.创建一个版本库 (1)新建一个目录git_test&#xff0c…

阅读更多...

zabbix服务部署

zabbix服务部署

文章目录 zabbix1 zabbix简介1.1 组成部件1.2 监控原理1.3 Zabbix 6.0新特性1.4 Zabbix6.0功能组件1.4.1 Zabbix Server1.4.2 数据库1.4.3 Web界面1.4.4 Zabbix Agent1.4.5 Zabbix Proxy1.4.6 Java Gateway 2 部署zabbix服务端2.1 部署Nginx2.2 安装PHP2.3 修改Nginx配置2.4 修…

阅读更多...

找工作不用愁！送你一份Salesforce顾问面试秘籍（下）（含答案）

找工作不用愁！送你一份Salesforce顾问面试秘籍（下）（含答案）

作为SaaS行业的先驱，Salesforce的发展一路高歌猛进。在Salesforce生态系统中不仅能学习到最新的技术，而且比其他行业的同岗位享有更高的薪水，这也驱使了越来越多人加入Salesforce大军。在之前的文章中，自由侠部落为学习者梳理了…

阅读更多...

奥威BI-金蝶云星空SaaS版一站式平台：对接数据、做分析

奥威BI-金蝶云星空SaaS版一站式平台：对接数据、做分析

金蝶云星空和BI大数据分析平台都在企业数字化转型中扮演了重要的角色，为企业提供了全面的数字化解决方案和数据分析功能，两者强强联合不仅能提高部署效率，更能增强数据分析、数据可视化效果，帮助企业更好地适应市场变化和用户需求…

阅读更多...

Arcgis Pro NDVI(植被指数）导出RGB

Arcgis Pro NDVI(植被指数）导出RGB

在arcgis中计算的NDVI栅格数据，取值范围为-1到1，直接导出JPG或者PNG，会出现导出错误的问题： 导出出错， 设置导出格式为TIFF，然后选中使用渲染器，勾选强制RGB颜色，即可导出你选择的色…

阅读更多...

【C++STL】list的反向迭代器

【C++STL】list的反向迭代器

list的反向迭代器文章目录 list的反向迭代器reverse.h疑问1：为什么在迭代器当中不需要写深拷贝、析构函数疑问2：为什么在迭代器当中需要三个模板参数？疑问3：反向迭代器是怎么实现的？疑问4：为什么*解引用不…

阅读更多...

创建UI组件库后上传NPM

创建UI组件库后上传NPM

上篇已经讲了如何创建自己的组件库，这篇讲怎么上传npm后，可以下载使用 1.首先看下组件的文件结构在index.js中要写上每个组件可以按需引用的条件 import Button from "./src/button";Button.install function(Vue) {Vue.component(Button.…

阅读更多...

Kubernetes 容器类型 Init - pause - sidecar - app容器

Kubernetes 容器类型 Init - pause - sidecar - app容器

目录 Kubernetes 的容器类型 Init 初始化容器参考文档：Init 容器 | Kubernetes 使用 Init 容器的情况案例：定义了一个具有 2 个 Init 容器的简单 Pod 你通过运行下面的命令启动 Pod： 发现两个Init容器都没有运行成功查看更多详细…

阅读更多...

Mycat【什么是Mycat、Mycat与其他中间件区别、Mycat应用场景、核心概念详解、Mycat原理】(一)-全面详解（学习总结---从入门到深化）

Mycat【什么是Mycat、Mycat与其他中间件区别、Mycat应用场景、核心概念详解、Mycat原理】(一)-全面详解（学习总结---从入门到深化）

目录 Mycat概述_什么是Mycat Mycat概述_Mycat与其他中间件区别 Mycat概述_Mycat应用场景 Mycat概念_核心概念详解 Mycat概述_Mycat原理 Mycat部署安装_MySQL主从复制概述 Mycat概述_什么是Mycat 什么是Mycat Mycat是数据库中间件，所谓中间件数据库中间件是连…

阅读更多...

Oracle语句优化 (汇总)

Oracle语句优化 (汇总)

大部分写sql语句都是为了实现而实现，如果最后在投入使用的过程中没有很难接受的性能，基本不怎么去考虑其性能。最近刚好有点时间，对优化方面进修进修，以备不时之需。选择最有效率的表名顺序 Oracle的解析器按照从右到左的顺序处…

阅读更多...

推荐文章

最新文章