Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling

感想:由于看不懂官方代码的原因,自己这方面耽误了一段时间,一方面,在AI与经济学之间犹豫了许久,另一方面,工作 了半年,也没发工资,没空找培训代码的课程,所以停止更新了三四个月,现在想通了。路要一步一步的走。事情也要一点一点的去深耕细作。今天,AI又重新搞起来啦,先从研读论文开始吧!

摘要

*  RNNs中不同类型的循环单元。特别关注,实现门机制的复杂的单元。比如:LSTM、GRU。

传统的循环单元: tanh 单元

介绍

数据集: three polyphonic music datasets

               two internal datasets

背景:RNN

* RNN是传统前馈神经网络的拓展,传统前馈神经网络能够处理a variable-length sequence input

RNN处理变长序列,通过使用:a recurrent hidden state 循环隐藏状态

RNN更新循环隐藏状态 $h_t$

传统的循环隐藏状态更新方程:

$h_{t} = g(wx_{t }+ Uh_{t - 1})$

a smooth, bounded function(平滑有界函数)

一个生成式RNN的输出是一个序列下一个元素的概率分布。给定当前状态$h_{t}$ 生成时模型可以捕获可变长度的模型分布。只需用一个特别的输出标记一个序列的末尾就可以实现可变长度

RNN很难捕捉到长短时依赖(Long-term dependencies) : 梯度消失或梯度爆炸

解决方法: simple clipped gradient 裁剪的梯度。

                  设计比通常激励函数更复杂的激励函数。一个简单非线性元素级别的仿射变换

                  通过门单元实现的: LSTM单元、GRU单元

门循环神经网络

 Hochreiter and Schmidhuber(1997): 提出LSTM。

本文使用的:

the implementation of LSTM as used in Graves(2013)

 

 $o_t^j$是一个输出门。计算公式如下:

记忆单元:$c^j_t$

通过部分已经存在记忆部分来更新,增加一个新的记忆内容。 

遗忘门:$f^j_t$ 

门循环单元(GRU) 

每个循环单元可以自适应的捕捉不同时间刻度下的依赖。GRU具有调节信息流动的门单元,但是没有一个单独的记忆单元

讨论 

LSTM和GRU共有的特征从t时刻到t+1时刻的更新

实验

模型

LSTM units

, GRUs

tanh units

 

结果和分析 

论文思路 

在同一数据集上比较两个门单元:LSTM、GRU,并对其表现进行评价其优劣。

解决问题:训练RNN捕捉长期依赖时,经常出现梯度消失和梯度爆炸

报课之前,先自己总结论文写作思路以及解决问题,不但的积累!争取在老师的辅导下冲刺二区。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/18993.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

wx.getUserProfile too frequently 问题

接口调用频率规范 概念介绍 小程序wx接口可分为“普通接口”和“限频接口”。 “限频接口”指的是一个用户在一段时间内不允许频繁调用的wx接口,此类接口一般会调用到微信后台系统资源,为了保护系统,同时防止用户资源被滥用,开…

软件测试基础概念

什么是需求 什么是需求?简单来说就是我想吃饭,这件事就是我的需求,我不想上课,这也是我的需求。对于软件测试来说,需求可以分为用户需求和软件需求。 用户需求 用户需求简单可以理解为甲方提出的要求,如…

git基础教程(linux)

1.git简介 git 分布式版本控制 git两大特点: 版本控制:支持多人同时开发 分布式: 2.安装与配置 安装 sudo apt-get install git安装成功,运行如下命令: git3.创建一个版本库 (1)新建一个目录git_test&#xff0c…

zabbix服务部署

文章目录 zabbix1 zabbix简介1.1 组成部件1.2 监控原理1.3 Zabbix 6.0新特性1.4 Zabbix6.0功能组件1.4.1 Zabbix Server1.4.2 数据库1.4.3 Web界面1.4.4 Zabbix Agent1.4.5 Zabbix Proxy1.4.6 Java Gateway 2 部署zabbix服务端2.1 部署Nginx2.2 安装PHP2.3 修改Nginx配置2.4 修…

找工作不用愁!送你一份Salesforce顾问面试秘籍(下)(含答案)

作为SaaS行业的先驱,Salesforce的发展一路高歌猛进。在Salesforce生态系统中不仅能学习到最新的技术,而且比其他行业的同岗位享有更高的薪水,这也驱使了越来越多人加入Salesforce大军。 在之前的文章中,自由侠部落为学习者梳理了…

奥威BI-金蝶云星空SaaS版一站式平台:对接数据、做分析

金蝶云星空和BI大数据分析平台都在企业数字化转型中扮演了重要的角色,为企业提供了全面的数字化解决方案和数据分析功能,两者强强联合不仅能提高部署效率,更能增强数据分析、数据可视化效果,帮助企业更好地适应市场变化和用户需求…

Arcgis Pro NDVI(植被指数)导出RGB

在arcgis中计算的NDVI栅格数据,取值范围为-1到1,直接导出JPG或者PNG,会出现导出错误的问题: 导出出错, 设置导出格式为TIFF,然后选中使用渲染器,勾选强制RGB颜色,即可导出你选择的色…

【C++STL】list的反向迭代器

list的反向迭代器 文章目录 list的反向迭代器reverse.h疑问1:为什么在迭代器当中不需要写深拷贝、析构函数疑问2:为什么在迭代器当中需要三个模板参数?疑问3:反向迭代器是怎么实现的?疑问4:为什么*解引用不…

创建UI组件库后上传NPM

上篇已经讲了如何创建自己的组件库,这篇讲怎么上传npm后,可以下载使用 1.首先看下组件的文件结构 在index.js中要写上每个组件可以按需引用的条件 import Button from "./src/button";Button.install function(Vue) {Vue.component(Button.…

Kubernetes 容器类型 Init - pause - sidecar - app容器

目录 Kubernetes 的容器类型 Init 初始化容器 参考文档:Init 容器 | Kubernetes 使用 Init 容器的情况 案例:定义了一个具有 2 个 Init 容器的简单 Pod 你通过运行下面的命令启动 Pod: 发现两个Init容器都没有运行成功 查看更多详细…

Mycat【什么是Mycat、Mycat与其他中间件区别、Mycat应用场景、核心概念详解、Mycat原理】(一)-全面详解(学习总结---从入门到深化)

目录 Mycat概述_什么是Mycat Mycat概述_Mycat与其他中间件区别 Mycat概述_Mycat应用场景 Mycat概念_核心概念详解 Mycat概述_Mycat原理 Mycat部署安装_MySQL主从复制概述 Mycat概述_什么是Mycat 什么是Mycat Mycat是数据库中间件,所谓中间件数据库中间件是连…

Oracle语句优化 (汇总)

大部分写sql语句都是为了实现而实现,如果最后在投入使用的过程中没有很难接受的性能,基本不怎么去考虑其性能。最近刚好有点时间,对优化方面进修进修,以备不时之需。 选择最有效率的表名顺序 Oracle的解析器按照从右到左的顺序处…