牛客题解 | 实现一个简单的基于时间反向传播（BPTT）的循环神经网络（RNN）-编程知识

牛客题解 | 实现一个简单的基于时间反向传播（BPTT）的循环神经网络（RNN）

news/2025/3/12 12:57:10/文章来源:https://www.cnblogs.com/wc529065/p/18767291

题目

题目链接

循环神经网络（RNN）是一种能够处理序列数据的神经网络，其特点是能够将前一时刻的输出作为下一时刻的输入。

BPTT是循环神经网络的一种训练方法，其数学推导可以参考相关资料。大体的更新步骤与BP神经网络类似，但是不同的是需要考虑时间步长的影响。

具体原理可以参考相关文献，这里不做赘述。

在本题中，用到的计算公式如下：

\[h_t = \tanh(W_{xh} x_t + W_{hh} h_{t-1} + b_h) \]

\[y_t = W_{hy} h_t + b_y \]

权重更新方式如下

\[W_{xh} = W_{xh} - \eta \frac{\partial L}{\partial W_{xh}} \]

\[W_{hh} = W_{hh} - \eta \frac{\partial L}{\partial W_{hh}} \]

\[W_{hy} = W_{hy} - \eta \frac{\partial L}{\partial W_{hy}} \]

\[b_h = b_h - \eta \frac{\partial L}{\partial b_h} \]

\[b_y = b_y - \eta \frac{\partial L}{\partial b_y} \]

学习率\(\eta\)在本题中为0.01这个固定值。

标准代码如下

class SimpleRNN:def __init__(self, input_size, hidden_size, output_size):self.hidden_size = hidden_sizeself.W_xh = np.random.randn(hidden_size, input_size) * 0.01self.W_hh = np.random.randn(hidden_size, hidden_size) * 0.01self.W_hy = np.random.randn(output_size, hidden_size) * 0.01self.b_h = np.zeros((hidden_size, 1))self.b_y = np.zeros((output_size, 1))def forward(self, x):h = np.zeros((self.hidden_size, 1))  # Initialize hidden stateoutputs = []self.last_inputs = []self.last_hiddens = [h]for t in range(len(x)):self.last_inputs.append(x[t].reshape(-1, 1))h = np.tanh(np.dot(self.W_xh, self.last_inputs[t]) + np.dot(self.W_hh, h) + self.b_h)y = np.dot(self.W_hy, h) + self.b_youtputs.append(y)self.last_hiddens.append(h)self.last_outputs = outputsreturn np.array(outputs)def backward(self, x, y, learning_rate):dW_xh = np.zeros_like(self.W_xh)dW_hh = np.zeros_like(self.W_hh)dW_hy = np.zeros_like(self.W_hy)db_h = np.zeros_like(self.b_h)db_y = np.zeros_like(self.b_y)dh_next = np.zeros((self.hidden_size, 1))for t in reversed(range(len(x))):dy = self.last_outputs[t] - y[t].reshape(-1, 1)  # (Predicted - Actual)dW_hy += np.dot(dy, self.last_hiddens[t+1].T)db_y += dydh = np.dot(self.W_hy.T, dy) + dh_nextdh_raw = (1 - self.last_hiddens[t+1] ** 2) * dh  # Derivative of tanhdW_xh += np.dot(dh_raw, self.last_inputs[t].T)dW_hh += np.dot(dh_raw, self.last_hiddens[t].T)db_h += dh_rawdh_next = np.dot(self.W_hh.T, dh_raw)# Update weights and biasesself.W_xh -= learning_rate * dW_xhself.W_hh -= learning_rate * dW_hhself.W_hy -= learning_rate * dW_hyself.b_h -= learning_rate * db_hself.b_y -= learning_rate * db_y

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/897661.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

运行窗口无法打开软件程序的解决办法

事情起因：　　本人安装了 Notepad-- 文本编辑软件，但是通过Win+R，打开运行窗口，输入Notepad-- 无法打开该软件；报错如下：解决办法　　此电脑-属性-高级系统设置-高级-环境变量　　在系统变量里，找到 Path 变量添加软件安装路径，并上移确定保存，电脑重启，系统环…

牛客题解 | 为数据集行创建复合超向量

牛客题库题解题目题目链接复合超向量是一种将多个向量组合成一个向量的方法，其计算公式为： \[composite\ hypervector = \sum_{i=1}^{n} w_i \times v_i \]其中，\(w_i\) 是权重，\(v_i\) 是向量。在本题中，这是一个使用超维计算（HDC）的任务，需要通过以下步骤处理数据…

【设计模式】从事件驱动到即时更新：掌握观察者模式的核心技巧

概述定义：又被称为发布-订阅（Publish/Subscribe）模式，它定义了一种一对多的依赖关系，让多个观察者对象同时监听某一个主题对象。这个主题对象在状态变化时，会通知所有的观察者对象，使他们能够自动更新自己。结构在观察者模式中有如下角色：Subject：抽象主题（抽象被…

【设计模式】探索状态模式在现代软件开发中的应用

概述【例】通过按钮来控制一个电梯的状态，一个电梯有开门状态，关门状态，停止状态，运行状态。每一种状态改变，都有可能要根据其他状态来更新处理。例如，如果电梯门现在处于运行时状态，就不能进行开门操作，而如果电梯门是停止状态，就可以执行开门操作。类图如下：代码…

团队展示（组长：金帝彪）

一、团队介绍 1.1 团队概况 1.1.1 博客展示链接团队名称，彩虹小分队 https://www.cnblogs.com/JINjin20040207 1.1.2 团队项目描述健康体重管理平台 1.1.3 队员风采姓名:金帝彪风格：谋定后动擅长的技术：业务分析编程的兴趣：C 希望的软工角色：业务分析师一句话宣言：…

3.12 数字逻辑电路

1.时序逻辑电路 1.1 与组合逻辑电路（比如译码器，多路选择器，全加法器）的区别：时许逻辑电路可以存储信息 1.2 基本存储元件 1.2.1 RS锁存器（存储一个byte位的信息）（低电频使能） R:reset复位;S:set置位 R和S是两个输入端，A和B希望是两个取反状态当S=0，表示要置位（低…

day:19 html实战

一、认识标签 1、标题标题 h1--h6 格式： <!doctype html>认识标签第一大标题第二大标题第三大标题第四大标题第五大标题第六大标题 </body>2、常用标签代码：常用标签段落标签,也叫p标签斜体标签，也叫em标签 b标签，也是加粗斜体标签加粗标签下划线删…

Properties-读取配置文件中的内容

读取配置文件中的内容Properties-读取配置文件中的内容新建子项目properties 修改POM 父POM中加上子项目module。子项目依赖父项目，打包方式jar。引入spring-boot-configuration-processor和lombok(Lombok 的安装与使用)spring-boot-configuration-processor的作用是生成配置…

使用 Arduino 硬件上的 PIL 进行代码验证和验证1. 尝试arduino的PIL程序例程-arduino_pil_bolck 1.1 准备安装包安装arduino 硬件支持包安装编辑器MinG-w64 1.2实现步骤https: //ww2.mathworks.cn/help/simulink/supportpkg/arduino_ref/code-verification-and-validation-wit…

【设计模式】责任链模式教你如何优雅地分发任务

概述在现实生活中，常常会出现这样的事例：一个请求有多个对象可以处理，但每个对象的处理条件或权限不同。例如，公司员工请假，可批假的领导有部门负责人、副总经理、总经理等，但每个领导能批准的天数不同，员工必须根据自己要请假的天数去找不同的领导签名，也就是说员工必…

macOS Sequoia 15.3.2 (24D81 | 24D2082) 正式版 ISO、IPSW、PKG 下载

macOS Sequoia 15.3.2 (24D81 | 24D2082) 正式版 ISO、IPSW、PKG 下载macOS Sequoia 15.3.2 (24D81 | 24D2082) 正式版 ISO、IPSW、PKG 下载 iPhone 镜像、Safari 浏览器重大更新和 Apple Intelligence 等众多全新功能令 Mac 使用体验再升级请访问原文链接：https://sysin.org…

macOS Sequoia 15.3.2 (24D81) Boot ISO 原版可引导镜像下载

macOS Sequoia 15.3.2 (24D81) Boot ISO 原版可引导镜像下载macOS Sequoia 15.3.2 (24D81) Boot ISO 原版可引导镜像下载 iPhone 镜像、Safari 浏览器重大更新和 Apple Intelligence 等众多全新功能令 Mac 使用体验再升级请访问原文链接：https://sysin.org/blog/macOS-Sequoi…