【淘汰9成NLP工程师的常识题】LSTM的前向计算如何进行加速？

news/2025/3/11 15:50:49/文章来源:https://www.cnblogs.com/fasterai/p/18558644

【淘汰9成NLP工程师的常识题】LSTM的前向计算如何进行加速？

重要性：★★★ 💯

这是我常用的一个面试题。看似简单的基础题，但在面试中能准确回答的不足10% ，常识题的错误反而会让人印象深刻。

此题的关键主要是考察面试者对大矩阵运算和MapRrduce思想的理解。

NLP Github 项目：

NLP 项目实践：fasterai/nlp-project-practice

介绍：该仓库围绕着 NLP 任务模型的设计、训练、优化、部署和应用，分享大模型算法工程师的日常工作和实战经验
AI 藏经阁：https://gitee.com/fasterai/ai-e-book

介绍：该仓库主要分享了数百本 AI 领域电子书
AI 算法面经：fasterai/nlp-interview-handbook#面经

介绍：该仓库一网打尽互联网大厂NLP算法面经，算法求职必备神器
NLP 剑指Offer：https://gitee.com/fasterai/nlp-interview-handbook

介绍：该仓库汇总了 NLP 算法工程师高频面题

核心思想：将小矩阵合并成大矩阵再进行梯度分块（Reduce → Map）。

合并计算遗忘门、输入门、输出门和新增信息的仿射变换，使用“大矩阵”加速运算
通过slice 节点将矩阵分成了 4 份，因此它的反向传播需要整合 4 个梯度

现在我们先来整理一下 LSTM 中进行的计算，如下所示：

这里需要注意式中的 4 个仿射变换。这里的仿射变换是指 $xW_x + hW_h + b$ 这样的式子。4 个仿射变换，其实可以整合为通过 1 个式子进行，如下图所示。

整合4个权重，通过1次仿射变换进行4个计算：

如此，原本单独执行 4 次的仿射变换通过 1 次计算即可完成，可以加快计算速度。这是因为矩阵库计算“大矩阵”时通常会更快。

整合4个权重进行仿射变换的LSTM的计算图：

仿射变换的形状的改变：

批大小是 N，输入数据的维数是 D，记忆单元和隐藏状态的维数都是 H。另外，计算结果 A 中保存了 4 个仿射变换的结果。因此，通过 A[:, :H]、A[:, H:2H] 这样的切片取出数据，并分配给之后的运算节点。

slice节点的正向传播（上）和反向传播（下）：

本文由mdnice多平台发布

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/837388.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【论文阅读笔记】多模态大语言模型必读 —— LLaVA

【论文阅读笔记】多模态大语言模型必读 —— LLaVA

LLaVA (Large Language and Vision Assistant)，proposed by Haotian Liu (UWM), et al.论文地址：https://arxiv.org/abs/2304.08485 代码地址：https://github.com/haotian-liu/LLaVA目录简介Visual Instruction 数据生成视觉指令微调模型架构训练简介人类对于世界的认知是…

阅读更多...

接口文档和编写接口测试用例

接口文档和编写接口测试用例

一、熟悉接口文档和分析接口 1、发送接口文档 2、分析接口文档 3、了解需要测试接口，分析需求文档接口请求参数：接口返回参数：成功整理接口：（自己项目有哪些借款） cms项目接口：查询接口，登录接口，添加用户接口，用户管理接口，文章管理接口，删除用户接口，删除栏目接…

阅读更多...

python代码实现RNN, LSTM, GRU

python代码实现RNN, LSTM, GRU

安装torch, transformers, loguru(本代码实现为下方版本，其余版本实现可比葫芦画瓢自行摸索)pip install torch==1.13.1 transformers==4.44.1 numpy==1.26.4 loguru -i https://pypi.tuna.tsinghua.edu.cn/simple/RNN:Recurrent Neural Network,网络结构如下图所示:import nu…

阅读更多...

ChatGPT国内中文版镜像网站整理合集（2024/11/20）

ChatGPT国内中文版镜像网站整理合集（2024/11/20）

ChatGPT 镜像站的用途镜像站（Mirror Site）ChatGPT镜像网站是指通过复制原始网站内容和结构，创建的备用网站。其主要目的是在原始网站无法访问时，提供相同或类似的服务和信息。一、ChatGPT中文镜像站 ① yixiaai.com 支持4o以及o1，支持MJ绘画 ② chat.lify.vip 支持通用…

阅读更多...

鸿蒙NEXT开发案例：随机数生成

鸿蒙NEXT开发案例：随机数生成

【引言】本项目是一个简单的随机数生成器应用，用户可以通过设置随机数的范围和个数，并选择是否允许生成重复的随机数，来生成所需的随机数列表。生成的结果可以通过点击“复制”按钮复制到剪贴板。【环境准备】 • 操作系统：Windows 10• 开发工具：DevEco Studio NEXT Be…

阅读更多...

腾讯AICR : 智能化代码评审技术探索与应用实践（下）

腾讯AICR : 智能化代码评审技术探索与应用实践（下）

阅读更多...

13、优化器_（执行计划、统计信息）_1

13、优化器_（执行计划、统计信息）_1

执行计划一个SQL文本，经过解析，经过解析之后，oracle发现有很多种执行方案，然后oracle在这多种执行方案中，选出一种oracle认为最优的一种执行方案，来作为执行计划，然后oracle按照执行计划一步步去执行因为oracle有多种的执行方案，但是，有的执行方案快，有的执行方案慢…

阅读更多...

我们有40%代码是 AI 写的

我们有40%代码是 AI 写的

阅读更多...

12、表的访问方式（索引）_2

12、表的访问方式（索引）_2

表的访问方式以t1表为例来看表的访问方式首先创建了一个用户，建立了一张表t1，按照object_id列排序的： SQL> create user u1 identified by u1; -- 创建用户u1 User created.SQL> grant connect,resource,dba to u1; -- 给u1授权 Grant succeeded.SQL> conne…

阅读更多...

第十一课接口测试之postman11.1

第十一课接口测试之postman11.1

一、介绍postman Postman是一个网页调试工具，也可以调试css、html等 Postman的操作环境环境：Postman Mac、Windows X32、Windows X64、Linux系统、 postman 浏览器扩展程序、postman chrome应用程序 Postman下载：https://www.postman.com/downloads/ 二、postman安装：略三…

阅读更多...

蠢就是坏，坏就是蠢

蠢就是坏，坏就是蠢

如题看着如今的社会乱象，我们不禁想：是什么人让我们的社会变成这样？我们下面来讨论这个问题。请注意，我们将阻碍社会发展的反动行为定义为坏的，行使这种行为的人定义为坏人。而我的观点则如标题所示。第一种 “蠢” 是自以为是，也就是以为自己无所不知，不认同或忽略…

阅读更多...

为什么你的工作总是越忙越乱？答案可能出乎意料！

为什么你的工作总是越忙越乱？答案可能出乎意料！

信息过载与任务混乱：现代职场的隐形敌人信息洪流对现代工作的挑战在现代社会，无论个人还是团队，几乎每天都要面对海量的信息。邮件、聊天工具、项目需求文档，甚至口头传递的信息，都让我们感到“时间不够用，信息处理不过来”。这种现象在企业和团队中尤为严重：信息分散：…

阅读更多...

推荐文章

最新文章