推理引擎流程

推理引擎流程
总结一下推理引擎(IE)调用FPGA设备的流程。开发人员通过IE通用API进行推理调用,IE调用FPGA插件,这调用了运行OpenCL运行时的DLA(英特尔深度学习加速器)。最终发送到实现基元(如卷积、ReLU等)的DLA FPGA IP。如图11-28所示。
图11-28 推理引擎(IE)调用FPGA设备的流程
 位流
深度学习部署工具包(DLDT)随附许多位流,用于各种板卡、推理中使用的数据类型和DL模型。
这些FPGA块可以通过垂直和水平线连接在一起。
如何利用这个信息似乎并不明显。但是Winograd在40多年前解决了一个类似的问题。假设有两种预处理方法,将4×4数据和3×3滤波器分别转换为两个4×4矩阵(左侧下面的前两行),如图11-29所示。
图11-29 将4×4数据和3×3滤波器分别转换为两个4×4矩阵
然后将卷积应用于这两个转换矩阵。由于两者大小相同,卷积只需要进行16次乘法。最后,执行后处理转换,将其转换回2×2矩阵。结果表明,产生相同的卷积结果存在这样的预处理和后处理转换。更好的消息是,这些转换只涉及简单的加减运算,而不涉及乘法。因此,新的Winograd变换可以节省大量计算。
用1-D数据和滤波器来来证明这个想法。
 

 (11-1)

其中
 

 (11-2)

数据⊗滤波器的原始卷积方法涉及6次乘法。将合并预处理、卷积、后处理步骤,并展示它可以从上面计算m₁、m₂、m₃和m₄中推导出来。使用这个Winograd变换,只需要进行4次乘法。
为了完整起见,这里列出了所需的数学变换。可以使用简单的算术运算来完成预处理变换Gg、Bᵀ和后处理变换Aᵀ。

   

  (11-3)
其中,

   (11-4)

在FPGA中,可以在硬件中应用Winograd变换来加速卷积,如图11-30所示。
图11-30 可以在硬件中应用Winograd变换来加速卷积

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/793868.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业管理系统-ERP开发

Enterprise Resource Planning 基于.NET FW 4.8.1开发的ERP系统,以 HandyControl 作为设计参考。 目的 初衷在于学习C#开发。自己设定了一个学习的目标,朝着WPF的方向前进,开发一个能媲美于公司管理系统的Windows客户端(前公司的企业管理系统使用的是Office Access VBA开发…

Exception in thread main java.io.IOException :could not find resource xxxxx.xml

错误如下: 错误原因:(无法正确识别项目中的Resources目录或者java目录的配置文件) 1. resource不是资源目录了 2.配置文件在java目录下 或者这样 解决方法: 1. 在项目结构中将resource选择为资源文件 2. 查看pom文件的build ,如果指定了资源文件是java目录而忘记了指定re…

24.9.7——小学期开发实记

今天完成了基础信息的CRUD,但是遇到了一个关于JAVA Spring Boot注入的问题。 问题如下: Error:(20, 34) Could not autowire. No beans of workCenterInfoMapper type found.@Autowired private workCenterInfoMapper workCenterInfoMapper; 我改成:@Resource private workC…

SPI

SPI SPI共用4种模式,通过控制CPOL(时钟极性)和CPHA(时钟相位)来控制,此处以W25Q128的时序图来利用IO口模拟SPI模式0与模式3通信过程中的时序。模式0:SCL处于低电平,第一个边沿收发 模式1:SCL处于低电平,第二个边沿收发 模式2:SCL处于高电平,第一个边沿收发 模式3:S…

2024软件工程第一次个人作业

这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/SE2024/这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/SE2024/homework/13243这个作业的目标 初步认识博客园和GIthub平台,初步了解软件工程学科的任务学号 102201622一、个人logo文生图任务 使用工具:Op…

Gitness 基础安装

对gitness最基本的安装以及从Github配置token获取源码仓库的相关配置。目录Docker 安装注册账户创建项目导入已有仓库配置 Github Token同步源代码仓库 官方链接Gitness was the next step in the evolution of Drone, from continuous integration to source code hosting, br…

Gradle下载太慢? Gradle官方最全版本极速下载网址

Gradle下载太慢? Gradle官方最全版本极速下载地址 Gradle简介 Gradle 作为一种开源的构建工具,理论上可以开发所有应用,在 Java 应用程序的构建与发布方面起着极大的助力作用。Gradle能够为开发者构建应用程序提供有力支持,这不仅对自动化测试大有益处,还能实现分发构建,…

软件工程课程第一次个人作业1

这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/SE2024/这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/SE2024/homework/13243这个作业的目标 1.理解与运用AI辅助学习与工作(生成logo、指南等) 2.自我介绍 3.学习规划 4.熟悉学习环境学号 102202123一、…

海豚调度清理:使用 API 轻松清理工作流历史版本记录,一键减少关系日志和任务定义日志表的数据量

💡 本系列文章是 DolphinScheduler 由浅入深的教程,涵盖搭建、二开迭代、核心原理解读、运维和管理等一系列内容。适用于想对 DolphinScheduler了解或想要加深理解的读者。 推荐阅读:海豚调度监控:使用图关系解决核心链路告警问题,减轻任务运维负担,用户五星好评!海豚…

吴恩达 AI 完整课程资源2020汇总

风度78 于 2020-02-19 11:30:00 发布https://blog.csdn.net/fengdu78/article/details/104403851编辑 | Will 出品 | 字节AI 吴恩达(Andrew Ng),毫无疑问,是全球人工智能(AI)领域的大 IP!随着近些年来 AI 越来越火的大趋势下,吴恩达一直致力于普及、宣传、推广 AI 教育…

509迷宫

想法还是太过于巧妙了。 首先有一个很简单的容斥 \(n^2\) 做法。 然后我们能发现 \(mod\) 很小,注意:\(\forall_{1 \le i < mod}\) \(C_{mod}^{i} = 0\)。 所以就有个天才的做法,将矩阵沿着对角线切开,类似这样:如果我们每隔 \(mod\) 进行一次切割,那么我们就会发现如…