英特尔FPGA深度学习加速(DLA)套件

英特尔FPGA深度学习加速(DLA)套件
    英特尔FPGA的DLA加速套件,如图11-17所示。
图11-17 英特尔FPGA的DLA加速套件
深度学习部署工具包(DLDT)中的推理引擎,提供了一个高级的设备无关API来编程推理。这是一些示例代码,如图11-18所示。
图11-18 深度学习部署工具包(DLDT)中的推理引擎示例代码
推理引擎加载用户提供的IR并调用相应的插件来处理特定设备的推理,如图11-19所示。
图11-19 推理引擎加载用户提供的IR并调用相应的插件来处理特定设备的推理
对于FPGA,它调用了DLA(深度学习加速)运行时引擎,如图11-20所示。
图11-20 FPGA调用了DLA(深度学习加速)运行时引擎
如图11-21,驱动加速器中DL模型的执行。
图11-21 驱动加速器中DL模型的执行
部署DNN模型是一个软件过程。FPGA已经预先编程了一个为DLA运行DL模型而设计的比特流。不需要FPGA编译。如图11-22所示。
图11-22 FPGA已经预先编程了一个为DLA运行DL模型而设计的比特流
这里是DLA 运行时用于运行DL模型的DLA架构。该架构包含卷积PE(处理元素)阵列、用于存储特征图和 DL 中常用的层(组件)的缓存,如图11-23所示。
图11-23 DLA 运行时用于运行DL模型的DLA架构
将DNN模型映射到这个加速引擎架构中。许多DL模型,如AlexNet,包含高度相似的层序列组,例如卷积层后跟ReLU、归一化和最大池化。如图11-24所示。
 
图11-24 将DNN模型映射到这个加速引擎架构中
在FPGA内部DL层是由配置的互连链接的块实现的,如图11-25所示。
图11-25 在FPGA内部DL层是由配置的互连链接的块实现的
要运行一组层,创建一个数据流并通过负责特定类型DL层的块传递它。要执行整个模型,重复流式循环以处理下一组,直到所有DNN层都被处理。如图11-26所示。
图11-26 创建一个数据流并通过负责特定类型DL层的块传递
这些块在运行时高度可重构且可绕过。这使得深度学习层(DL)的不同设计参数(如CNN步幅)或跳过不需要的层成为可能。如图11-27所示。
图11-27 在运行时高度可重构且可绕过
首先,视频数据从DDR(双数据率)通道到达,如图11-28所示。
图11-28 视频数据从DDR(双数据率)通道到达
如果视频数据太大而无法存储在芯片上的流缓存中,则将其切片并在多个流水线迭代中逐个传递。在每个迭代中,数据从缓存中提取并通过卷积PE阵列(PE-处理元素)和激活块进行处理。然后通过交叉开关(XBAR)传递给其他块,例如标准化和最大池化。然后将数据反馈到流缓存中,以供下一组层使用。一旦整个模型处理完毕,就会将其写回内存并继续处理下一片数据。以图11-28表总结了深度学习加速器(DAL)引擎用于执行DL模型的图循环架构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/793869.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

推理引擎流程

推理引擎流程 总结一下推理引擎(IE)调用FPGA设备的流程。开发人员通过IE通用API进行推理调用,IE调用FPGA插件,这调用了运行OpenCL运行时的DLA(英特尔深度学习加速器)。最终发送到实现基元(如卷积、ReLU等)的DLA FPGA IP。如图11-28所示。图11-28 推理引擎(IE)调用FPG…

企业管理系统-ERP开发

Enterprise Resource Planning 基于.NET FW 4.8.1开发的ERP系统,以 HandyControl 作为设计参考。 目的 初衷在于学习C#开发。自己设定了一个学习的目标,朝着WPF的方向前进,开发一个能媲美于公司管理系统的Windows客户端(前公司的企业管理系统使用的是Office Access VBA开发…

Exception in thread main java.io.IOException :could not find resource xxxxx.xml

错误如下: 错误原因:(无法正确识别项目中的Resources目录或者java目录的配置文件) 1. resource不是资源目录了 2.配置文件在java目录下 或者这样 解决方法: 1. 在项目结构中将resource选择为资源文件 2. 查看pom文件的build ,如果指定了资源文件是java目录而忘记了指定re…

24.9.7——小学期开发实记

今天完成了基础信息的CRUD,但是遇到了一个关于JAVA Spring Boot注入的问题。 问题如下: Error:(20, 34) Could not autowire. No beans of workCenterInfoMapper type found.@Autowired private workCenterInfoMapper workCenterInfoMapper; 我改成:@Resource private workC…

SPI

SPI SPI共用4种模式,通过控制CPOL(时钟极性)和CPHA(时钟相位)来控制,此处以W25Q128的时序图来利用IO口模拟SPI模式0与模式3通信过程中的时序。模式0:SCL处于低电平,第一个边沿收发 模式1:SCL处于低电平,第二个边沿收发 模式2:SCL处于高电平,第一个边沿收发 模式3:S…

2024软件工程第一次个人作业

这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/SE2024/这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/SE2024/homework/13243这个作业的目标 初步认识博客园和GIthub平台,初步了解软件工程学科的任务学号 102201622一、个人logo文生图任务 使用工具:Op…

Gitness 基础安装

对gitness最基本的安装以及从Github配置token获取源码仓库的相关配置。目录Docker 安装注册账户创建项目导入已有仓库配置 Github Token同步源代码仓库 官方链接Gitness was the next step in the evolution of Drone, from continuous integration to source code hosting, br…

Gradle下载太慢? Gradle官方最全版本极速下载网址

Gradle下载太慢? Gradle官方最全版本极速下载地址 Gradle简介 Gradle 作为一种开源的构建工具,理论上可以开发所有应用,在 Java 应用程序的构建与发布方面起着极大的助力作用。Gradle能够为开发者构建应用程序提供有力支持,这不仅对自动化测试大有益处,还能实现分发构建,…

软件工程课程第一次个人作业1

这个作业属于哪个课程 https://edu.cnblogs.com/campus/fzu/SE2024/这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/SE2024/homework/13243这个作业的目标 1.理解与运用AI辅助学习与工作(生成logo、指南等) 2.自我介绍 3.学习规划 4.熟悉学习环境学号 102202123一、…

海豚调度清理:使用 API 轻松清理工作流历史版本记录,一键减少关系日志和任务定义日志表的数据量

💡 本系列文章是 DolphinScheduler 由浅入深的教程,涵盖搭建、二开迭代、核心原理解读、运维和管理等一系列内容。适用于想对 DolphinScheduler了解或想要加深理解的读者。 推荐阅读:海豚调度监控:使用图关系解决核心链路告警问题,减轻任务运维负担,用户五星好评!海豚…

吴恩达 AI 完整课程资源2020汇总

风度78 于 2020-02-19 11:30:00 发布https://blog.csdn.net/fengdu78/article/details/104403851编辑 | Will 出品 | 字节AI 吴恩达(Andrew Ng),毫无疑问,是全球人工智能(AI)领域的大 IP!随着近些年来 AI 越来越火的大趋势下,吴恩达一直致力于普及、宣传、推广 AI 教育…