图像处理SoC的方案调研(视频编码器和DLA)

图片

最近在公众号和粉丝交流,提到了图像处理SoC,包括的部分有CPU + ISP + 视频编码器 + DLA + axi/ahb/apb总线及外设,我觉得很有意思,值得学习和了解,尤其是视频编码器和DLA这两个概念。

1 视频编码器

视频编码器是一种可以将数字视频信号压缩并转换成特定格式的工具。编码器通常使用特定的算法,可以使得视频文件体积变小,便于存储和传输。它的发展源于互联网的发展,高清视频的实时数据巨大,为了实现在有限带宽下传输如此高数据量的视频图像,音视频应用系统通过使用编码设备将图像进行压缩编码大幅降低数据量后,再通过网络传输。
主要的功能有三类:

  • 压缩视频数据:改变视频数据的存储方式,减小视频文件的大小,而同时保持高质量。

    更改视频格式:将视频进行转码,让不同格式的视频能够在不同设备和平台上播放。

    调整图像质量:通过增加或减少压缩因子,来影响视频的图像质量。

常见的视频编码器包括了H.264、H.265、MPEG-4和VP9等。
H.264是目前最流行的格式之一,它被广泛应用于移动设备、智能电视和数字广告牌等场景中。主要用于720P,1080P的视频,而4K(40962160)、8K(81924320)就不够传了。

H.265是H.264的后继产品,可以进一步提高视频压缩比例。H.265/HEVC在现有的主流视频编码标准H.264上保留了一些较为成熟的技术和继承其现有的优势,同时采用了基于四叉树结构的编码分割、预测编码技术等先进的编码技术,视频压缩效率将比H.264提高大约一半,可以轻松实现在低带宽下实现1080P图像的传输,同时支持4K、8K高清图像的传输。

MPEG-4是另一个流行的视频压缩标准,也被广泛用于数字电视和网络视频等领域。

VP9是谷歌推出的免费视频编码器,具有更好的视频压缩效果。

2 DLA

深度学习加速器DLA(Deep Learning Accelerator)是英伟达公司的产品。它是一种专用集成电路,是一款针对深度学习操作的固定功能加速器引擎,能够有效地执行现代神经网络架构中常见的固定操作,例如卷积、反卷积、全连接、激活、池化、批量归一化等各种层,DLA不支持Explicit Quantization。根据NVIDIA官方文档的介绍,DLA支持了约15种主要AI算子的执行,不支持的算子类型将会offload到GPGPU进行计算。

尽管 DLA 没有 GPU 那么多的支持层,但它仍然支持许多流行的神经网络架构中使用的各种层。在许多情况下,层支持可能会满足模型的要求。例如,NVIDIA TAO 工具包包括 DLA 支持的各种预训练模型,范围从对象检测到动作识别。虽然需要注意的是,DLA 吞吐量通常低于 GPU,但它非常节能。

软件调用流程:
从应用->模型加载->用户态runtime library->设备文件系统(devfs ioctl)->内核态驱动->NPU硬件的调用来看,它和VIP的开发思路是一样的。

英伟达Xavier以GPU为计算核心,其SoC方案是CPU+GPU+ASIC:主要有4个模块: CPU,GPU,Deep Learning Accelerator(DLA)和Programmable Vision Accelerator(PVA)。占据最大面积的是GPU,接下来是CPU,最后辅以两个ASIC:一个是用于inference的DLA,还有一个是加速传统CV的PVA。

与之对应的是特斯拉。特斯拉FSD以NPU(一种ASIC)为计算核心:有三个主要模块:CPU,GPU和Neural Processing Unit(NPU)。其中最重要也是面积最大的就是特斯拉自研的NPU(属于ASIC),主要用来运行深度神经网络。GPU主要是用来运行deep neural network的 post processing部分。总SoC方案也是CPU+GPU+ASIC,在NPU里也有类似DLA的功能,只不过叫法不同。
图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/462208.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网桥与网关

文章目录 概要网桥网关联系与区别参考文章 概要 网桥和网关的理解 网桥 几个名词的概念 网关 联系与区别 参考文章 如何通俗地解释什么是网桥? 网关到底是什么求通俗易懂讲解? 网桥:网桥也叫桥接器,是连接两个局域网的一种存储/转发…

5G NR 信道号计算

一、5G NR的频段 增加带宽是增加容量和传输速率最直接的方法,目前5G最大带宽将会达到400MHz,考虑到目前频率占用情况,5G将不得不使用高频进行通信。 3GPP协议定义了从Sub6G(FR1)到毫米波(FR2)的5G目标频谱。 其中FR1是5G的核心频段&#xff0…

MySQL优化器

优化器 MySQL存储引擎中存在了一个可插拔的优化器OPTIMIZER_TRACE,可以看到内部查询计划的TRACE信息,从而可以知道MySQL内部执行过程 查询优化器状态 show variables like optimizer_trace;Variable_name Valueoptimizer_trace enabledoff,one_lineoff…

【闲谈】初识深度学习

在过去的十年中,深度学习彻底改变了我们处理数据和解决复杂问题的方式。从图像识别到自然语言处理,再到游戏玩法,深度学习的应用广泛且深入。本文将探讨深度学习的基础知识、关键技术以及最新的研究进展,为读者提供一个全面的视角…

Hexo更换Matery主题

引言 在数字化时代,拥有一个个人博客已经成为许多人展示自己技能、分享知识和与世界互动的重要方式。而在众多博客平台中,Hexo因其简洁、高效和易于定制的特点而备受青睐。本文将详细介绍如何为你的Hexo博客更换主题,让你的个人博客在互联网…

【stomp实战】websocket原理解析与简单使用

一、WebSocket 原理 WebSocket是HTML5提供的一种浏览器与服务器进行全双工通讯的网络技术,属于应用层协议。它基于TCP传输协议,并复用HTTP的握手通道。浏览器和服务器只需要完成一次握手,两者之间就直接可以创建持久性的连接, 并…

多线程基础详解(看到就是赚到)

🎥 个人主页:Dikz12📕格言:那些在暗处执拗生长的花,终有一日会馥郁传香欢迎大家👍点赞✍评论⭐收藏 目录 创建线程 1.创建类继承Thread,重写run() 2.实现Runnable,重写run() 3.继承Thread,使用匿名内部类 …

全新抖音快手小红书去水印系统网站源码 | 支持几十种平台

全新抖音快手小红书去水印系统网站源码 | 支持几十种平台

备战蓝桥杯---动态规划(基础1)

先看几道比较简单的题&#xff1a; 直接f[i][j]f[i-1][j]f[i][j-1]即可&#xff08;注意有马的地方赋值为0&#xff09; 下面是递推循环方式实现的AC代码&#xff1a; #include<bits/stdc.h> using namespace std; #define int long long int a[30][30]; int n,m,x,y; …

移动端设置position: fixed;固定定位,底部出现一条缝隙,不知原因,欢迎探讨!!!

1、问题 在父盒子中有一个子盒子&#xff0c;父盒子加了固定定位&#xff0c;需要子盒子上下都有要边距&#xff0c;用margin或者padding挤开时&#xff0c;会出现缝隙是子盒子背景颜色的。 测试过了&#xff0c;有些手机型号有&#xff0c;有些没有&#xff0c;微信小程序同移…

Python数据可视化库之ggplot使用详解

概要 数据可视化是数据分析和数据沟通的关键部分。Python 作为一门强大的数据科学和数据分析工具,提供了多种数据可视化库,其中之一就是 ggplot。ggplot 是一个基于 ggplot2 的 Python 数据可视化库,它可以创建精美且高度可定制的图表,以更好地理解和传达数据。本文将深入…

【Python/网络安全】 Git漏洞之Githack工具基本安装及使用详析

[Python/网络安全] Git漏洞之Githack工具基本安装及使用详析 前言安装步骤工具使用实战总结 前言 Git是一个非常流行的开源分布式版本控制系统&#xff0c;它被广泛用于协同开发和代码管理。许多网站和应用程序都使用Git作为其代码管理系统&#xff0c;并将其部署到生产环境中…