NPU 是什么芯片?AI芯片都有哪些?
NPU就是CPU功能细化的产物,就像当年只有CPU一样,发现处理一些简单的重复的任务,特别像游戏这种大量作图时只能用软件算法,效率及其低下,所以发展处的加速卡,发展成为GPU,现在处理一些ai学习算法时都是用GPU软件模拟,效率低下,功耗大,所以又把这部分功能独立出来做成npu,性能更好,功耗更低,但是应用更局限,等以后又有啥专用的领域现在芯片不能满足时,还会出xxpu啥的,是这个意思吗?
人工智能的概念诞生于1956年的Dartmouth学会,麦卡锡在此次会议上正式提出人工智能的概念。人工智能经过半个多世纪的发展,目前已经应用在机器人,语音识别,图像识别,自然语言处理,专家系统等领域。当然还有近几年超火的芯片设计领域,国内AI芯片公司也如雨后春笋般涌现。地平线,燧原,天数智芯,寒武纪,比特大陆.....每家也都推出了自己的芯片产品。
目前市场上的对于AI芯片并无明确统一的定义,广义上所有面向人工智能(Artificial Intelligence,AI),包括Training(训练)和Inference(推理)应用的芯片都可以被称为AI芯片。脑神经图示例,如图2-42所示。

图2-42 脑神经图示例
目前市面上的AI芯片种类太多了,各种PU(process unit)层出不穷,从最常见的CPU,GPU,到现在的BPU,DPU,VPU,NPU等等(当然有一些PU在严格意义上来讲,并不算AI芯片),感觉在命名上,26个英文字母已经快不够了,今天就梳理一下常见的各种PU,看看他们都是如何在各自的领域发挥作用的。
1. APU(Accelerated Processing Units)
中文名字叫加速处理器,是AMD在2011年推出的融聚未来理念产品。它第一次将处理器和独显核心做在一个晶片上,协同计算、彼此加速,使得任务可以灵活地在CPU和GPU间分配,提高效率。
当然,APU也可以指Audio Processing Unit,专门用于处理声音数据的单元。
2. BPU(Brain Processing Unit)
BPU是自动驾驶芯片及解决方案公司研发的一款AI芯片。基于创新的人工智能专用计算架构 BPU,地平线已成功流片量产了中国首款边缘人工智能芯片——专注于智能驾驶的征程(Journey) 1 和专注于 AIoT 的旭日(Sunrise) 1 ;2019 年,地平线又推出了中国首款车规级 AI 芯片征程2和新一代AIoT智能应用加速引擎旭日2 ;2020年,地平线进一步加速AI芯片迭代,推出新一代高效能汽车智能芯片征程 3 和全新一代 AIoT 边缘 AI 芯片平台旭日3。
3. CPU(central processing unit)
CPU的结构主要包括运算器(ALU, Arithmetic and Logic Unit)、控制单元(CU, Control Unit)、寄存器(Register)、高速缓存器(Cache)和它们之间通讯的数据、控制及状态的总线,如图2-43所示。

图2-43 CPU的结构单元示例
4. DPU(Deep-Learning Processing Unit)
DPU的概念最早由深鉴科技提出,成立于2016年,其产品则是基于FPGA的处理单元,拥有业界较为领先的机器学习能力,专注于神经网络剪枝、深度压缩技术及系统级优化。2018年被Xilinx收购。
DPU也指Dataflow Processing
Unit 数据流处理器, Wave Computing 公司提出的AI架构;Data storage Processing Unit,深圳大普微的智能固态硬盘处理器。
5. EPU(Emotion Processing Unit)
EPU这个词,也是第一次听。EPU是由Emoshape公司提出的。Emoshape是一家致力于提供可教导智能机器与人类互动技术的公司。EPU基于微控制器(MCU)设计,在人工智能(AI)、机器人和消费电子设备中促成近乎无限的认知过程产生真正情绪反应。EPU是Ekman理论的延伸,该理论利用情绪进化理论识别12种主要情绪。
EPU的部分主要功能包括:
1)具有高性能机器情绪意识。
2)在智能机器中创造情绪状态和合成情绪。
3)让人工智能或机器人能够体验64万亿种不同的情绪状态。
4)向其他人工智能技术传送数据,以获得一系列真实的表情和互动,并且全面了解语言和评价。
5)对话准确率高达98%。
6. FPU(Floating Processing Unit)
做浮点运算的模块
7. GPU(Graphics Processing Unit)
可以说这几年GPU太火爆了!国内很多AI芯片公司都是做GPU的。在5年以前,想在国内公司做GPU是很难的,但现在则有很多初创公司进入GPU领域,比如天数,沐曦,景嘉微等。
GPU被广泛用于嵌入式系统、移动电话、个人电脑、工作站和电子游戏解决方案当中。现代的GPU对图像和图形处理是十分高效率的,这是因为GPU被设计为很高的并行架构这样使得比通用处理器CPU在大的数据块并行处理算法上更具有优势。
从硬件设计上来讲,CPU 由专为顺序串行处理而优化的几个核心组成。另一方面,GPU则由数以千计的更小、更高效的核心组成,这些核心专为同时处理多任务而设计。如图2-44所示。
串行运算示意图
图2-44 CPU 由专为顺序串行处理而优化的几个核心组成
所以,GPU在图像处理等任务上,有极大的优势,结合自动驾驶等应用场景,使得GPU成为芯片行业的新宠。