An Overview of High Performance Computing and Responsibly Reckless Algorithms

news/2024/9/19 16:01:27/文章来源:https://www.cnblogs.com/SError0819/p/18417825

该笔记内容来源于 Jack Dongarra 教授于 2024.8.5 在中大的讲座“An Overview of High Performance Computing and Responsibly Reckless Algorithms”。

大多数东西还不懂但是会慢慢了解的。

1970 年代的 HPC 系统

  • CDC 7600 36.4 MHz:主存 \(65\) 千词(每个词 \(60\) 位),峰值 \(36 \rm{Mflop/s}\),每日至少停止运行一次(通常是四到五次)。

  • IBN 370.195 18.5 MHz:并行运算,可以同时进行 \(7\) 次浮算,内存 \(4 \rm{MB}\)

50 年来线性系统软件包的开发

  • EISPACK(1970's):使用 Fortran,它依赖于矩阵的行。

  • LINPACK(1980's):依赖 Level 1 Basic Linear Algebra Subprograms(BLAS) 操作,即向量乘向量,且使用矩阵的列。

此外 Level 2 & 3 BLAS - ATLAS 支持矩阵乘向量和矩阵乘矩阵操作。

  • LAPACK(1990's):依赖 Level-3 BLAS 操作,对缓存十分友好。

  • ScaLAPACK(2000's):依赖 PBLAS Mess Passing。(PVM 和 MPI 是 Message passing 的标准)

在之后的 PLASMA/MAGMA(2010's) 和 SLATE(2020's) (依赖于 C++)出现了 DAG Scheduling(DAG 调度,基于 PaRSEC)等等,不再赘述。

现在的 HPC Environment

  • 高度并行,使用分布式内存和 MRI + Open-MP 程序设计模型。

  • 商业处理器 + GPU 加速器。

  • 浮算次数不反应解决问题的时间大小。

  • 有 64,32,16,8 字节级别的浮算硬件。

Dennard Scaling

Dennard Scaling(登纳德缩放定律,1974)认为,随着晶体管尺寸的缩小,其功率密度保持不变,从而使芯片的功率与芯片面积成正比。随着晶体管密度的增加,每个晶体管的能耗将降低,计算机将变得更加节能。

但自 2005-2007 年前后,Dennard Scaling 定律似乎已经失效。集成电路中的晶体管数量仍在增加,但性能提升开始放缓。主要原因在于,当芯片尺寸不变而晶体管数量增多时,电流泄漏问题变得更加严重,导致芯片升温,进一步增加能源成本。

Frontier

  • 峰值 \(2\rm{Eflop/s}\),功率 \(20+\rm{MW}\)。在数据分析、机器学习、人工智能方面,在 \(16\) 位下达到了 \(11.2\rm{Eflop/s}\) 的峰值。

  • 每个 node 有一个 AMD CPU 和四个 AMD GPU(后者性能占比为 \(99\%\)),\(730\mathrm{GB}\) fast memory 和 \(2\mathrm{TB}\) NVMe memory。

  • \(9408\) nodes(\(37,632\) GPUs,\(8.8\times 10^6\) Cores),\(706\mathrm{PB}\) 内存(\(695\mathrm{PB}\) Disk + \(11\mathrm{PB}\) SSD)。

值得注意的是目前 TOP 级别的 HPC 的 Fraction of Peak 十分的低(大部分 \(<2.0\%\) 甚至是 \(1.0\%\))。

"Respnsibly Reckless" Algorithms

牵扯到 AI 和 ML,Deep Learning 需要大量的小型矩阵运算("the time-consuming part"),从而引出这个 Responsibly Reckless Algorithms:

  • 尝试使用一个快速的算法,但是它可能会失败(概率较低)。避免 Data Movement 和 Synchronization(同步?),使用 Mixed Precision。

  • 检查其不稳定性,有需要的话再用稳定算法计算它。


Algorithm / Software advances follows hardware.

And there is "plenty of room at the top".

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/798989.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenDiary 24.9

《复活》很久没更日寄了这张是 9.16 下午出门的时候看见拍的 感觉很干净,很漂亮9.17今天突然开始更日寄总之写日记是一鸽再鸽,再加上博客园快完蛋了而新博客还没有眉目,暑假到开学期间写日寄的动力下降了很多 发生了很多事,实在是太多事了,以至于很难理清头绪还有就是,从…

基于FPGA的2ASK调制解调系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR

1.算法仿真效果 vivado2019.2仿真结果如下(完整代码运行后无水印):本系统在以前写过的ASK调制解调系统的基础上,增加了高斯信道模块,误码率统计模块,可以验证不同SNR情况下的ASK误码情况。设置SNR=20db设置SNR=12db设置SNR=8db设置SNR=4db设置SNR=0dbRTL结构如下:2.算法…

基于心电信号时空特征的QRS波检测算法matlab仿真

1.课题概述通过提取ECG信号的时空特征,并使用QRS波检测算法提取ECG信号的峰值,并在峰值点标记峰值信息。2.系统仿真结果3.核心程序与模型 版本:MATLAB2022aclc; clear; close all; warning off; addpath(genpath(pwd)); rng(default)load ECG.mat Fs = 360; [loc,t…

基于PSO粒子群优化的GroupCNN分组卷积网络时间序列预测算法matlab仿真

1.算法运行效果图预览 (完整程序运行后无水印) 2.算法运行软件版本 matlab2022a3.部分核心程序 (完整版代码包含详细中文注释和操作步骤视频)LR = g1(1);numHiddenUnits1 = floor(g1(2))+1;% numHiddenUnits2 = floor(g1(3))+1;% layers = func_model2(Dim,num…

Qt MetaTypeInterface

Qt中的Meta Type 包含两种类型,每个类型都以一个整型ID来表示, 内建类型和用户自定义类型(自定义类型对应的整型ID 从65536 即 QMetaType::User 开始):1)内建类型: corelib\kernel\qmetatype.h// F is a tuple: (QMetaType::TypeName, QMetaType::TypeNameID, RealType) #d…

Marvelous Designer基础操作3 - 贴图导出

Marvelous Designer基础操作,包括加材质、贴图,导出衣服,导入模特做适配。--本篇导航--加材质 外部贴图 导出衣服、导入到Blender 导入自己的虚拟模特 给虚拟模特加安排板 自动适配板片配合视频看材质和导出的部分 视频中还包含了做双层的方法,也就是【克隆层(外部)】【克…

自动化测试 RobotFramework自定义静态测试类库总结

实践环境 win11 家庭中文版 Python 3.9.13 robotframework6.1.1 说明:为了方便的使用robot命令,安装好robotframwork后,修改系统环境,添加robot.exe(PYTHON_HOME/Scripts/robot.exe)所在路径到系统环境变量path 安装参考连接:https://github.com/robotframework/robotfr…

Marvelous Designer基础操作2 - 制板编辑

Marvelous Designer基础操作,本篇涉及到具体的板片编辑、合并、分割、扩展等等,也包含添加洞、做省、加纽扣、拉链、明线等。​--本篇导航--板片绘制、编辑 缝线 省 内部线、打洞、做褶皱 折叠安排、假缝 扣子 拉链 明线操作可以配合这个视频看一下,注意快捷键。基础操作 双…

图解软件开发的八大模型

图解软件开发的八大模型

[rCore学习笔记 027]地址空间

写在前面 本随笔是非常菜的菜鸡写的。如有问题请及时提出。 可以联系:1160712160@qq.com GitHhub:https://github.com/WindDevil (目前啥也没有 引言 兜兜转转又是新的一章的开始,还是首先要看官方手册里的理论介绍和内容. 这里主要还是提纲挈领地摘抄里面的部分内容,在下面…

如何查找 18 个月之前的 Apple 订单 All In One

如何查找 18 个月之前的 Apple 订单 All In One 为什么 Apple Store 不支持查找 18 个月之前的订单?如何查找 18 个月之前的 Apple 订单 All In One为什么 Apple Store 不支持查找 18 个月之前的订单?errorssolutionsemail history ✅demos(🐞 反爬虫测试!打击盗版⚠️)…

编程日记 更改redis存储默认序列化器

编程日记 更改redis存储默认序列化器 package com.haole.usercenter.service;import com.haole.usercenter.model.domain.User; import jakarta.annotation.Resource; import org.junit.jupiter.api.Assertions; import org.junit.jupiter.api.Test; import org.springframewor…