【LAMMPS学习】七、加速性能(3)通用技巧

7. 加速性能

7.1.基准测试

7.2.测试性能

7.3.通用技巧

以下是提高模拟性能的通用技巧。它们中的大多数只适用于当前性能中的某些模型和某些瓶颈,因此让您生成的计时数据作为指导。要预测这些选项会产生多大的差异,即使不是不可能,也是很难的,因为这是问题大小、所使用的处理器数量和您的机器的函数。识别性能瓶颈并尝试各种选项是无可替代的。

  • rRESPA

  • Two-FFT PPPM

  • Staggered PPPM

  • single vs double PPPM

  • partial charge PPPM

  • verlet/split run style

  • processor command for proc layout and numa layout

  • load-balancing: balance and fix balance

Two-FFT PPPM,也称为分析微分或 ad PPPM,使用 2 个 FFT,而不是默认 ik 微分 PPPM 使用的 4 个 FFT。然而,2-FFT PPPM 还需要稍大的网格尺寸才能达到与 4-FFT PPPM 相同的精度。对于 FFT 成本成为性能瓶颈的问题(通常是在许多处理器上运行的大问题),2-FFT PPPM 可能比 4-FFT PPPM 更快。

Staggered PPPM 使用两种不同的网格执行计算,其中一个网格相对于另一个网格略有移动。这可以减少力混叠误差并提高方法的准确性,但也会使所需的工作量加倍。为了获得较高的相对精度,与常规 PPPM 相比,使用Staggered PPPM可以在每个维度上实现一到一半的网格大小,这可以在 kspace 时间中提供大约 4 倍的加速。然而,对于相对精度较低的情况,使用Staggered PPPM 几乎没有什么好处,并且 kspace 时间可能会慢 2 倍。例如,视紫红质基准测试在单个处理器上运行,不同方法的 kspace 时间与相对精度的结果如下图所示。对于该系统,当使用略大于 1e-5 及以上的相对精度时,Staggered PPPM(使用 ik 微分)变得有用。

注:使用Staggered PPPM 可能无法像力那样提高能量和压力的准确性,因此如果能量和/或压力是感兴趣的量(例如使用恒压器时),则必须小心谨慎。

7.4.加速器包

7.5.加速器包比较

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/588426.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

谷歌推出多模态视频模型,自动生成丰富动作视频

谷歌的研究人员推出了一款多模态扩散模型——VLOGGER。 用户只需要向VLOGGER输入图像、语音,就能生成带语音、丰富动作的人物视频。VLOGGER基于扩散模型开发而成,并提出了一种全新的架构,将文本生成图像模型与空间、时间控制相结合&#xff…

LangChain-04 RAG Retrieval-Augmented Generation 检索增强生成

内容简介 LangChain 中的 “RAG” 指的是 “Retrieval-Augmented Generation”,即检索增强生成。它是一种结合了检索(从大量数据中检索相关信息)和生成(基于检索到的信息生成文本)的技术,旨在改善和增强自…

TiDB单机版安装和连接访问

TiDB单机版安装和连接访问 1、下载 $wget http://download.pingcap.org/tidb-latest-linux-amd64.tar.gz 2、解压缩 $tar -zxvf tidb-latest-linux-amd64.tar.gz 3、启动TiDB 启动PD $./bin/pd-server --data-dirpd --log-filepd.log 启动tikv $./bin/tikv-server --pd…

MySQL 进阶-----索引使用规则

目录 前言 一、验证索引效率 二、最左前缀法则 三、范围查询 四、索引失效情况 1.索引列运算 2.字符串不加引号 3 .模糊查询 4.or连接条件 5 .数据分布影响 前言 本期我们学习MySQL索引的使用方法,在讲解索引的使用原则之前,先通过一个简单的…

Celery的任务流

Celery的任务流 在之前调用任务的时候只是使用delay()和apply_async()方法。但是有时我们并不想简单的执行单个异步任务,比如说需要将某个异步任务的结果作为另一个异步任务的参数或者需要将多个异步任务并行执行,返回一组返回值,为了实现此…

ubuntu16如何使用高版本cmake

1.引言 最近在尝试ubuntu16.04下编译开源项目vsome,发现使用apt命令默认安装cmake的的版本太低。如下 最终得知,ubuntu16默认安装确实只能到3.5.1。解决办法只能是源码安装更高版本。 2.源码下载3.20 //定位到opt目录 cd /opt 下载 wget https://cmak…

C++ | Leetcode C++题解之第7题整数反转

题目&#xff1a; 题解&#xff1a; class Solution { public:int reverse(int x) {int rev 0;while (x ! 0) {if (rev < INT_MIN / 10 || rev > INT_MAX / 10) {return 0;}int digit x % 10;x / 10;rev rev * 10 digit;}return rev;} };

【Django开发】前后端分离美多商城项目第5篇:用户部分,起源【附代码文档】

美多商城项目4.0文档完整教程&#xff08;附代码资料&#xff09;主要内容讲述&#xff1a;美多商城&#xff0c;项目准备1.B2B--企业对企业,2.C2C--个人对个人,3.B2C--企业对个人,4.C2B--个人对企业,5.O2O--线上到线下,6.F2C--工厂到个人。项目准备&#xff0c;配置1. 修改set…

网络安全 | 什么是DDoS攻击?

关注WX&#xff1a;CodingTechWork DDoS-介绍 DoS&#xff1a;Denial of Service&#xff0c;拒绝服务。DDoS是通过大规模的网络流量使得正常流量不能访问受害者目标&#xff0c;是一种压垮性的网络攻击&#xff0c;而不是一种入侵手段。NTP网络时间协议&#xff0c;设备需要…

天盾网络验证源码+视频教程

最新版本为746&#xff0c;企业定制版。现在正在意义上的离线版已出来&#xff0c; 天盾746离线版不需要绑定电脑&#xff0c;提供母端&#xff0c;断网可用&#xff0c;可以理解为它是一款离线版的工具。它没有任何使用限制&#xff0c;和正版唯一的区别就是不需要连接作者服…

管理科学笔记

1.线性规划 画出区域&#xff0c;代入点计算最大最小值 2.最小生成树 a.断线法&#xff0c;从大的开始断 b.选择法&#xff0c;从小的开始选 3.匈牙利法 维度数量直线覆盖所有的0 4.一直选最当前路线最短路径 5.线性规划 6.决策论

蓝牙耳机怎么连接电脑?轻松连接就靠这3个方法!

“新买了个蓝牙耳机&#xff0c;但是不知道应该怎么样才能连接上电脑&#xff0c;大家有什么方法可以将蓝牙耳机快速连接上电脑吗&#xff1f;” 随着科技的不断发展&#xff0c;蓝牙耳机已经成为我们日常生活中不可或缺的一部分。它们不仅方便我们随时随地享受音乐、接听电话&…