当前位置: 首页 > news >正文

论坛备案网站名称建立淘宝客网站

论坛备案网站名称,建立淘宝客网站,绵阳的网站建设公司,网业上有错误怎么解决7. 加速性能 7.1.基准测试 7.2.测试性能 7.3.通用技巧 7.4.加速器包 7.5.加速器包比较 接下来将比较和对比各种加速器选项#xff0c;因为有多种方法可以执行 OpenMP 线程、在 GPU 上运行、优化 CPU 上的向量单元以及在英特尔至强融核#xff08;协#xff09;处理器上…7. 加速性能 7.1.基准测试 7.2.测试性能 7.3.通用技巧 7.4.加速器包 7.5.加速器包比较 接下来将比较和对比各种加速器选项因为有多种方法可以执行 OpenMP 线程、在 GPU 上运行、优化 CPU 上的向量单元以及在英特尔至强融核协处理器上运行。 所有这些包都可以利用硬件功能加速 LAMMPS 计算但它们以不同的方式实现并且并不总是保证加速。 因此对于特定硬件上的特定模拟一个包可能比另一个包更快。我们在下面给出了一些指导原则但确定哪个包对于您的输入脚本来说更快的最佳方法是在您的计算机上尝试多个包并尝试可用的性能调整设置。请参阅下面的基准测试部分了解已完成此操作的示例。 最佳使用每个包的指南 GPU 和 KOKKOS 包都允许您将多个 MPI 级别 CPU 核心分配给同一 GPU。对于 GPU 包这可以通过更好地利用 GPU通过重叠计算和数据传输以及通过 MPI 并行化更有效地计算 LAMMPS 的非 GPU 加速部分来实现加速因为所有系统数据都会得到维护和更新在主机上。对于 KOKKOS 来说由于其不同的内存管理模型试图将数据保留在 GPU 上因此几乎没有任何好处。GPU 包在每个时间步在 CPU 和 GPU 之间移动每个原子数据坐标、力和可选邻居列表数据如果不是在 GPU 上计算的话。 KOKKOS/CUDA 包仅在需要 CPU 计算时在时间步上执行此操作例如调用非 GPU 化的修复或计算。因此如果您可以将输入脚本制定为仅使用 GPU 化的修复和计算并避免过于频繁地执行 I/O热输出、转储文件快照、重新启动文件那么 KOKKOS/CUDA 包的数据传输成本可以非常低导致它比 GPU 包运行得更快。当每个 GPU 的原子数量较小时GPU 包通常比 KOKKOS/CUDA 包更快。就原子/GPU 而言KOKKOS/CUDA 包变得更快的交叉点很大程度上取决于配对类型。例如对于简单的 Lennard Jones 系统交叉单精度通常约为每个 GPU 50K-100K 原子。执行双精度计算时交叉点可能会小得多。KOKKOS 和 GPU 包都计算 CPU 上的键合相互作用键合、角度等。如果 GPU 包运行时将多个 MPI 进程分配给一个 GPU则计算绑定交互的成本会分摊到更多 CPU 上因此 GPU 包在这些情况下可以运行得更快。当使用分配给同一 GPU 的多个 MPI 等级的 LAMMPS 时其性能在某种程度上取决于 CPU 和 GPU 之间的可用带宽。根据可用的总线技术、主机 CPU 和主板的功能、总线的接线以及是否使用交换机来增加可用总线插槽的数量或者 GPU 是否安装在外部外壳中这可能会有很大差异。这可能会变得相当复杂。为了通过 GPU 实现显着加速KOKKOS 和 GPU 包都需要具有快速设备内存和高效数据传输速率的强大 GPU。这需要有能力的中高级到高端桌面GPU。使用性能较低的 GPU例如在笔记本电脑上可能会导致速度减慢。对于 GPU 包特别是与 MPI 并行运行时如果从 GPU 加速中排除 PPPM kspace 样式并在 CPU 上运行与 GPU 加速对样式同时运行通常会更有效。这通常可以通过在 kspace_style pppm 命令之前放置一个 suffix off 命令并在 kspace_style pppm 命令之后放置一个 suffix on 命令来轻松实现。KOKKOS/OpenMP 和 OPENMP 包具有不同的线程管理策略这应该会导致 OPENMP 对于少量线程来说更加高效并且随着每个 MPI 等级的线程数增加开销也会增加。在这种情况下KOKKOS/OpenMP 内核的开销较小但线程较少时性能较低。INTEL 软件包包含许多用于在 Intel 硬件CPU 和加速卡上实现额外性能的选项和设置但要释放这种潜力需要 Intel 编译器。包代码将使用 GNU gcc 编译但效率不高。 GPU 和 KOKKOS 包之间的差异 GPU 包仅加速对力、邻居列表和部分PPPM 计算。 KOKKOS 包尝试在 GPU 上运行大部分计算但可以透明地支持非加速代码由于主机和 GPU 之间存在数据传输而导致性能损失。当使用排除列表或三斜模拟框时GPU 包需要在 CPU 上构建邻居列表。GPU 包可以针对 CUDA 或 OpenCL 进行编译因此可以很好地支持 NVIDIA 和 AMD GPU。在 NVIDIA 硬件上使用 CUDA 通常会获得与 OpenCL 相同或更好的性能。GPU 包中的 OpenCL 理论上也支持 Intel CPU 或 Intel Xeon Phi但对 KOKKOS或 INTEL中的原生支持更为出色。
http://www.pierceye.com/news/167604/

相关文章:

  • 来宾网站制作公司网站提交至google
  • 唐山网站建设怎么样专业的个人网站建设哪家
  • 成品网站w灬源码在线看重庆网站制作设计
  • 有没有在家做的兼职网站网站模板如何删除
  • 建站公司用的开源框架家纺网站模板
  • 做情网站甘肃省城乡城乡建设厅网站
  • 开发一个网站做公司内部用一个网站能用asp c
  • 设计师服务平台鱼巴士有哪些网站阜宁网站设计
  • 企业网站开发所需要的模块郴州网警
  • 案例网站网页设计实训报告结束语
  • 重庆网上房地产网站龙岩属于哪里
  • 高水平的番禺网站建设在天猫开店需要什么条件与费用
  • 给网站加个地图的代码wordpress 视频预览
  • 邯郸去哪做网站改版短网址生成器在线
  • 广州手机模板建站互联网公司薪资待遇
  • 网站建设的作用有哪些方面wordpress 首页描述
  • 汕头龙湖网站建设做网站用什么团建
  • 网站建站的技术解决方案高唐网站开发
  • dz网站收款即时到账怎么做的礼县建设局网站
  • 专业做轮胎的网站女同wordpress
  • 宁波公司网站首页优化商城网站前期seo应该怎么做
  • ui设计网站用red5做直播网站
  • 网站开发问题论文王老吉网站建设水平优点
  • 平安银行官方网站制作网站步骤
  • 做个网站好还是做淘宝好宁波网站制作好公司
  • 开发网站需要怎么做嘉兴快速建站合作
  • 阿里云建站后台建站网站降权怎么恢复
  • 天津河西做网站公司怎么设置网站的关键字
  • 做网站会提供源代码吗朝阳网站制作设计
  • 企业做网站找谁有什么建筑网站