0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

多种HPC应用中进行对比的基准

M8kW_icbank 2017-12-21 13:50 次阅读

一年一度的国际超级计算大会(SupercomputingConference,以下简称SC)上,每次都有一个非官方的主题出现。过去两年的焦点是机器学习(Machine learning)和深度学习(Deep learning),而在之前则是大规模数据密集计算,以及利用云重塑超级计算未来发展方向的潜力。

所有这些主题都有一个共同点,那就是:它们的重点都不是CPU处理器。实际上,它们都是围绕X86架构下的CPU性能提升或生态系统发展的相关话题。回想一下,近年来我们最后一次看到硬件设备成为大会的核心主题,还是在第一批大规模GPU超级计算机进入500强榜单时,然而它们只是加速器而不是设备的核心。

在今年的SC17上,核心处理器再次成为了非官方主题。基于ARM架构的硬件和软件生态系统进行了广泛的演示,Cray等超级计算公司还展示了全面的系统集成效果,很多基准测试的结果足以与英特尔的最先进产品相抗衡。

基于ARM处理器的“Isambard”超级计算机将包含10,000个内核(采用Cavium的ThunderX2 ARM处理器),将于明年在英国布里斯托大学面世,负责开发该超级计算机的团队一直致力于基于ARM的HPC系统的研究和开发工作。我们现在看到,在基于大量开发工作铺垫的ARM系统中,最著名的当属巴塞罗那超级计算中心的Mont Blanc(几年前开始采用双Cortex-A15 ARM,现在基于Cavium ThunderX2 ARM处理器)。

McIntosh-Smith和他的团队日前公布了一些很有意义的基准测试结果。这次基准测试采用了Cray 8节点设备集群和32核ThunderX2 ARM处理器,并与英特尔Skylake和Broadwell解决方案进行了对比。下面列出了在多种HPC应用中进行对比的基准 -

多种HPC应用中进行对比的基准

多种HPC应用中进行对比的基准

McIntosh-Smith表示,总体而言,以内存带宽密集型的任何应用都能够在ThunderX2上很好地运行,性能显著优于 Skylake。然而对于偏向浮点密集型的应用来说,因为Skylake使用了更宽的向量运算器所以会更胜一筹,但是ThunderX2 能与Broadwell平台旗鼓相当。如果继续增加高带宽内存,测试结果会怎么样?这将会非常有趣。

基准测试结果请参见下图:

多种HPC应用中进行对比的基准

内存带宽密集型的优势在OpenFOAM上的HPC应用中体现得最为明显——OpenFOAM是一种开源CFD应用,通常更多地用于商业和科研领域的高性能计算。上图的基准测试报告显示,ThunderX2的OpenFOAM测试结果要好于Skylake 和 Broadwell 。

多种HPC应用中进行对比的基准

天气和气候模拟代码也显示内存带宽密集型应用的性能会有同样的提高。上图显示了在ThunderX2上测试英国气象局(Met Office)的生产代码的情况——Nemo是一种海洋模拟代码。

“初步的结果显示,对于GROMACS、CP2K和VASP等计算密集型的应用,不同处理器之间的性能差距很小。而内存带宽密集型的应用则可以显著看出不同处理器之间的差异。这是因为,尽管这些代码可受益于X86处理器的更广泛向量单位,但ThunderX2可以借助更多内核和更高的时钟速度来进行补偿,“McIntosh-Smith说。

随着高端Cray XC50系统的面世,我们将在下一届超级计算大会上看到基于ARM处理器的实际生产环境中的超级计算机的更多测试结果。

Isambard项目架构请参见下图:

多种HPC应用中进行对比的基准

直到今天,很多HPC ARM观察家都知道Isambard是Cray的机型;但如果他们知道这家超级计算机生产商选择了一条更加艰难的道路,将ThunderX2 ARM处理器与业内著名的Aries互联芯片相集成,并可以运行全套Cray软件的话,很多人肯定会大吃一惊。相比较而言,如果把ThunderX2添加到CS Storm系列,而不是基于Aries的产品系列中,对Cray来说将简单得多。但在McIntosh-Smith看来,这恰恰彰显了Cray将ARM广泛用于HPC领域的坚定决心。

McIntosh-Smith认为,将来不同的ARM选项可能会采用同一种专用的部署方法。“将来,基于ARM的HPC将增强向量功能,达到与其他CPU厂商不相上下的水平。下一代ARM产品将具有和任何其他厂商产品相当的向量宽度。”

有趣的一点是这些结果基于单纯优化内核数量和基本条件后的编译结果,只进行了几个小时的微调。McIntosh-Smith表示,这些今天实现的突飞猛进,实际上是多年来在基于ARM的HPC系统上坚持不懈的努力结果。在硬件就绪后,ARM在HPC应用中所需的软件也会更快到位,随着面向超级计算机的ARM处理器的正式上市,整个行业将迎来架构改造的新纪元,ARM架构将在HPC领域揭开广泛处理器选择的新篇章。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • HPC
    HPC
    +关注

    关注

    0

    文章

    309

    浏览量

    23657

原文标题:HPC将迎来处理器变革新时代

文章出处:【微信号:icbank,微信公众号:icbank】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基准点识别简述

      用来进行基准点识别的方法根据基准点的形状而彼此独立。最小的基准点尺寸由向量点的尺寸决定,向量点可以画和计算到基准点边缘。不论什么形状的
    发表于 09-03 10:46

    Bricked Curiosity HPC无法进行编程

    嗨,所有,得到一个好奇的HPC的盒子,可以读取固件(1.41),并试图通过MPLAB 4.15更新到最新的PKOB固件(1.51),它失败了。无法进行编程。好奇号HPC是否有应急引导加载程序恢复
    发表于 10-16 15:32

    HPC-95PH

    ` HPC-95PHHPC-95PH长期代理韩国HITROL液位开关吴经理:132.4667.5433 / 0755-26998458工作Q:1139878854 地址:深圳市南山区南海大道4050
    发表于 12-19 09:45

    HITROL HPC-95P

    ` 代理韩国HITROL液位传感器,控制器吴经理:0755-26998458/132.4667.5433 工作QQ:1139878854HCC(HPC)-95P系列是一款电容式液/料位开关,它通过
    发表于 12-19 09:47

    HITROL电容液位计 HPC-95PH

    `HITROL电容液位计 HPC-95PHHITROL电容液位计 HPC-95PHHITROL液位开关 中国总代电话:132.4667.5433/0755-26998458联系人:吴经理 工作Q
    发表于 12-19 11:17

    HPC-100CT-2液位计

    HPC-100CT-2液位计 HPC-100CT-2液位计详询请致电: ***吴经理工作Q:1139878854 地址:深圳市南山区科技园南海大道4050号 HITROL公司运用专利的热扩散技术,为
    发表于 01-15 17:57

    如何在FL Studio中进行侧链?

    使用果味限制器在FL Studio中进行侧链压缩的方法
    发表于 11-04 09:28

    使用UMC 28HPC工艺进行MC仿真有什么问题吗?

    最近在使用UMC 28HPC工艺进行MC仿真,发现两个问题:1. MC仿真结果的std(标准差)和实测结果不match,实测结果大概为仿真结果的3倍。查看了一下U28HPC的model file
    发表于 06-25 06:40

    如何在android中进行驱动呢

    如何在android中进行驱动呢?并输出dev和sys中的界面用程序调用呢?
    发表于 03-02 09:53

    多ADC系统的基准电压设计

    本文讨论了针对超声成像系统空间受限特点定制的两个成功应用的基准电路,这两个方案均采用一个基准源为多个模/数转换器(ADC)供电。最后,对这两个电路进行了测试,测试结果将在后续的应用笔记中进行
    发表于 01-27 14:37 3577次阅读
    多ADC系统的<b class='flag-5'>基准</b>电压设计

    在Protel DXP中进行FPGA设计和仿真

    在Protel DXP中进行FPGA设计和仿真
    发表于 12-25 10:09 0次下载

    在SDAccel中进行调试

    在SDAccel中进行调试
    的头像 发表于 11-29 06:20 1866次阅读

    uboot中进行LCD初始化的流程免费下载

    本文档的主要内容详细介绍的是uboot中进行LCD初始化的流程免费下载。
    发表于 08-12 08:00 11次下载
    uboot<b class='flag-5'>中进行</b>LCD初始化的流程免费下载

    如何对推理加速器进行基准测试

      客户对基准推理学习曲线的最后阶段是开发自己的模型,使用通常来自 Nvidia 或数据中心的训练硬件/软件,然后在可能的目标推理加速器上对该模型进行基准测试。
    的头像 发表于 06-06 16:02 1267次阅读

    如何高效管理MCU内存? 多种分配算法对比

    如何高效管理MCU内存? 多种分配算法对比
    的头像 发表于 10-17 18:21 1165次阅读
    如何高效管理MCU内存? <b class='flag-5'>多种</b>分配算法<b class='flag-5'>对比</b>?