0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

aligners在Arm架构AWS Graviton3上的性能

jf_9aVl32Dp 来源:Arm软件开发者 作者:Arm软件开发者 2022-10-10 10:48 次阅读

基因组学已经彻底改变了公共卫生,并继续为我们所有人带来好处。为了实现其众多成果,需要在云计算、on-prem数据中心、研究中心、医院和更广泛的生命科学行业中进行大量且不断增长的计算投入。

Reference-guided assembly是该领域许多工作流中的一个重要阶段。对于一个典型的患者,拭子会导致样本在测序机中测序。这台机器的输出是千兆字节的片段(A、C、G和T DNA碱基的子串)。这些读数与来自(标准)参考个体的完整人类基因组“对齐”,以确定读数“适合”的位置,并组成患者基因组的大部分。

完成reference-guided assembly的三个最著名的应用程序是BWA(https://github.com/lh3/bwa)、BWA-mem2(https://github.com/bwa-mem2/bwa-mem2)和minimap2(https://github.com/lh3/minimap2)。由于应用如此广泛,这些应用程序的价格和性能对行业至关重要。

在之前的博客(优化Arm服务器的BWA aligner:https://community.arm.com/arm-community-blogs/b/high-performance-computing-blog/posts/optimizing-genomics-and-the-bwa-aligner-for-arm-servers)中,我们展示了如何在AWS Graviton2上运行BWA及其性能,以对比2021早期流行的x86_64服务器。

在本博客中,我们现在可以展示三种主要aligners在Arm架构AWS Graviton3上的性能。AWS Gravaton3是AWS 服务器系列中最新的基于Arm的服务器,也是AWS Gratiton2的后续型号。

我们证明,与AWS Graviton2相比,AWS Gravaton3的性能提高了12%到31%。与目前最好的x86_64系统相比,Graviton3的绩效提高了10%和23%。与同类x86_64系统相比,此结果可节省20-30%的成本。

应用程序和测试用例

我们使用1000 Genomes项目中的human_g1k_v37引用和NIST档案中的NA12878引用。这些测试用例都反映在AWS S3上,并使用以下方法获取:

aws s3 cp –no-sign-request s3://1000genomes/technical/reference/human_g1k_v37.fasta.gz .


aws s3 cp –no-sign-request s3://giab/data/NA12878/Garvan_NA12878_HG001_HiSeq_Exome/NIST7035_TAAGGCGA_L001_R1_001.fastq.gz .

在每种测试案例下,我们都使用gcc-10编译器进行平台比较。这些测试用例中的每一个都可以通过普通的构建脚本在Arm上轻松构建,要么在主存储库中,要么在等待合并的公共分支中。

https://github.com/lh3/bwa


https://github.com/dslarm/bwa-mem2


https://github.com/dslarm/minimap2

这些应用程序都是多线程的,具有可配置数量的工作线程。我们使用32个工作线程演示了8xlarge实例上的基准测试,这些实例有32个vCPU

在运行时,我们使用Cloudflare zlib包替换系统zlib,这有助于aligners 更快地解压缩输入数据文件。在进一步的优化中,对于bwa,我们预加载了jemalloc库,这对于多线程代码中的标准内存分配函数来说更加有效。

我们的Github上提供了每个应用程序的构建脚本和获取数据集的脚本,网址是https://github.com/arm-hpc/genomics-blog

AWS Graviton2到AWS Graviton3 --能力的飞跃

AWS Graviton3使用Arm Neoverse V1内核,相比之下,AWS Gravaton2使用Arm Nioverse N1内核。

799babaa-47ae-11ed-a3b6-dac502259ad0.jpg

79c6436a-47ae-11ed-a3b6-dac502259ad0.jpg

Neoverse V1带来了显著的变化,尤其是它的内核更宽了许多,能够在每个周期执行更多指令,比其前一代处理器能提升更多指令级并行性。

使用perf-stat,我们可以获取两个平台的每周期指令数(IPC)。

79f4d482-47ae-11ed-a3b6-dac502259ad0.jpg

可以看出,IPC的改进在每个应用程序中都有所不同,minimap2 最多可在每个周期多增加26%的指令。此结果适用于整个工作负载,还包括I/O所花费的时间。

AWS Graviton3也是AWS系列中的第一个DDR5系统,其DDR带宽比其前一代处理器多50%。

此外,AWS Graviton3的执行频率为2.6GHz,而Graviton2为2.5GHz。

较高的IPC和频率的综合影响直接转化为运行时效率,我们将在下面进一步讨论。

哪种体系结构提供了最高的性能和最低的成本?

7a1ea28a-47ae-11ed-a3b6-dac502259ad0.jpg

与上一代AWS Graviton2(c6g.8xlarge)相比,性能提高了12%至31%。

同时,AWS Graviton3的性能也比Intel Icelake(c6i.8xlarge)高出10%至23%,比AMD Milan(c6a.8xlage)高出11%至21%。

7a4f4c32-47ae-11ed-a3b6-dac502259ad0.jpg

总结

AWS Graviton3为所有三个基因组学应用程序提供了性价比最高的平台。在AMD Milan上运行相同的应用,每个样本集的成本高出27%,在Intel Ice Lake上高出45%。这一结果意味着AWS Graviton3比AMD Milan节省了20%,比Intel Ice Lake节省了30%。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9184

    浏览量

    369734
  • 云计算
    +关注

    关注

    39

    文章

    7856

    浏览量

    138030
  • 数据中心
    +关注

    关注

    16

    文章

    4876

    浏览量

    72464

原文标题:使用Arm服务器减少基因组学的时间和成本

文章出处:【微信号:Arm软件开发者,微信公众号:Arm软件开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    强悍的AWS Graviton4处理器及其背后的Arm Neoverse

    电子发烧友网报道(文/吴子鹏)今年的亚马逊re:Invent 2024大会上,该公司正式对外发布了旗下第四代自研Arm芯片——Graviton4。作为目前最强大的Graviton处理
    的头像 发表于 12-19 00:04 1706次阅读

    ARM Neoverse IP的AWS实例etcd分布式键对值存储性能提升

    是在给定时间段内完成的总操作数。本文中,我们比较了AWS M6g实例(基于 Arm Neoverse IP的 Graviton2)与M5实例(基于 Xeon Platinum 800
    发表于 07-06 17:37

    Arm Neoverse V1的AWS Graviton3深度学习推理工作负载方面的作用

    ) 与 AWS Graviton2 (c6g) 的性能特点AWS Graviton3 (c7g) 引入了
    发表于 08-31 15:03

    AWS云中使用Arm处理器设计Arm处理器

    1、AWS云中使用Arm处理器设计Arm处理器  Amazon Web Services (AWS) 宣布推出基于
    发表于 09-02 15:55

    比较AWS M6g实例与M5实例的etcd吞吐量和延迟性能

    M6g实例(基于 Arm Neoverse IP的 Graviton2)与M5实例(基于 Xeon Platinum 8000系列)的etcd吞吐量和延迟,以展示Graviton2
    发表于 09-13 15:06

    讨论使用TerraformAWS上部署Arm EC2实例

    概括Arm A1 实例可以为您的工作负载节省大量资金。如果您已经熟悉如何将 Terraform 与 A​​WS 结合使用,并且您的软件与架构无关,那么您的工作负载可以轻松部署 A1 实例
    发表于 09-16 14:53

    使用Arm服务器减少基因组学的时间和成本

    1、使用Arm服务器减少基因组学的时间和成本  我们现在可以展示三种主要alignersArm架构AW
    发表于 10-09 16:32

    基于亚马逊自研的 Arm 处理器 Graviton2

    据悉,AWS C6g 所用的 Graviton2 处理器是亚马逊第二代自研 Arm 芯片。对于高性能计算领域,x86 架构处理器虽然
    发表于 08-10 14:30 884次阅读

    Arm将利用AWS为其云计算使用

    近日,AWS宣布,Arm将利用AWS为其云计算使用,包括绝大部分电子设计自动化(EDA)工作负载。Arm正在利用基于AWS
    的头像 发表于 12-11 09:38 1856次阅读

    AWS Arm 架构处理器首次落地中国区域:比同配置 X86 实例性价比提高 40%

    中国区域。Graviton 2 作为 AWS 的第二代基于 Arm 架构的处理器,基于 64 位 Arm Neoverse N1 微
    的头像 发表于 01-28 16:22 2542次阅读

    AWS基于Arm架构Graviton 2处理器落地中国

    Graviton 2处理器提供支持的Amazon Elastic Compute Cloud(Amazon EC2)M6g、C6g和R6g实例已在由光环新网运营的AWS中国(北京)地区和由西云数据运营
    的头像 发表于 02-01 11:46 3156次阅读

    专用处理能力驱动基于Arm架构的云计算时代并支持AWS Graviton不断创新

    AWS也同时展示了基于Graviton3处理器的C7g云实例,现已开放预览。C7g是由Arm® Neoverse™驱动、首个支持DDR5的云实例,可提供更多的内存带宽,带来更高的性能
    发表于 12-06 16:25 1091次阅读
    专用处理能力驱动基于<b class='flag-5'>Arm</b><b class='flag-5'>架构</b>的云计算时代并支持<b class='flag-5'>AWS</b> <b class='flag-5'>Graviton</b>不断创新

    AWS Graviton处理器为嵌入式Linux开发人员扩展选择

    Docker Desktop和QEMU可用于x86机器构建和运行针对ARM架构的Linux应用程序,但开发人员体验与
    发表于 01-26 17:58 1次下载
    <b class='flag-5'>AWS</b> <b class='flag-5'>Graviton</b>处理器为嵌入式Linux开发人员扩展选择

    Arm Neoverse CSS V3 助力云计算实现 TCO 优化的机密计算

    (HPC) 和人工智能 (AI) 领域。亚马逊云科技 (AWS) re:Invent 2023 宣布推出 AWS Graviton4
    发表于 03-26 16:37 422次阅读
    <b class='flag-5'>Arm</b> Neoverse CSS V<b class='flag-5'>3</b> 助力云计算实现 TCO 优化的机密计算

    ArmAWS合作深化,AWS Graviton4展现显著进展

    Arm与亚马逊云科技(AWS)的长期合作关系,一直致力于为云计算领域带来性能更强劲、更高效和可持续的解决方案。双方通过专用芯片和计算技术的结合,不断推动云计算的发展。 近期举行的
    的头像 发表于 12-18 14:17 280次阅读