0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【百万倍加速】加速计算助力基因测序突破极限

NVIDIA英伟达 来源:未知 2023-02-02 11:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们将通过《NVIDIA 加速计算,百万倍加速行业应用》系列文章,为您详解 NVIDIA 如何通过数据中心规模的全栈加速计算,助力多个行业实现百万倍计算性能飞跃,高效解决人类挑战。

490f2834-a2aa-11ed-bfe3-dac502259ad0.jpg

自从生命的“密码”—基因组被科学家破解以来,人类追求速度更快、成本更低的基因测序技术的脚步一直都在继续。

在 1 月 13 日刚刚结束的摩根大通医疗健康大会上,NVIDIA 发布了与初创公司 InstaDeep、慕尼黑工业大学(TUM)在基因组学大型语言模型方面的联合研究成果。研究团队使用NVIDIA 超级计算机 Cambridge-1,在各种基因组数据集上,训练了参数规模从 500M 到 2.5B 不等的各种大型语言模型(LLM),经过基因组学训练的大型语言模型可将应用扩展到大量基因组学任务, 这些任务有助于了解 DNA 如何转录生成 RNA 和蛋白质,从而开启新的临床应用。

基因测序 梦想照进现实

作为人类医疗技术发展的重要一步,基因测序可通过提取人体血液或唾液,对人类的 DNA、RNA、蛋白质及代谢物进行分析,从而锁定个人病变基因,以诊断、预测或预防遗传性疾病的发生。基因蕴含了人类诸多病症的秘密,使人类有机会尽早预防疾病,并多元化治疗疾病。

2001 年,被誉为生命科学“登月计划”的“人类基因组计划”(HGP)历时 13 年,耗资近 30 亿美元,发布了首张人类基因组草图。此后二十年中,以数字生物学为基础的基因组测序技术取得巨大进步,将全基因组测序的成本逐步降低至不到 1000 美元。一时间,全球对基因测序与分析的需求量出现暴涨。

加速计算突破基因分析算力瓶颈

随着基因组测序和分析需求的激增,由此产生的数据也迎来爆发式增长。过去十年间,基因测序的数据量平均每七个月就会翻一倍,2025 年全球测序能力预计将达到 Zb 级别,其中,仅人类全基因组存储的数据量就将达到每年 2-40 Eb。

要实现精准医疗,就需要对大量基因数据做出精确的计算和分析,这意味着巨大的计算成本和时间。因此,必须有创新的技术,打破全基因组测序数据医疗应用的主要瓶颈,推动行业进一步向前发展。

基因组测序与分析属于标准的计算密集型任务,而 GPU 擅长并行计算,可以将复杂计算问题分解为很多小任务,在多个 CUDA 内核上同时运行,从而大幅减少处理计算任务的时间,让基因组测序分析的速度获得大幅提升。NVIDIA 以 GPU 为核心构建出“全栈加速计算平台”,与人工智能相结合,在全球包括基因测序在内的多个领域掀起一场加速革命。

除了具有全球领先的硬件加速计算平台,NVIDIA 还推出了基于 GPU 的基因测序分析加速软件—NVIDIA Clara Parabricks。Clara Parabricks 是一款 GPU 加速的计算基因组学工具包,可提供多种生物信息学工具和功能,如序列比对、预处理和质量指标、变异检测、UMI 以及用于胚系、体细胞和 RNA 分析的端到端工作流程。与仅使用 CPU 的解决方案相比,Parabricks 速度提升高达 80 倍,计算成本降低高达 50%。借助 Clara Parabricks 和 GPU,将深度学习的强大功能应用到基因组分析,可为测序中心、临床团队、基因组学研究人员以及新一代测序仪器开发者提供快速准确的分析,进而助力更快速、更准确的基因组学分析。

此外,为了更好地帮助科学家了解疾病,为患者找到治疗方法,NVIDIA 还推出了BioNeMo 框架,用于训练和部署超算规模的大型生物分子语言模型。该大型语言模型框架可支持化学、蛋白质、DNA 和 RNA 数据格式,还可提供云 API 服务,用于未来支持越来越多的预训练 AI 模型。

基因测序领域降本增效创造新记录

在 NVIDIA 加速计算平台、人工智能与基因测序专业软件的赋能下,来自全球的学研机构、政府组织以及相关企业,正在不断突破基因测序与分析领域的速度与成本极限,创造出一项项新的记录:

  • 斯坦福大学、NVIDIA、牛津纳米孔科技公司、谷歌、贝勒医学院和加州大学圣克鲁兹分校的研究人员共同合作推出 DNA 测序技术,实现了创纪录的测序速度。该方案使用 NVIDIA Clara Parabricks 计算基因组学应用框架,以及 GPU 加速版本的 PEPPER-Margin-DeepVariant 流程,在谷歌云上使用 NVIDIA GPU 加速碱基判定和变体识别,将基因诊断时间从数周缩短到 5.2 小时,使医生能够快速判断如何治疗危重病人。

  • 麻省理工学院与哈佛大学旗下的博德研究所与 NVIDIA 合作,为拥有超过 2.5 万用户的 Terra 云平台提供快速分析海量医疗数据所需的 AI 能力和加速工具。通过 GPU 加速的 NVIDIA Clara Parabricks 工作流,可助力从事各种基因组数据分析的研究人员降本增效。在博德研究所的 GATK 最佳实践—生殖细胞突变检测分析流中,Parabricks 在 GPU 上进行分析的速度提高了 24 倍,而成本减半

  • 阿里云与 NVIDIA 达成合作,成为国内首家在基因分析平台集成和部署 NVIDIA Clara Parabricks 的公有云厂商。Clara Parabricks 为阿里云基因分析平台的行业标准基因组分析工具包以及基因调用器等工具带来了 GPU 加速,据测算用户可以在 30 分钟内完成一个 30x 测序深度的全基因组分析,且与 GATK 的最佳实践结果 99.99% 一致,而在过去基于 CPU 环境中这项工作需要 20 多个小时才能完成,并且计算成本可降低 40%-80%

  • 普渡大学首席研究员 Carpi 博士和团队将 Clara Parabricks 的表现和疟疾学界使用的鉴定变体和跟踪疟疾传播的现有方法进行了对比,并使用 1000 个疟疾基因组监测抗疟药物的耐药性。与只使用 CPU 的传统方式相比,基于 GPU 加速的 Clara Parabricks 分析速度提高了 27 倍成本降低了 5 倍,同时准确率达到 99.9%

  • 圣路易斯华盛顿大学的 Tychele Turner 博士与团队使用基于 GPU 加速的 Clara Parabricks 开发出一种快速基因组学工作流,用于在自闭症患者中发现 de novo 变异(DNVs)。通过将三重分析整合到 NVIDIA Clara Parabricks 中,Turner 博士将生成 DNV 初始分析的时间从原来的 800 小时(在 CPU 上进行)缩短至 8.5 小时(在 GPU 上使用只有 4 个 GPU 的服务器),加快了 100 倍

  • 为推广基因组医学计划,泰国国家生物库采用 NVIDIA DGX A100 系统和 NVIDIA Clara Parabricks 来打造 IT 基础设施,以加速基因组测序。加速方案将全基因组测序的数据处理时间缩短了 4 个月,每位用户的处理时间也从 30 多个小时缩短到 1 到 2 小时

  • 生物技术领军企业 Regeneron 高通量测序中心与大规模的生物医学数据库和研究资源平台英国生物样本库合作,在 DNAnexus 平台上使用 NVIDIA Clara Parabricks 运行分析对超过 50 万名生物库参与者的外显子组进行了测序和分析, 5 分钟内完成了在 32-vCPU 机器上需要花费一小时计算的全外显子组分析,同时成本降低约 40%

凭借加速计算领域的全栈能力以及深耕行业所积累的专业知识,NVIDIA 现在已经推出了智能计算平台 NVIDIA Clara,全面布局医疗健康行业。该平台涵盖了用于医学影像的 Clara Holoscan、基因组学的 Clara Parabricks、患者监控的 Clara Guardian 以及药物研发的 Clara Discovery,并可端到端部署至本地、嵌入式系统、边缘以及云端等任何地方,助力行业实现无缝创新,加快实现精准医疗的目标。

无论是尖端医学研究、大规模基因组分析还是日常应用检测,NVIDIA Million-X 百万倍计算性能飞跃的愿景已经在基因测序的各个领域结出累累硕果,并将持续为人类消除疾病、促进健康做出贡献。

点击“阅读原文”扫描下方海报二维码,即可免费注册 GTC 23,切莫错过这场 AI 和元宇宙时代的技术大会


原文标题:【百万倍加速】加速计算助力基因测序突破极限

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4116

    浏览量

    99634

原文标题:【百万倍加速】加速计算助力基因测序突破极限

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    随钻测量的“定海神针”:石英加速度计如何征服深井极限

    在石油钻井、煤矿勘探等地下作业中,随钻测量系统就像一双“地下眼睛”,实时指引钻头精准穿行于复杂地层。而这一切的核心,正是一颗小小的石英加速度计——ER-QA-03D。它如何在高温、强振、狭小空间里扛住极限、稳定输出?今天我们就来聊聊它的“地下硬核表现”。
    的头像 发表于 04-07 15:00 108次阅读
    随钻测量的“定海神针”:石英<b class='flag-5'>加速</b>度计如何征服深井<b class='flag-5'>极限</b>?

    NVIDIA加速计算平台助力从地球到太空的AI应用

    NVIDIA 今日宣布,其最新一代加速计算平台正在开启太空创新的新时代,将为轨道数据中心 (ODC)、地理空间信息收集以及自主太空运行提供 AI 算力。
    的头像 发表于 03-18 14:44 543次阅读

    突破极限,精准感知:双轴MEMS加速度计引领高精度运动测量新时代

    在需要精确捕捉运动状态与振动变化的工业与科研领域,一款可靠的加速度计往往是实现精准控制与智能监测的核心。ER-2MA-5双轴MEMS加速度计,以其卓越的性能与稳定的输出,成为高要求应用场景中的理想
    的头像 发表于 01-04 14:53 328次阅读
    <b class='flag-5'>突破</b><b class='flag-5'>极限</b>,精准感知:双轴MEMS<b class='flag-5'>加速</b>度计引领高精度运动测量新时代

    沐曦股份GPU加速技术助力药物研发降本增效

    沐曦股份科学计算团队近期取得突破性进展,成功将主流分子动力学模拟引擎GROMACS中的FEP计算全流程部署于GPU执行,并实现2.5倍性能提升,相关成果获得GROMACS官方团队的高度认可,该GPU
    的头像 发表于 12-02 15:58 898次阅读

    如何使用 ARM FPU 加速浮点计算

    文件名): -none-objdump -d build-fpu.elf/usart1-test 同样,在反汇编文件中即可找到浮点计算代码: 三、使用 ARM FPU 加速浮点计算1. ARM
    发表于 11-19 06:51

    一文了解Mojo编程语言

    ,利用硬件加速提升效率。 科学计算与数据处理 高效处理大规模数值分析、基因组学数据等任务。 系统工具开发 开发操作系统级工具,结合 Python 的便捷性和 C 的性能优势。 嵌入式与实时应用 适用于
    发表于 11-07 05:59

    边缘计算中的AI加速器类型与应用

    人工智能正在推动对更快速、更智能、更高效计算的需求。然而,随着每秒产生海量数据,将所有数据发送至云端处理已变得不切实际。这正是边缘计算中AI加速器变得不可或缺的原因。这种专用硬件能够直接在边缘设备上
    的头像 发表于 11-06 13:42 1007次阅读
    边缘<b class='flag-5'>计算</b>中的AI<b class='flag-5'>加速</b>器类型与应用

    常用硬件加速的方法

    之前总结了一些常用硬件加速方法 1)面积换速度:也就是串转并运算,可以多个模块同时计算; 2)时间换空间:时序收敛下通过频率提高性能,虽然面积可能稍微加大点; 3)流水线操作:流水线以面积换性能,以
    发表于 10-29 06:20

    RSA加速实现思路

    ,速度却由于计算量大而比较慢。算法基于数论原理,寻求两个大质数并将它们的乘积作为公钥(乘积进行因式分解极其困难),RSA算法的密钥和输入内容没有固定长度,一般1024 bits,密钥长度越长保密强度
    发表于 10-28 07:28

    硬件加速模块的时钟设计

    硬件加速模块需要四个时钟,分别为clk_l , clk_r , clk_c , clk_n 。 clk_l : 整个硬件加速模块为了最大化的节约时间成本而采用了类似处理器的流水线设计,具体上将每一层
    发表于 10-23 07:28

    序祯达生物利用NVIDIA Parabricks技术加速多组学分析

    序祯达生物是中国领先的多组学和测序服务提供商之一,该公司利用 NVIDIA Parabricks 来加速多组学分析。借助 Parabricks,序祯达生物将全基因测序的时间从 7 小
    的头像 发表于 09-29 16:05 1165次阅读

    什么是云加速?云加速的重点选购指标是哪些?

    加速是提升网站、APP访问速度的关键工具,很多人却搞不清它的作用和选购要点。本文 华纳云 会先用通俗语言解释云加速是什么,再拆解选购时必看的节点覆盖、加速类型、带宽支持等核心性能指标,重点提供“按
    的头像 发表于 09-12 16:29 1732次阅读

    英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔Gaudi 2E以更低的投入、更高的效率,实现从模型训练的深度突破到推理部署的实时响应,为大模型的加速落地提供
    的头像 发表于 08-26 19:18 3311次阅读
    英特尔Gaudi 2E AI<b class='flag-5'>加速</b>器为DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    新思科技携手微软借助AI技术加速芯片设计

    近日,微软Build大会在西雅图盛大开幕,聚焦AI在加速各行业(包括芯片设计行业)科学突破方面的变革潜力。作为Microsoft Discovery平台发布的启动合作伙伴,新思科技亮相本次大会,并携手微软将AI融入芯片设计,开发相关AI功能,从而
    的头像 发表于 06-27 10:23 1277次阅读

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历了多次迭代,每一次都源于对技术的创造性再利用。例如,早期的超级
    的头像 发表于 06-26 19:39 1431次阅读
    NVIDIA驱动的现代超级<b class='flag-5'>计算</b>机如何<b class='flag-5'>突破</b>速度<b class='flag-5'>极限</b>并推动科学发展