0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种新的机器学习技术:FPGA加速机器学习推理,提速175倍轻松处理EB数据集

DPVg_AI_era 来源:lq 2019-09-01 07:59 次阅读

由麻省理工学院助理教授Philip Harris和核科学实验室博士后Dylan Rankin等国际科学家团队测试的新机器学习技术可以在眨眼间发现大型强子对撞机(LHC)海量数据中的特定粒子特征。

MIT助理教授Philip Harris和核科学实验室博士后Dylan Rankin等国际科学家团队正在测试一种新的机器学习技术,该技术可以在眨眼间在大型强子对撞机(LHC)浩瀚如海的数据中发现特定粒子特征。

新系统既复杂又迅速,可以在数据集不断变大变复杂的情况下,让我们得以一窥机器学习将在粒子物理学的未来发现中,会发挥怎样举足轻重的作用。

机器学习成为攻坚利器

大型强子对撞机每秒造成大约4000万次碰撞。筛选如此大量数据,需要强大的计算机,来识别其中需要科学家去关注的碰撞,无论是暗物质还是希格斯粒子。

现在,费米实验室(Fermilab),欧洲核子研究中心(CERN),麻省理工学院,华盛顿大学和其他地方的科学家们已经测试了一种新的机器学习系统,与现有方法相比,该系统可将处理速度提高30到175倍!

传统方法目前每秒只能处理不到一个图像。相比之下,新的机器学习系统每秒最多可以查看600张图像。在训练期间,系统学会挑选出一种特定类型的后碰撞粒子模式。

哈里斯说:“我们所识别的碰撞模式,顶夸克是大型强子对撞机上探测的基本粒子之一。能够分析尽可能多的数据非常重要,每一条数据都带有关于粒子如何相互作用的有趣信息。“

等目前的LHC升级完成后,数据将以前所未有的方式涌入;到2026年,17英里的粒子加速器预计将产生20倍于目前的数据,同时图像也将以比现在更高的分辨率拍摄。总而言之,科学家和工程师估计大型强子对撞机所需的计算能力是目前的10倍以上。

哈里斯继续说道:“未来的挑战迫在眉睫,随着计算变得更加准确,以及探测出更加精确的效果,它变得越来越难。”

该项目的研究人员对他们的新系统进行了训练,以识别顶夸克的图像,这是最庞大的基本粒子类型,比质子重180倍。

“通过我们提供的机器学习架构,就能够获得高质量的科学质量结果,与世界上最好的顶夸克识别算法相媲美,”哈里斯解释说。“高速实施核心算法使我们能够灵活地在最需要的关键时刻增强LHC计算。”

EB级的数据集也能轻松处理

凭借大型数据集和高数据采集速率,高性能和高吞吐量计算资源是实验粒子物理计划的基本要素。这些实验在探测器技术的复杂性和粒子束的强度方面不断增加。

因此,粒子物理数据集的大小正在增加,就像处理数据的算法的复杂性一样。例如,大型强子对撞机(HL-LHC)的高亮度阶段,将提供比当前LHC运行多15倍的数据。

HL-LHC将以40 MHz的速率碰撞质子束,碰撞环境中每次碰撞的粒子数将是原来的5倍。

Compact Muon Solenoid(CMS)实验将针对HL-LHC进行升级,读取通道的数量将增加10倍。通过一系列在线过滤器,CMS旨在以5 kHz的速率存储HL-LHC碰撞事件。

这样的数据速率导致数据集的规模为EB级。未来的中微子实验,如深层地下中微子实验(DUNE)和宇宙学实验、平方公里阵列(SKA),预计将产生百亿亿字节的数据集。

大规模粒子物理实验面临着高吞吐量计算资源的挑战。在具有增强的并行化的专用硬件上新的异构计算范例,例如现场可编程门阵列(FPGA),能够提供具有极大潜在增益的解决方案。

机器学习算法在粒子物理中用于模拟,重建和分析中,不断增长的应用,自然地部署在这样的平台上。

实验证明,机器学习推理的加速即Web服务,代表了粒子物理实验的异构计算解决方案,只需要对当前计算模型的最小修改。

作为示例,我们重新训练ResNet50卷积神经网络,以展示LHC顶级夸克喷射标记的最先进性能,并应用ResNet50模型和中微子事件分类的迁移学习。

使用Microsoft的Project Brainwave来加速ResNet50图像分类模型,我们使用Brainwave作为云(边缘或本地)服务的实验物理软件框架实现了60(10)毫秒的平均推断时间,显示了一个因素导致模型推断延迟比传统CPU推断提高了30-175倍。

作为粒子物理计算模型的边缘或云服务,协处理器加速器可以具有更高的占空比,并且可能更具成本效益。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1630

    文章

    21761

    浏览量

    604410
  • 图像
    +关注

    关注

    2

    文章

    1087

    浏览量

    40505
  • 机器学习
    +关注

    关注

    66

    文章

    8428

    浏览量

    132798

原文标题:MIT提出FPGA加速机器学习推理,提速175倍轻松处理EB数据集

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    共同挑战:如何从高维噪声数据中提取有效特征?如何平衡模型复杂度和计算效率?如何保证系统在真实环境中的稳定性?书中提出的技术方案对我的工作很有启发。多模态融合策略可用于处理异构数据源,元
    发表于 12-24 15:03

    zeta在机器学习中的应用 zeta的优缺点分析

    的应用(基于低功耗广域物联网技术ZETA) ZETA作为一种低功耗广域物联网(LPWAN)技术,虽然其直接应用于机器学习的场景可能并不常见,
    的头像 发表于 12-20 09:11 290次阅读

    自然语言处理机器学习的关系 自然语言处理的基本概念及步骤

    Learning,简称ML)是人工智能的个核心领域,它使计算机能够从数据学习并做出预测或决策。自然语言处理机器
    的头像 发表于 12-05 15:21 560次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要以数据的形式存在,因此机器学习需要设法对数据进行分析学习,这就使得它逐渐成为智
    的头像 发表于 11-16 01:07 452次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习
    的头像 发表于 11-15 09:19 522次阅读

    FPGA加速深度学习模型的案例

    FPGA(现场可编程门阵列)加速深度学习模型是当前硬件加速领域的个热门研究方向。以下是
    的头像 发表于 10-25 09:22 270次阅读

    【《时间序列与机器学习》阅读体验】+ 时间序列的信息提取

    本人有些机器学习的基础,理解起来点也不轻松,加油。 作者首先说明了时间序列的信息提取是时间序列分析的个重要环节,目标是从给定的时间序列
    发表于 08-14 18:00

    【《大语言模型应用指南》阅读体验】+ 基础知识学习

    语言的表达方式和生成能力。通过预测文本中缺失的部分或下个词,模型逐渐掌握语言的规律和特征。 常用的模型结构 Transformer架构:大语言模型通常基于Transformer架构,这是一种能够处理序列
    发表于 08-02 11:03

    FPGA在人工智能中的应用有哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 、深度学习加速 训练和推理过程
    发表于 07-29 17:05

    如何理解机器学习中的训练、验证和测试

    理解机器学习中的训练、验证和测试,是掌握机器学习
    的头像 发表于 07-10 15:45 4385次阅读

    机器学习中的数据处理与特征工程

    机器学习的整个流程中,数据处理与特征工程是两个至关重要的步骤。它们直接决定了模型的输入质量,进而影响模型的训练效果和泛化能力。本文将从数据
    的头像 发表于 07-09 15:57 495次阅读

    机器学习数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,
    的头像 发表于 07-02 11:22 663次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于
    的头像 发表于 07-01 11:40 1441次阅读

    机器学习的经典算法与应用

    关于数据机器学习就是喂入算法和数据,让算法从数据中寻找一种相应的关系。Iris鸢尾花数据
    的头像 发表于 06-27 08:27 1684次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典算法与应用

    FPGA在深度学习应用中或将取代GPU

    将 AI 框架模型映射到硬件架构。 Larzul 的公司 Mipsology 希望通过 Zebra 来弥合这差距。Zebra 是一种软件平台,开发者可以轻松地将深度学习代码移植到
    发表于 03-21 15:19