0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

墨芯Antoum芯片赋能大模型在各行各业的落地

墨芯人工智能 来源:墨芯人工智能 2023-09-06 14:21 次阅读

近日,墨芯人工智能携AntoumⓇ芯片亮相芯片行业的国际顶级大会Hot Chips 2023,墨芯首席架构师肖志斌博士在大会Tutorials上发表对行业趋势的分享,并在Conference Day介绍AntoumⓇ的创新架构。

一年一度的Hot Chips是全球芯片产业界影响力最大的活动,被誉为“芯片产业的风向标”,每年都有来自业界前沿的众多头部企业,发布最新产品与创新技术。

今年Hot Chips云集了NVIDIA、高通英特尔AMD等芯片巨头,与墨芯等代表性初创企业,介绍前沿技术与企业最新成果。

肖志斌博士进行《Moffett AntoumⓇ: A Deep-Sparse AI Inference System-on-Chip for Vision and Large Language Models》主题分享,介绍了的AntoumⓇ芯片的创新架构,及AntoumⓇ在大语言模型、计算机视觉等任务上的优势与特点。

由于深度学习模型复杂性的提升及模型的广泛应用,AI计算需求呈指数级增长。尤其是ChatGPT掀起大模型浪潮后,算力供需不平衡的问题日益突出。针对算力难题,墨芯推出全球首颗高倍率稀疏芯片AntoumⓇ,实现了更高的推理效率与能效比。

AntoumⓇ独特的稀疏计算单元SPU(Sparse Processing Unit),可以在负载均衡的情况下进行并行计算,并且只计算非零值,即忽略零元素的存储、搬移、计算,大大提高了计算单元的利用率,进而减少功耗与延时,同时增加吞吐率。SPU载有Deep Sparse Tensor Core(深度稀疏张量核心),实现稀疏神经网络的高模型精度和高硬件利用效率。

0b1eeca6-4c66-11ee-a25d-92fbcf53809c.png

除了利用稀疏处理单元(SPU)支持深度稀疏性之外,AntoumⓇ还采用了特定领域架构,将各种特殊功能加速器以及内部设计的矢量处理单元与可扩展的片上网络连接起来。

AntoumⓇ共有 32 个 SPU,支持 BF16 和 INT8 数据精度,密集吞吐量为 14.7 TFLOPS 和 29.5 TOPS,在 32 倍稀疏性条件下可实现相当于 471.8 TFLOPS 和 943.6 TOPS 的性能。

此外,AntoumⓇ芯片还具有多个亮点:

存储器层次结构包含总计 82 MB 的片上 SRAM,由 SPU、VPU 和特殊功能加速器共享。

特殊功能加速器包括激活功能、TOPK、Transpose、嵌入式查找以及图像预处理和后处理功能。

高带宽环形互连连接四个 NNCore 子系统,支持模型并行化和张量并行化。

专用硬件视频编解码引擎和 JPEG 解码引擎。四个视频解码器引擎和一个视频编码引擎可处理多通道视频流(高达 4K),并可轻松将可扩展的深度学习集成到视频处理中。集成的 8 个硬件 JPEG 解码器可载 CPU 密集型 JPEG 解码任务,并能以超过 2000 FPS 的速度解码 1080p JPEG 图像。

PCIe Gen3 x 16 和 20 GB LPDDR4x 内存,理论峰值内存带宽高达 84 GB/s,功耗仅为 70 W。

在软件方面,AntoumⓇ由墨芯 SparseRT 软件开发环境支持,为加速开发提供了一个完整的、可扩展的平台,并增强了稀疏计算的能力。现有的机器学习(ML)框架,如 TensorFlow、PyTorch、ONNX 和 MXNet,都能得到SparseRT 全面高效的支持。独特的 SparseOPT 模型压缩工具可为AI模型提供4倍到32倍的稀疏压缩。这样就可以轻松集成到现有的模型交付中,释放大模型的潜力。

AntoumⓇ芯片的优异性能,已在连续两届权威测评MLPerf中得到验证。同时,基于AntoumⓇ的墨芯第一代AI计算卡产品已实现量产,并已在互联网、生命科学、智慧交通等领域落地,产业化接连取得重要进展。墨芯将持续为客户带来高效的大模型算力方案,赋能大模型在各行各业的落地。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    454

    文章

    50502

    浏览量

    422332
  • 软件开发
    +关注

    关注

    0

    文章

    609

    浏览量

    27341
  • 墨芯
    +关注

    关注

    0

    文章

    8

    浏览量

    1053
  • 大模型
    +关注

    关注

    2

    文章

    2354

    浏览量

    2539

原文标题:墨芯携Antoum芯片 亮相行业国际顶会Hot Chips 2023

文章出处:【微信号:墨芯人工智能,微信公众号:墨芯人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    risc-v目前什么领域最热门?

    risc-v芯片可以应用于各行各业,那请问在哪个行业最火呢?
    发表于 11-30 23:17

    模型加速能行业 讯飞星火引领大模型规模化落地时代

    举办2024全球开发者节,并对外公布了讯飞星火大模型落地应用的最 新成绩单,科大讯飞披露,讯飞星火接连拿下央国企中标第 一、教育医疗市场第 一、智能汽车市场第 一、大模型应用开发者生态第 一、智能硬件市场第 一、
    的头像 发表于 10-28 14:03 142次阅读

    达实智能在各行各业的应用案例

    近期,达实智能中标经开区光伏新能源产业园(一期)项目高效机房系统项目,完成了1个亿的“小目标”。除了这个小目标以外,达实智能基于自主研发的节能低碳技术,也服务了众多各行各业的头部企业。
    的头像 发表于 10-24 10:27 241次阅读

    单北斗各行各业,顶坚工作记录仪开启智能化管理

    一、单北斗技术能行业应用近年来,随着北斗卫星导航系统的不断完善和发展,其应用领域日益广泛,为各行各业带来了前所未有的变革。单北斗技术以其高精度、全天候、全球覆盖的特性,正逐步成为各行业智能化转型
    的头像 发表于 09-06 11:00 203次阅读
    单北斗<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>各行各业</b>,顶坚工作记录仪开启智能化管理

    RISC-V Summit China 2024 | 青稞RISC-V+接口PHY,RISC-V高效落地

    RISC-V中国峰会在杭州圆满落幕。峰会现场,沁恒围绕“青稞RISC-V全栈MCU+USB/蓝牙/以太网芯片RISC-V高效落地”的主题,通过首日主会场演讲、展台互动等形式,系统
    发表于 08-30 17:37

    精准记录,高效分析:单北斗现场记录仪各行各业的应用

    在这个信息爆炸、效率至上的时代,每一个细节的记录与分析都成为了推动行业进步的关键力量。单北斗现场记录仪,作为集高精度定位、高清视频录制、智能数据分析于一体的创新设备,正悄然改变着各行各业的作业模式
    的头像 发表于 08-28 11:46 309次阅读
    精准记录,高效分析:单北斗现场记录仪<b class='flag-5'>在</b><b class='flag-5'>各行各业</b>的应用

    华邦电子为边缘设备打造生成式AI性能

    以大模型为基础的云端 AI 广泛各行各业后,边缘设备对于 AI 也释放出巨大需求,AI 也在从云端向边缘端加速
    的头像 发表于 08-19 16:14 581次阅读

    智能微型断路器,广泛应用,各行各业电力升级

    电力作为现代社会的血脉,其安全与运行成为各行各业关注的焦点。智能微型断路器以其实时监测、远程操控与预警保护功能,为户内低压配电网络的安全管理树立了新的标杆。 从工业生产线到商业综合体,从民用建筑到
    的头像 发表于 08-05 11:53 378次阅读
    智能微型断路器,广泛应用,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>各行各业</b>电力升级

    为什么加速数据处理对各行各业的AI创新都至关重要

    各行各业,AI 正在用机器驱动的计算来推动创新。金融领域,银行正在使用 AI 更快地检测欺诈行为并确保账户安全;电信公司正在使用 AI 优化网络以提供优质服务;科学家正在使用 AI 开发治疗罕见
    的头像 发表于 07-05 10:46 657次阅读

    数字EDARISC-V落地演进技术研讨会成功举办

    为了推动RISC-V技术的落地与演进,国家集成电路设计深圳产业化基地携手思尔,于2024年6月18日下午成功举办了“数字EDARISC-V落地
    的头像 发表于 06-21 08:24 380次阅读
    数字EDA<b class='flag-5'>赋</b><b class='flag-5'>能</b>RISC-V<b class='flag-5'>落地</b>演进技术研讨会成功举办

    数字EDARISC-V落地演进技术研讨会成功举办

    为了推动RISC-V技术的落地与演进, 国家集成电路设计深圳产业化基地携手思尔 ,于2024年6月18日下午成功举办了“数字EDARISC-V
    的头像 发表于 06-20 11:15 691次阅读

    华为推出ICN Master解决方案,率先将大模型应用到核心网运维领域

    2023年ChatGPT的出现让大模型成为各行各业的热点,如何构建大模型,实现大模型和云核心网之间的深度融合是核心网产业当前新热点。
    的头像 发表于 05-13 10:25 901次阅读

    IC咖啡沙龙“未来”公益讲座丨仇健乐:RISC-V指令架构端侧智能芯片产业化落地

    4月18日,由张江高科、IC咖啡联合主办的“未来”公益讲座【2024第十场】“RISC-V指令架构端侧智能芯片产业化落地”如约开讲。本
    的头像 发表于 04-24 08:16 311次阅读
    IC咖啡沙龙“<b class='flag-5'>芯</b>未来”公益讲座丨仇健乐:RISC-V指令架构<b class='flag-5'>赋</b><b class='flag-5'>能</b>端侧智能<b class='flag-5'>芯片</b>产业化<b class='flag-5'>落地</b>

    青云科技联手摩尔线程,构建国产算力繁荣生态

    随着大数据模型各行业深度整合,以GPU为代表的智能算力需求持续攀升。同时,政府出台多项扶持政策,积极推行“人工智能+”战略,激励AI芯片行业创新发展,以更好地
    的头像 发表于 04-22 09:32 492次阅读

    多模态加持底座,大模型提速AI未来,星宸科技2023开发者大会暨产品发布会圆满落幕

    2023年12月22日,星宸科技2023开发者大会暨产品发布会在深圳成功举办,此次大会以“Leading AI Everywhere”为主题,赋予“引领AI各行各业”新的意义。
    的头像 发表于 01-05 15:13 1522次阅读
    多模态加持<b class='flag-5'>芯</b>底座,大<b class='flag-5'>模型</b>提速AI未来,星宸科技2023开发者大会暨产品发布会圆满落幕