0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

稀疏化应对算力瓶颈,助力云服务商大幅降低成本

Carol Li 来源:电子发烧友网 作者:李弯弯 2022-09-02 08:46 次阅读
电子发烧友网报道(文/李弯弯)AI5G等新兴产业的蓬勃发展催生了海量数据计算需求,同时AI算法模型持续迭代,复杂化日益凸显,数字经济时代下市场需要强大、普惠的算力引擎。而从供给端来看,先进制程的迭代周期变长,使得芯片能效比的提升并不显著。

针对AI应用特点实现硬件架构创新是必然趋势,墨芯人工智能CEO王维在某论坛上谈到,依托对AI的理解用软硬一体解决算力瓶颈问题是行业公认的发展方向。他认为,稀疏化能够有效应对算力瓶颈,实现原理是,不存储和不处理零值,从而得到更小且更快的模型。

软硬一体化稀疏路径符合AI计算核心诉求

软硬一体化稀疏路径符合AI计算高吞吐、低功耗、低延时的核心需求。AI稀疏产业化的成功要素包括:1、跨算法、软件、硬件领域的协同开发;2、拥有持续多层次优化稀疏运算的底层算法能力;3、架构需保证可编程性、高度可拓展属性及快速迭代能力。

稀疏化路径已具备批量化工程应用能力。英伟达在2020年推出的A100产品中,就率先引入稀疏Tensor Core实现4:2结构化稀疏,稀疏是神经网络轻量化的重要手段,英伟达稀疏化产品有效引领市场应用趋势。稀疏化架构可与现有AI软件生态深度适配,例如英伟达直接使用Tensor Core进行稀疏矩阵乘累加操作,无需进行底层编程。
图片1
墨芯人工智能CEO王维演讲(电子发烧友拍摄)

基于双稀疏特点,自研核心AI架构

墨芯是全球最早研发稀疏化算法及架构的企业,并在2018年开始稀疏化的全球专利布局,该公司也是最早商用稀疏化产品实现销售的,第一款FPGA产品在2019年Q4开始产生销售。

王维表示,现有芯片架构设计在稀疏化支持中面临较大局限,比如CPU架构,可支持跳点运算,但因其算力限制,仅能够支持边缘端应用,无法支持更大的模型,再比如GPU架构,只能进行并行计算,所有元素(包括0元素)均参与运算,无法实现高倍数加速。

基于双稀疏特点,墨芯自研核心AI架构。其双稀疏架构设计理念:平衡的权重和激活张量剪枝技术,可将精度损失降至最低的前提下保持对硬件的友好度;墨芯独有的剪枝和压缩技术可以再许多网络和应用中实现最多高到32倍的稀疏。

墨芯首款稀疏化云端AI芯片Antoum-1已经回片,实测性能ResNet 50超33000SPS;墨芯板卡S4(单颗Antoum-1)仅30W功耗,实测性能实现英伟达主流产品T4近16倍能效比;墨芯板卡S4对比英伟达主流产品Latency可以做到1/4-1/5。
图片2
墨芯人工智能CEO王维演讲(电子发烧友拍摄)

稀疏化计算产品商业落地,将赋能AI产业变革。一、助力云服务商降低单位算力拥有成本,2021年,Nvidia在中国营收超过38亿美金,其中阿里,腾讯等头部互联网公司采购金额基本超过1亿美金。随着AI持续发展,数据量的指数上升导致AI芯片的需求会持续上升,云服务商采购额将逐年增加,因此他们对降低成本的诉求非常强劲,基于Antoum-1的推理卡S4相较于英伟达对标推理卡T4,ResNest50及BERT每FPS/SPS成本降低约85%。

二、助力云服务商缩减能耗成本,电费支出是数据中心最大的营业成本,平均数据中心近60%的营业成本是电力成本,降低能耗是数据中心和云服务商的最大痛点,2021年全国数据中心的耗电量占社会总用电的近3%,且增长率已连续8年超过12%,基于Antoum-1的推理卡S4相较于Nvidia主力推理卡T4,ResNest50及BERT每FPS/SPS能耗成本降低约90%。

小结

目前基于稀疏化的AI架构主要面向云端训练场景,不过理论上来说,稀疏化训练由于能大幅降低对内存、带宽与计算的需求,十分适合训练,未来墨芯在满足推理市场的需求后,将切入训练市场,建立稀疏训练生态,产品在软件层面对训练做更多的开发,支持训练专用的算子,同时硬件上也会为训练定义架构。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算力
    +关注

    关注

    1

    文章

    964

    浏览量

    14792
收藏 人收藏

    评论

    相关推荐

    超级应用程序Grab选择亚马逊科技为首选服务商

    亚马逊科技为首选服务商。借助亚马逊科技,Grab正在实施以技术为核心的发展战略,旨在推动其业务在出行、配送、以及包括新增的digibanks在内的金融
    的头像 发表于 12-19 15:31 105次阅读

    中国AI企业创新降低成本打造竞争模型

    在中国,面对美国实施的芯片限制以及相较于西方企业更为有限的预算,人工智能(AI)公司正积极寻求降低成本的方法,以开发出具有市场竞争的模型。初创公司如01.ai(零一万物)和DeepSeek(深度求索)等,通过聚焦小数据集进行AI模型训练,并聘请价格适中但技术熟练的计算机
    的头像 发表于 10-22 14:56 398次阅读

    在饱和状态下运行UCC2888x离线降压以降低成本

    电子发烧友网站提供《在饱和状态下运行UCC2888x离线降压以降低成本.pdf》资料免费下载
    发表于 10-14 09:47 0次下载
    在饱和状态下运行UCC2888x离线降压以<b class='flag-5'>降低成本</b>

    降低成本城域网

    电子发烧友网站提供《降低成本城域网.pdf》资料免费下载
    发表于 10-12 11:46 0次下载
    <b class='flag-5'>降低成本</b>城域网

    CC2340系统降低成本的方案剖析

    电子发烧友网站提供《CC2340系统降低成本的方案剖析.pdf》资料免费下载
    发表于 08-27 09:43 0次下载
    CC2340系统<b class='flag-5'>降低成本</b>的方案剖析

    中科曙光入选2024服务产业图谱及服务产品名录

    近日,中国信通院公布首个《服务产业图谱(2024年)》及《服务产品名录(2024年)》。
    的头像 发表于 08-06 14:23 674次阅读

    IaaS+on+DPU(IoD)+下一代高性能底座技术白皮书

    数据中心的第三颗“主力芯片”,主要通过其专用处理器优化数据中心的网络、存储、安全等处理性能,助力服务器运行效率显著提升,有效降低成本。因此,在新型数据中心建设时,围绕 DPU 构建数据中心网络的基础设施
    发表于 07-24 15:32

    AI智中心算服务商探索智造完成A轮融资

    近日,领先的AI智中心算服务商探索智造宣布成功完成A轮融资。本轮融资由无锡云林产业发展投资基金领投,旨在为公司提供强大的资金支持,助力其业务的进一步拓展和升级。
    的头像 发表于 05-30 09:33 432次阅读

    华为新一代柔性服务器,加速企业轻松上数智转型

    在数字浪潮的推动下,计算已经成为企业发展的必由之路。然而,面对各行各业不断变化的业务需求,传统服务器的固定规格往往难以满足。华为在不
    的头像 发表于 05-22 19:48 1828次阅读
    华为<b class='flag-5'>云</b>新一代柔性<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服务</b>器,加速企业轻松上<b class='flag-5'>云</b>数智<b class='flag-5'>化</b>转型

    助力中小企业一键上部署,新一代柔性耀 X 实例展实力

    在数字浪潮的推动下,企业面临着前所未有的挑战与机遇。计算作为企业数字转型的基石,其性能、灵活性和成本效益直接影响着企业的竞争。然而,
    的头像 发表于 05-22 19:38 501次阅读
    <b class='flag-5'>助力</b>中小企业一键上<b class='flag-5'>云</b>部署,新一代柔性<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>云</b>耀 X 实例展实力

    引领柔性新风潮,加速企业数智转型首选服务器就是它

    规格,难以满足不同业务场景的多样需求,用户常常面临着资源浪费和性能瓶颈的困扰。为解决这一难题,华为推出了颠覆行业的华为耀
    的头像 发表于 05-22 19:35 312次阅读
    引领柔性<b class='flag-5'>算</b><b class='flag-5'>力</b>新风潮,加速企业数智转型首选<b class='flag-5'>服务</b>器就是它

    解锁未来,华为耀服务器 X 实例引领柔性新时代

    的柔性设计、强大的性能表现以及高效的成本优化,成为企业数字转型的得力助手,引领着未来计算的发展趋势。 柔性
    的头像 发表于 04-11 22:23 1014次阅读
    解锁未来,华为<b class='flag-5'>云</b>耀<b class='flag-5'>云</b><b class='flag-5'>服务</b>器 X 实例引领柔性<b class='flag-5'>算</b><b class='flag-5'>力</b>新时代

    未来已来!华为耀 X 实例:应用驱动,业务创新加速

    随着数字转型的深入,计算作为支撑数字业务的重要基础设施变得日益重要。然而,传统服务器在应对
    的头像 发表于 04-11 22:22 1136次阅读
    未来已来!华为<b class='flag-5'>云</b>耀 X 实例:应用驱动<b class='flag-5'>算</b><b class='flag-5'>力</b>,业务创新加速

    ZR机械手:提高生产效率,降低成本的有效途径-速程精密

    目标的有效途径。ZR机械手厂家将为您深入解析ZR机械手如何助力企业提高生产效率、降低成本。 1、ZR机械手作为一种自动设备,能够大幅提高生产效率。在传统的生产线中,人工操作占据了大部
    的头像 发表于 02-28 15:14 698次阅读
    ZR机械手:提高生产效率,<b class='flag-5'>降低成本</b>的有效途径-速程精密

    光网络自动助力运营实现成本削减高达81%

    在部署光网络自动后,运营预计能够节省高达81%的成本。这一显著降低成本主要得益于自动在多个领域的优势,包括网络和
    发表于 02-20 15:10 387次阅读