0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

燧原科技如何立足于国产云端AI算力攻克通用性与性能双重挑战

燧原科技Enflame 来源:燧原科技Enflame 作者:燧原科技Enflame 2021-10-29 11:06 次阅读

由中国工程院信息电子工程学部主办,浪潮信息承办,2021年人工智能计算大会(AICC)于北京成功召开。作为全球AI计算领域最具影响力的技术盛会,本次大会以“智算·新际”为主题,邀请到众多专家学者与产业领袖,就智能算力发展、人工智能产业创新以及产业数字化转型展开精彩分享。燧原科技副总裁邓辉先生受邀出席“AI芯片创新技术”分论坛,并就燧原科技如何立足于国产云端AI算力攻克通用性与性能双重挑战发表演讲。

起点

长期处于自主创新空白的云端训练AI算力一切要从2012年那场改变人工智能发展史的ImageNet图像分类竞赛开始谈起。在当时的比赛中,“深度学习之父”、图灵奖获得者——多伦多大学Geoffrey Hinton教授首次提出深度卷积神经网络模型“AlexNet”,参数量达6000万。AlexNet的出现是人工智能技术发展史上重要的转折点,它将沉寂已久的深度学习技术再次推至历史舞台。除了革命性的“大模型”,Geoffrey Hinton教授创新性地采用了异构算力GPU作为训练加速资源。“AI加速”这个概念由此进入广大AI科研工作者与产业落地先锋的视野。

新一轮技术文明由此开始,可这并没有带来我国自主创新AI算力的繁荣,一直以来,AI加速产品与技术都被GPU厂商所垄断,尤其是在云端训练领域,由于云端数据中心整体架构的高度复杂性、大规模分布式AI训练带来的巨大挑战及其本身要支撑的业务多样性等原因,云端训练是国内厂商切入难度最为高的一个领域,长期处于空白的状态,燧原科技作为行业领头羊于2019年发布邃思1.0云端训练芯片,开始了攻坚技术壁垒、打破垄断的征程。

挑战

云端专用AI训练产品的性能与通用性互联网是人工智能技术与产业发展的沃土,人工智能在互联网的广泛应用得益于各类深入人们生活的终端应用所产生的大量数据,而云计算作为关键的底层技术支撑,正与互联网共同以孪生体姿态不断地蓬勃发展,为我们带来了空前的数据井喷与突破人类认知的巨量模型,对超强算力产生了爆炸性的需求;传统GPU架构虽然早期开创了人工智能发展的篇章,但随着人工智能产业蓬勃发展,在规模效应的驱使下,DSA架构带来的更经济的成本与更高效的计算能力使得专用AI训练产品变得越来越有优势。然而由于专用AI训练产品天生缺乏生态积累,在模型泛化与通用性上一直是业界痛点。因此如何保证比GPU更高效的AI模型计算能力,同时兼顾一定的通用性是云端AI训练芯片面临的最大挑战。燧原科技副总裁邓辉先生表示:“我们把性能与通用性作为产品成功最重要的衡量标准,经过3年的努力,这两方面的能力在我们第二代产品上取得飞跃。”

燧原

中国首家发布二代云端训练加速产品组合的企业燧原科技以助力发展我国集成电路和人工智能产业、推动AI算力普惠化为使命,秉承“做大芯片、拼硬科技”的原则,自2019年12月推出第一代云端训练芯片邃思1.0以后,率先实现国产AI芯片数据中心与千卡液冷集群的商业落地,并于2021年7月在世界人工智能大会(WAIC)发布邃思2.0,是中国唯一一家推出二代云端训练加速产品组合的企业。

基于燧原科技自研的GCU-CARE计算引擎,邃思2.0进行了大规模的架构升级,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础。支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8;并在单精度算力方面达到与7nm GPU相当的性能水平:单精度FP32峰值算力最高达到40 TFLOPS,单精度张量TF32峰值算力最高达到160 TFLOPS,大大提高了能效比。同时搭载了4颗HBM2E片上存储芯片,高配支持64 GB内存,带宽最高可达1.8 TB/s。GCU-LARE也全面升级,提供双向300 GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联,实现优异的线性加速比。

而同步升级的驭算TopsRider软件平台,成为燧原科技构建原始创新软件生态的基石。通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流深度学习框架下的各类模型训练;利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。

基于邃思2.0,燧原科技推出了云燧T20人工智能训练加速卡与云燧T21人工智能训练OAM模组,能够通过300GB/s的独立片间互联通道提供灵活的多芯片算力扩展方案,支持单机多卡、单机柜多节点、多机柜大机群多种部署方式。

未来

更多的AI解决方案与产品孵化除了强劲的原始创新芯片支撑,AI算力的腾飞与人工智能产业的发展需要依托于健全的生态合作体系。在演讲的最后,燧原科技副总裁邓辉先生表示:“未来,我们期望在人工智能领域和浪潮以及更多的合作伙伴一起合作打造更多AI解决方案和产品,助力中国AI产业蓬勃发展。”

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    456

    文章

    50967

    浏览量

    424891
  • AI
    AI
    +关注

    关注

    87

    文章

    31157

    浏览量

    269502
  • 燧原科技
    +关注

    关注

    0

    文章

    125

    浏览量

    8344

原文标题:原始创新架构助力云端AI算力腾飞

文章出处:【微信号:gh_1222367b8780,微信公众号:燧原科技Enflame】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    原技术伙伴培育计划第二期开启

    2025年1月10日,中国上海——在国产力生态不断壮大发展的产业背景下,原科技2024年7月推出的“原技术伙伴培育计划(ETP,En
    的头像 发表于 01-10 15:25 156次阅读

    中心会取代通用力中心吗?

    随着人工智能(AI)技术的飞速发展,计算需求不断攀升,数据中心行业正经历着前所未有的变革。传统的通用力中心与新兴的智中心之间的竞争日益激烈。那么,在这样的背景下,
    的头像 发表于 01-06 14:45 98次阅读
    智<b class='flag-5'>算</b>中心会取代<b class='flag-5'>通用</b><b class='flag-5'>算</b>力中心吗?

    北电数智前进·AI异构计算平台,绘制国产力商业化落地新蓝图

    潜在规模千亿量级的蓝海市场。在AI产业快速发展与信创支持国产替代的大环境下,国产力迎来广阔发展前景,国产
    的头像 发表于 12-24 11:54 365次阅读

    原科技入选先进计算赋能新质生产力典型应用案例

    近日,工业和信息化部电子信息司发布了《先进计算赋能新质生产力典型应用案例公示》,原科技“基于国产云端力的政务大模型应用”成功入选未来产业领域典型应用案例。
    的头像 发表于 12-04 15:26 357次阅读

    一体架构创新助力国产AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《存一体架构创新助力国产
    的头像 发表于 10-23 14:48 352次阅读

    弘华创助力庆阳构建力产业生态

    全国一体化力网络庆阳枢纽节点首批万P力成功上线,首个国产万卡力集群启动,首列东数西“人才专列”开通。作为在庆阳率先部署
    的头像 发表于 09-20 10:38 510次阅读

    原科技启动IPO辅导,加速AI力底座布局

    近日,中国证监会正式披露了上海原科技股份有限公司(简称:原科技)的IPO辅导备案报告,标志着这家AI芯片领域的独角兽企业正式踏上了上市征程。据悉,原科技的IPO辅导机构由中金公司
    的头像 发表于 08-29 15:49 448次阅读

    兰洋科技与原科技深化江苏地区智合作 共筑力基石

    供需正呈现“双向奔赴”的趋势。 近日,国内领先的浸没式液冷解决方案技术服务提供商兰洋(宁波)科技有限公司(以下简称“兰洋科技”),与专注人工智能领域云端力产品的上海原科技有限公司(以下简称“
    的头像 发表于 08-16 10:53 301次阅读

    原科技与锐捷网络携手共筑AI数据中心高性能网络新纪元

    近日,原科技与知名网络解决方案提供商锐捷网络正式签署战略合作协议,双方宣布将共同研发面向未来人工智能数据中心的高性能网络互联解决方案。此次合作旨在应对超大规模集群带来的网络挑战,显著提升大模型计算效率,并强化智
    的头像 发表于 07-29 11:27 575次阅读

    原科技与锐捷网络达成合作,共创智中心AIGC网络解决方案

    2024年7月29日,中国上海——原科技宣布与网络厂商锐捷网络签署战略合作协议,双方将联合研发面向人工智能数据中心的高性能网络互联解决方案,应对超大规模集群的网络挑战,提升大模型计算效率,确保智
    的头像 发表于 07-29 10:46 773次阅读

    从千卡集群卡到万卡集群,原科技打造更好的AI力底座

    :WAIC 2024)上,不仅有国内各大模型厂商同场竞技,也有丰富的力基础设施展示,其中包括专注人工智能领域云端力产品的原科技。  
    的头像 发表于 07-07 09:45 2366次阅读
    从千卡集群卡到万卡集群,<b class='flag-5'>燧</b>原科技打造更好的<b class='flag-5'>AI</b><b class='flag-5'>算</b>力底座

    专注为通用人工智能力底座筑基,原科技连续五年参加世界人工智能大会

    工智能大会(WAIC 2024)正式开幕。致力通用人工智能打造力底座的原科技以 “芯火燎原”为主题,连续第五年参会。 大会期间,
    的头像 发表于 07-05 08:16 762次阅读
    专注为<b class='flag-5'>通用</b>人工智能<b class='flag-5'>算</b>力底座筑基,<b class='flag-5'>燧</b>原科技连续五年参加世界人工智能大会

    龙芯:自主研发CPU提升性能,单核通用性能提高20倍

    张戈强调,龙芯CPU的主要IP核均为自主研发,这使得其性价比得到显著提升。他指出,国产CPU与主流CPU的差距主要体现在单核性能上,而非多核性能。近年来,龙芯CPU的单核通用性能已提升
    的头像 发表于 04-25 15:26 821次阅读

    联想向弘华创交付首台搭载国产AI力芯片的问天WA5480 G3服务器

    3月19日,在联想集团(全球)最大的智能计算设备研发和制造基地——联宝科技,联想集团向弘华创交付联想首台可搭载国产AI力芯片的联想问天WA5480 G3服务器。
    的头像 发表于 03-22 09:40 904次阅读

    立足力,聚焦AI!顺网科技全面走进AI时代

    立足力,聚焦AI”,顺网科技进军AI时代的号角已被吹响。 1月18日,顺网科技(300113.SZ)以“跃迁·向未来”为主题的战略升
    的头像 发表于 01-19 10:57 482次阅读
    <b class='flag-5'>立足</b><b class='flag-5'>算</b>力,聚焦<b class='flag-5'>AI</b>!顺网科技全面走进<b class='flag-5'>AI</b>智<b class='flag-5'>算</b>时代