0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云天励飞推出全新云端推理加速卡X6000,夯实智算运营底座

爱云资讯 2024-07-24 15:07 次阅读

近期,云天励飞推出IPU-X6000加速卡。该产品具备256T算力、128GB显存容量、486GB/S显存带宽;采用C2C Mesh互联技术,可实现卡间高速互联,带宽达64GB/s,最大可实现64张卡的互联;可应用于语言、视觉、多模态等各类大模型的推理加速,目前已适配云天天书、通义千问、百川智能、Llama2/3等近10个主流大模型。IPU-X6000加速卡内置全国产工艺打造的大算力芯片DeepEdge200,该芯片采用D2D Chiplet技术,是基于DeepEdge10芯片平台打造的最新成果。DeepEdge10是云天励飞于2023年底正式发布的全国产14nm Chiplet大模型推理芯片。IPU-X6000单卡可实现130B参数量大模型推理,在执行70B参数量大模型推理时性能达11 tokens/s,有望在大模型推理领域逐步实现国产替代。

wKgZomagqCSAUCAoAABwbD12ozM182.png

今年以来,大模型全面进入应用落地阶段,推理算力需求随之不断增长。根据IDC数据,预计到2026年中国数据中心用于推理的负载将达到62.2%。作为国内领先的人工智能企业,云天励飞不仅持续开展芯片、大模型等关键核心技术的自主研发工作,也一直持续推进大模型等创新技术的应用落地,在推理算力领域进行了完备的部署。

今年云天励飞与德元方惠签署协议,提供总算力规模约4000 PFLOPS的AI训练及推理异构算力服务,预计未来3年将为云天励飞贡献约16亿的营收。云天励飞推出的X6000加速卡,专门针对大模型推理任务设计,打造了一系列符合大模型演进趋势的统一工具链,包括分布式并行策略、基于硬件的流水线排布、先进的量化策略、多机并行的编译机制等,在同等条件下能够做到推理性能更高、消耗成本更低。未来X6000将进一步支撑云天励飞智算运营业务,为行业带来更丰富的算力服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速卡
    +关注

    关注

    1

    文章

    51

    浏览量

    10908
  • 云天励飞
    +关注

    关注

    0

    文章

    115

    浏览量

    11190
  • 大模型
    +关注

    关注

    2

    文章

    2095

    浏览量

    1894
收藏 人收藏

    评论

    相关推荐

    清华姚班师生访问云天,展望中国AI发展未来蓝图

    日前,清华大学姚班师生到云天参观交流。云天董事长兼CEO陈宁博士携
    的头像 发表于 08-06 09:28 472次阅读
    清华姚班师生访问<b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>,展望中国AI发展未来蓝图

    云天推出IPU-X6000加速卡,针对大模型推理任务设计

    近期,云天推出IPU-X6000加速卡。该产品具备256T
    的头像 发表于 07-24 11:03 360次阅读

    云天加速推动大模型行业落地

    陈宁博士受邀发表主题演讲,首次展示云天边缘AI的战略全貌。   大模型落地的多重挑战 边缘AI提供解法  今年WAIC上,“大模型+行业”的应用落地成为关注热点。 当前,云端大模型
    的头像 发表于 07-08 17:16 488次阅读

    借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

    对于大规模数据处理,最佳性能不仅取决于原始计算能力,还取决于高存储器带宽。 因此,全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计,这些应用需要 FPGA 硬件
    发表于 05-16 14:09 144次阅读
    借助<b class='flag-5'>全新</b> AMD Alveo™ V80 计算<b class='flag-5'>加速卡</b>释放计算能力

    云天荣誉入选“2024福布斯中国人工智能科技企业”

    4月28日,“2024福布斯中国人工智能科技企业评选”结果正式发布,云天荣誉入选。同时,云天
    的头像 发表于 04-29 14:17 319次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>荣誉入选“2024福布斯中国人工智能科技企业”

    云天首届渠道大会落下帷幕,多家企业现场签约

    3月28日,云天首届渠道大会落下帷幕。此次大会汇聚了上百家业内企业,共同见证了云天飞在AI领域的创新与突破。
    的头像 发表于 04-03 09:13 347次阅读

    云天与深圳市交通运输局举行战略合作协议签订仪式

    日前,云天与深圳市交通运输局举行战略合作协议签订仪式。交通运输局党组成员、副局长徐炜,云天
    的头像 发表于 04-01 15:13 344次阅读

    云天推出“深目”AI模盒,实现算法在线学习、自我迭代

    3月28日,云天举办AI大模型产品发布会,正式发布“深目”AI模盒。该产品能够做到“3个90%”——覆盖场景超过90%、算法精度超过90%,使用成本降低90%,解决大模型在场景落地最后一公里
    发表于 03-28 21:55 293次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b><b class='flag-5'>推出</b>“深目”AI模盒,实现算法在线学习、自我迭代

    云天收购智能穿戴方案设计头部公司岍丞技术

    3月22日,云天发布公告,收购智能穿戴方案设计头部公司岍丞技术。
    的头像 发表于 03-25 10:14 304次阅读

    广西领导莅临云天调研

    2月26日,自治区党委书记刘宁、自治区主席蓝天立率广西党政代表团赴深圳市学习调研,并莅临云天调研人工智能技术研发以及创新链和产业链融合等方面情况。 云天
    的头像 发表于 02-27 09:43 558次阅读
    广西领导莅临<b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>调研

    云天即将亮相“双数峰会”

    第二届数字政府建设峰会暨数字湾区发展论坛即将在12月8-10日举办。本次“双数”峰会上,云天将与CEC联合展示,重点展出大模型在数字政府领域的创新应用,以及云天
    的头像 发表于 12-07 11:07 301次阅读

    瞬变对AI加速卡供电的影响

    ,尤其是在学习和推理时。这种需求不断地将供电网络的边界推向前所未有的新水平。这些高密度工作负载变得愈加复杂,更高的瞬态需求推动配电网络的每个部分都必须高效运行。AI加速卡严格的功耗要求对系统性能也有影响。本文将讨论AI加速卡的配
    的头像 发表于 12-01 18:10 315次阅读
    瞬变对AI<b class='flag-5'>加速卡</b>供电的影响

    云天重磅发布新一代AI芯片DeepEdge10

    11月15日,在高交会开幕式上,云天重磅发布新一代AI芯片DeepEdge10。 云天
    的头像 发表于 11-16 09:16 1143次阅读

    介绍一款基于昆仑芯AI加速卡的高效模型推理部署框架

    昆仑芯科技公众号全新栏目“用芯指南”重磅推出!面向AI行业技术从业者,系列好文将提供手把手的昆仑芯产品使用指南。第一期围绕昆仑芯自研效能工具——昆仑芯Anyinfer展开,这是一款基于昆仑芯AI加速卡的高效模型
    的头像 发表于 10-17 11:16 1444次阅读
    介绍一款基于昆仑芯AI<b class='flag-5'>加速卡</b>的高效模型<b class='flag-5'>推理</b>部署框架

    云天:2023年市场整体活力较2022年有一定提升

    据介绍,云天推出edge10c、edge10标准板和edge10max三种芯片。edge10c为8核心cpu 8tops, edge10为10核心cpu 12tops,用于智能安
    的头像 发表于 10-10 11:26 575次阅读