0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云天励飞推出IPU-X6000加速卡,针对大模型推理任务设计

云天励飞 来源:云天励飞 2024-07-24 11:03 次阅读

近期,云天励飞推出IPU-X6000加速卡。该产品具备256T算力、128GB显存容量、486GB/S显存带宽;采用C2C Mesh互联技术,可实现卡间高速互联,带宽达64GB/s,最大可实现64张卡的互联;可应用于语言、视觉、多模态等各类大模型的推理加速,目前已适配云天天书、通义千问、百川智能、Llama2/3等近10个主流大模型。

IPU-X6000加速卡内置全国产工艺打造的大算力芯片DeepEdge200,该芯片采用D2D Chiplet技术,是基于DeepEdge10芯片平台打造的最新成果。DeepEdge10是云天励飞于2023年底正式发布的全国产14nm Chiplet大模型推理芯片。

IPU-X6000单卡可实现130B参数量大模型推理,在执行70B参数量大模型推理时性能达11 tokens/s,有望在大模型推理领域逐步实现国产替代。今年以来,大模型全面进入应用落地阶段,推理算力需求随之不断增长。根据IDC数据,预计到2026年中国数据中心用于推理的负载将达到62.2%。

作为国内领先的人工智能企业,云天励飞不仅持续开展芯片、大模型等关键核心技术的自主研发工作,也一直持续推进大模型等创新技术的应用落地,在推理算力领域进行了完备的部署。

今年云天励飞与德元方惠签署协议,提供总算力规模约4000 PFLOPS的AI训练及推理异构算力服务,预计未来3年将为云天励飞贡献约16亿的营收。

云天励飞推出的X6000加速卡,专门针对大模型推理任务设计,打造了一系列符合大模型演进趋势的统一工具链,包括分布式并行策略、基于硬件的流水线排布、先进的量化策略、多机并行的编译机制等,在同等条件下能够做到推理性能更高、消耗成本更低。未来X6000将进一步支撑云天励飞智算运营业务,为行业带来更丰富的算力服务。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速卡
    +关注

    关注

    1

    文章

    51

    浏览量

    10908
  • 云天励飞
    +关注

    关注

    0

    文章

    115

    浏览量

    11190
  • 大模型
    +关注

    关注

    2

    文章

    2095

    浏览量

    1894

原文标题:云天励飞推出全新云端推理加速卡X6000,夯实智算运营底座

文章出处:【微信号:IntelliFusion2,微信公众号:云天励飞】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    清华姚班师生访问云天,展望中国AI发展未来蓝图

    日前,清华大学姚班师生到云天参观交流。云天董事长兼CEO陈宁博士携
    的头像 发表于 08-06 09:28 472次阅读
    清华姚班师生访问<b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>,展望中国AI发展未来蓝图

    云天推出全新云端推理加速卡X6000,夯实智算运营底座

    作为国内领先的人工智能企业,云天不仅持续开展芯片、大模型等关键核心技术的自主研发工作,也一直持续推进大模型等创新技术的应用落地,在
    的头像 发表于 07-24 15:07 168次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b><b class='flag-5'>推出</b>全新云端<b class='flag-5'>推理</b><b class='flag-5'>加速卡</b><b class='flag-5'>X6000</b>,夯实智算运营底座

    云天加速推动大模型行业落地

    7月,由中国信息通信研究院承办的WAIC 2024“迈向AGI:大模型焕新与产业赋能”论坛在上海成功召开。论坛深度聚焦大模型行业应用落地、终端智能、大模型安全等前沿热点话题。云天
    的头像 发表于 07-08 17:16 488次阅读

    云天参与“广东大模型赋能文化产业应用联盟”启动仪式

    5月24日下午,广东大模型赋能文化产业合作对接会在“粤港澳大湾区文化产业创新展”推介发布区举行,云天参与见证现场同步举办的“广东大模型
    的头像 发表于 05-27 10:16 279次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>参与“广东大<b class='flag-5'>模型</b>赋能文化产业应用联盟”启动仪式

    云天飞入选2024中国AI基础大模型创新企业

    5月16日,甲子光年“星辰100 2024创新企业榜颁布”,云天凭借自主研发的“云天天书”大模型,入选2024中国AI基础大
    的头像 发表于 05-17 17:23 409次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b>飞入选2024中国AI基础大<b class='flag-5'>模型</b>创新企业

    云天荣誉入选“2024福布斯中国人工智能科技企业”

    4月28日,“2024福布斯中国人工智能科技企业评选”结果正式发布,云天荣誉入选。同时,云天
    的头像 发表于 04-29 14:17 319次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>荣誉入选“2024福布斯中国人工智能科技企业”

    云天首届渠道大会落下帷幕,多家企业现场签约

    3月28日,云天首届渠道大会落下帷幕。此次大会汇聚了上百家业内企业,共同见证了云天飞在AI领域的创新与突破。
    的头像 发表于 04-03 09:13 347次阅读

    云天与深圳市交通运输局举行战略合作协议签订仪式

    日前,云天与深圳市交通运输局举行战略合作协议签订仪式。交通运输局党组成员、副局长徐炜,云天
    的头像 发表于 04-01 15:13 344次阅读

    云天正式发布“深目”AI模盒,让大模型应用平民化

    3月28日,云天举办AI大模型产品发布会,正式发布“深目”AI模盒。该产品能够做到“3个90%”——覆盖场景超过90%、算法精度超过90%,使用成本降低90%,解决大
    的头像 发表于 03-29 09:24 304次阅读

    云天推出“深目”AI模盒,实现算法在线学习、自我迭代

    3月28日,云天举办AI大模型产品发布会,正式发布“深目”AI模盒。该产品能够做到“3个90%”——覆盖场景超过90%、算法精度超过90%,使用成本降低90%,解决大
    发表于 03-28 21:55 293次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b><b class='flag-5'>推出</b>“深目”AI模盒,实现算法在线学习、自我迭代

    云天即将亮相“双数峰会”

    第二届数字政府建设峰会暨数字湾区发展论坛即将在12月8-10日举办。本次“双数”峰会上,云天将与CEC联合展示,重点展出大模型在数字政府领域的创新应用,以及
    的头像 发表于 12-07 11:07 301次阅读

    云天发布新一代边缘AI芯片,采用Chiplet技术,可运行百亿级大模型

    工艺,内含国产RISC-V核,支持大模型推理部署。   云天新一代自研AI SoC DeepEdge10   大
    的头像 发表于 11-23 01:08 2331次阅读
    <b class='flag-5'>云天</b><b class='flag-5'>励</b><b class='flag-5'>飞</b>发布新一代边缘AI芯片,采用Chiplet技术,可运行百亿级大<b class='flag-5'>模型</b>

    云天飞行业标杆案例亮相“中国科技第一展”

    DeepEye1000;2020年,云天正式发布自进化城市智能体战略。 今年,云天飞在高交会的舞台上展示新一代AI芯片DeepEdge
    的头像 发表于 11-17 09:13 584次阅读

    云天重磅发布新一代AI芯片DeepEdge10

    14nm Chiplet大模型推理芯片,采用自主可控的国产工艺,内含国产RISC-V核,支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的
    的头像 发表于 11-16 09:16 1143次阅读

    介绍一款基于昆仑芯AI加速卡的高效模型推理部署框架

    昆仑芯科技公众号全新栏目“用芯指南”重磅推出!面向AI行业技术从业者,系列好文将提供手把手的昆仑芯产品使用指南。第一期围绕昆仑芯自研效能工具——昆仑芯Anyinfer展开,这是一款基于昆仑芯AI加速卡的高效模型
    的头像 发表于 10-17 11:16 1444次阅读
    介绍一款基于昆仑芯AI<b class='flag-5'>加速卡</b>的高效<b class='flag-5'>模型</b><b class='flag-5'>推理</b>部署框架