0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

天数智芯正式发布通用GPU推理产品“智铠100”,峰值算力高达384TOPS@int8

Felix分析 来源:电子发烧友网 作者:吴子鹏 2022-12-22 01:03 次阅读

电子发烧友网报道(文/吴子鹏)12月20日,天数智芯在全新通用GPU产品线上发布会上正式发布该公司第二款产品——智铠100,面向人工智能推理应用。

“2021年3月,天数智芯发布了公司第一款产品天垓100,是国内第一款通用GPU训练产品,实现了我国高端通用GPU从0到1的突破。目前,天垓100已经覆盖20多个行业,适配300多个应用模型。”天数智芯总裁盖鲁江表示,“智铠100作为公司第二款产品,瞄准推理应用市场,可广泛应用于金融、医疗、教育、安防、互联网、智能语音、车路协同、智能中心等领域,标志着天数智芯成为国内唯一拥有云边协同、训推组合的完整通用算力系统全方案提供商。”

天数智芯于今年5月成功点亮智铠100,在2022世界人工智能大会上,智铠100首次公开亮相,被誉为“镇馆之宝”,吸引了众多行业用户的关注。

pYYBAGOjEqGALF05ABfIn-P0hys113.png 

那么,智铠100的真实性能如何呢?在本次发布会上,天数智芯产品线总裁邹翾对智铠100进行了全面的介绍。根据他的介绍,智铠100具有计算性能高、应用覆盖广和使用成本低三大特点。

pYYBAGOjErWAJtZ8ABPL2h9XnFY490.png 

在计算性能高方面,智铠100支持FP32、FP16、INT8等多精度混合计算,峰值算力表现为384TOPS@int8、96TFlops@FP16、24TFlops@FP32。
pYYBAGOjEsuACLzgABZVhf3pqx8411.png 

此外,智铠100加速卡提供32GB的HBM存储配置,800GB/s的理论峰值带宽,16路PCIe 4.0通道,以及128路并发的多种视频规格解码能力。

pYYBAGOjEt6AWPg-ABbefK0ulI8001.png 

邹翾指出,和目前行业内的主流方案相比,智铠100在CV/自然语言处理,以及推荐/滤波/统计分析等方面,基本都能提供2-3倍实际使用性能。

poYBAGOjE2CAUhY4ABNc2NLfUfs116.png 

在应用覆盖广方面,上面已经提到,智铠100能够满足多个行业的推理应用需求。同时,为了让这些行业的用户更好地使用智铠100,天数智芯在智铠100上做了专门的优化。智铠100能够提供多达800余条通用指令集,500多个算子函数,支持国内外主流深度学习开发框架,拥有丰富编程接口拓展和高性能函数库,可以灵活支持各种算法模型,便于客户自定义开发。

pYYBAGOjE3OAXl3PABWsmgnHHTI287.png 

在使用成本低方面,智铠100具备开发易迁移的特点,全面支持推理及训练一体化方案,能够在不额外增加购置成本的情况下完成增量训练工作,有效减少用户的成本支出。发布会上,有嘉宾在分享时讲到,智铠100带来了非常好的使用体验,在实际的算法迁移过程中,并不需要对上层算法做太多修改就能够完成迁移。并且,智铠100不仅迁移速度快,而且性能表现稳定,可以满足相关应用的需求。

目前,天数智芯在国内通用GPU市场已经打开局面。2022年4月,天垓100累计订单金额已经接近2亿元,目前这一数字已经超过了5亿元。智铠100的出现进一步丰富了天数智芯的产品阵容,并吸引了产学研多方面的关注。发布会上,极视角生态合作负责人叶炤阳介绍,该公司已经在算法开发训练、算法推理部署平台上部署天垓100和智铠100产品。让我们期待2023年天数智芯在智铠100上拿出亮眼的成绩单。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4702

    浏览量

    128708
  • 天数智芯
    +关注

    关注

    0

    文章

    94

    浏览量

    5530
收藏 人收藏

    评论

    相关推荐

    【一文看懂】大白话解释“GPUGPU

    随着大模型的兴起,“GPU”这个词正频繁出现在人工智能、游戏、图形设计等工作场景中,什么是GPU,它与CPU的区别是什么?以及到底什么是GPU
    的头像 发表于 10-29 08:05 276次阅读
    【一文看懂】大白话解释“<b class='flag-5'>GPU</b>与<b class='flag-5'>GPU</b><b class='flag-5'>算</b><b class='flag-5'>力</b>”

    GPU租用平台是什么

    GPU租用平台是一种基于云计算的服务模式,它允许用户通过互联网按需租用高性能GPU资源,而无需自行购买、部署和维护这些硬件。
    的头像 发表于 10-16 10:15 166次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    GPU、NPU,给我们剖析了芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解芯片。 全书共11章,
    发表于 10-15 22:08

    超紧凑模块提供高达 39 TOPS AI

    的 XDNA™ NPU 和强大的 Radeon RDNA 3™ 图形处理器,可为AI推理提供高达39 TOPS的惊人。      这使得
    发表于 09-25 13:46 1273次阅读
     超紧凑模块提供<b class='flag-5'>高达</b> 39 <b class='flag-5'>TOPS</b> AI <b class='flag-5'>算</b><b class='flag-5'>力</b>

    迅为瑞微RK3588与3588S如何选型硬件区别

    。内置GPU可以完全兼容OpenGLES 1.1、2.0和3.2。支持INT4/INT8/INT16/FP16混合运算能力,6TOPs的NP
    发表于 09-11 11:31

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    纸质媒体的高质量和专业网络媒体的信息更新速度。 芯片在最近15年有着巨大性能突破,这些年Intel的CPU芯片从双核128位SIMD到众核512位SIMD;NVIDIA的GPU产品
    发表于 09-02 10:09

    ARMxy工业控制器为视频监控提供1Tops支持

    Cortex-A55,主频高达1.8GHz/2.0GHz,搭载8/16/32GByte eMMC,1/2/4GB yte LPDDR4X 多种组合的RAM与ROM,并且内置1TOPS
    的头像 发表于 08-20 12:03 265次阅读
    ARMxy工业控制器为视频监控提供1<b class='flag-5'>Tops</b><b class='flag-5'>算</b><b class='flag-5'>力</b>支持

    光子计算芯片最新突破,峰值超1000tops,比电芯片更适合大模型

    电子发烧友网报道(文/李弯弯)近日,国内光计算芯片公司光本位科技宣布,公司已完成算密度和精度均达到商用标准的光计算芯片流片。这颗芯片的矩阵规模为128×128,峰值
    的头像 发表于 07-08 07:18 4399次阅读
    光子计算芯片最新突破,<b class='flag-5'>峰值</b><b class='flag-5'>算</b><b class='flag-5'>力</b>超1000<b class='flag-5'>tops</b>,比电芯片更适合大模型

    AMD推出锐龙8000嵌入式处理器,AI高达39 T

    此款CPU选用4纳米制程、AMD基于“Zen 4”架构的CPU核心以及使用RDNA 3架构GPU和XDNA架构NPU,实现高达39TOPS的AI
    的头像 发表于 04-03 10:39 821次阅读

    瑞萨电子RA家族推出RA8系列高通用MCU

    瑞萨电子RA家族推出RA8系列高通用MCU,是业界首款基于Arm® Cortex®-M85(CM85)内核的32位MCU,主频高达480
    的头像 发表于 04-02 14:14 1377次阅读
    瑞萨电子RA家族推出RA<b class='flag-5'>8</b>系列高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>通用</b>MCU

    256Tops!CSA1-N8S1684X服务器

    (基于BM1684X的高服务器)高AI处理器BM1684X搭载了BM1684AISo
    的头像 发表于 03-23 08:02 1457次阅读
    256<b class='flag-5'>Tops</b><b class='flag-5'>算</b><b class='flag-5'>力</b>!CSA1-N<b class='flag-5'>8</b>S1684X<b class='flag-5'>算</b><b class='flag-5'>力</b>服务器

    能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解到,能RADXA微服务器的具体规格: 处理器:BM1684X 高达32Tops
    发表于 02-28 11:21

    智能规模超通用,大模型对智能提出高要求

    的缩写,即每秒所能够进行的浮点运算数目(每秒浮点运算量)。   可以分为通用、智能
    的头像 发表于 02-06 00:08 6113次阅读

    ArmSoM Sige7替代Jetson-Orin-Nano,Xavier NX 搭载Hailo-8,32TOPS

    ArmSoM激动地宣布,我们的最新产品Sige7已成功搭载RK3588处理器,利用PCIe外接Hailo-8开发板,实现了惊人的32TOPS
    的头像 发表于 12-18 11:34 1215次阅读
    ArmSoM Sige7替代Jetson-Orin-Nano,Xavier NX 搭载Hailo-8,32<b class='flag-5'>TOPS</b><b class='flag-5'>算</b><b class='flag-5'>力</b>

    天数支持智源研究院首次完成大模型异构混合训练,突破异构束缚

    基于英伟达混合资源及天数混合资源完成训练的大模型, 也是智源研究院与天数合作取得的最新成果,再次证明了天数
    的头像 发表于 11-30 13:10 3394次阅读
    <b class='flag-5'>天数</b>智<b class='flag-5'>芯</b>支持智源研究院首次完成大模型异构<b class='flag-5'>算</b><b class='flag-5'>力</b>混合训练,突破异构<b class='flag-5'>算</b><b class='flag-5'>力</b>束缚