0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

知乎用户曝光的寒武纪下一代云端AI芯片——思元270(MLU270)

DPVg_AI_era 来源:lq 2019-05-07 09:11 次阅读

近日,知乎网友提出一个劲爆问题——如何看待寒武纪新一代人工智能芯片规格?问题一出便引发热议,疑似寒武纪下一代产品“思元270”提前被曝光,有望在低精度训练领域实现重大突破,性能或超越NVIDIA最新一代芯片!

AI芯片领域又有大爆料!

近日,知乎突然出现了一个劲爆提问 “如何看待寒武纪新一代人工智能芯片(疑似思元/MLU270)规格?”,提问者以匿名方式贴出了疑似寒武纪下一代云端AI芯片MLU270的相关信息,包括芯片外观以及某些具体参数

知乎链接:

https://www.zhihu.com/question/322886889

知乎用户曝光的寒武纪下一代云端AI芯片——思元270(MLU270)

根据问题和回答记录中显示,似乎已有多家厂商接触到了相关资料,经他人在网上披露信息后,寒武纪下一代芯片规格被提前曝光。

智能芯片领域,寒武纪被称为这一行业的先行者,“先行者”的行踪被泄露,自然会吸引众多从业者的关注与讨论——“新一代的云端AI芯片规格到底如何?”。该提问在短时间内就受到了知乎网友的广泛关注,阅读次数迅速过万。

独家爆料:“思元”年初悄然注册,数据遭泄,性能或超越NVIDIA最新一代芯片

据泄露照片显示,寒武纪的新一代云端AI芯片MLU270已于今年年初研制成功,主要包括如下五点特性:

基于台积电16nm工艺打造。

架构代号从上一代的MLUv01升级到了MLUv02。

内建视频解码单元(似乎是专门为视频处理市场配置)。

但按照寒武纪一直把MLU系列芯片定位为通用智能芯片来看,MLU270应该能够继续支持语音和自然语言处理等重要AI任务。

峰值方面,这颗芯片提供int4 256Tops, int8 128Tops的惊人性能,功耗为75w,与全球AI芯片龙头NVIDIA的最新一代Tesla T4基本持平。

在围绕新品的讨论中,这款新品是否与国际业内巨头NVIDIA持平也是知乎网友热议的一点。

大多数网友的看法都是持积极态度。虽然NVIDIA在国际范围内颇有“一家独大”的态势,但卓越的学术成就以及融资优势仍让很多网友看好寒武纪:对于前途大好的AI芯片市场,玩家越多,越有意思——“有新的竞争者加入进来对业内每一家都是好事”。

但也有网友认为超越NVIDIA绝非易事,峰值高低并不能直接决定市场上的胜负,如何接近核心客户可能是寒武纪需要跨过的更高门槛,也是能否与NVIDIA等巨头一决胜负的关键。

另外,业内反馈Tesla T4在75w功耗条件下实测性能距离理论峰值有较大差距,不知寒武纪能否突破这一瓶颈,未来尚需相关用户公布实测结果。

寒武纪思元270芯片内部分技术参数

值得注意的是,照片中出现的”思元”这个名字,很可能是寒武纪云端芯片品牌

MLU(Machine learning unit)的中文名。笔者顺藤摸瓜,查了一下国家商标局的网站(http://sbj.saic.gov.cn/sbcx/),发现寒武纪已经在年初注册了“思元”商标。

国家商标局网站,寒武纪注册“思元”信息

有网友在网站回答题主时反馈,“MLU”这个名词有些拗口,平时和同事交流时容易和“MCU”混淆。新的“思元”品牌,貌似可以解决这个小问题,也有利于打开市场知名度。

知乎匿名用户评论

来自同行的疑惑:“思元270”专注AI推断任务还是兼做训练任务?

耐人寻味的另一点是,照片中只包括了整数性能的数据,也没有交代是这颗芯片是专注人工智能的推断任务还是兼做训练任务,令一些同行感到疑惑。

查阅寒武纪以往公开信息,发现寒武纪不存在任何一款代号是MLU270的芯片产品。寒武纪的上一代产品MLU100已经公布,是专注于推理的AI芯片,而且发布时间尚不满一年,不太可能是同一产品线自相残杀式的迭代,更有可能是专注于训练的新产品。

寒武纪上一代芯片——MLU100

照片中仅公布了低精度整数性能,存在两种可能性:

一是表格中有意遗漏了浮点数据;

二是寒武纪在低精度训练领域实现了关键性突破。

而新智元从业内传闻看更倾向于第二种可能性。

实际上,低精度训练的需求在业界由来已久。算法工程师使用GPU做训练,通常使用其浮点运算单元,主要是因为在有监督学习的BP算法中,只有精确的浮点运算才能记录训练时很小的增量。而浮点运算单元占用的芯片面积和功耗相比于整数运算器都要大很多倍,导致单位芯片面积的处理能力要差很多。

目前业界在人工智能的推断类应用上,发现整数运算可以不影响模型的精度,因此用于推断的芯片已经大量集成了整数运算器或低精度浮点运算器。但业界一直在尝试是否有机会用代价更低的整数运算器实现更为复杂的训练功能,这样可以在不增加芯片面积和功耗的前提下,大幅提升芯片做训练的运算能力。但这个问题在业界也还没有普适的解决方案。

如果寒武纪真的在低精度训练领域实现了突破,那将会是AI芯片领域的重大消息。新智元在发稿前尝试联系寒武纪确认该技术信息,但目前尚未有回复。

思元270系列板卡实物照片

据了解,寒武纪在过去三年一直保持每年一代的产品迭代速度。在终端领域:

2016年推出寒武纪1A处理器IP;

2017年推出双核的寒武纪1H;

2018年推出寒武纪1M。

迄今已经服务于数千万台终端设备。

寒武纪CEO陈天石曾表示,寒武纪的云端智能芯片产品,迭代速度会和终端产品一样快。从这一次的消息泄露来看也确实如此,从去年初的MLU100到今年的MLU270。能够以一年一代的速度进行研发的,国内也仅有华为海思一家在消费类手机芯片能做到。

在发稿前,新智元专门回顾了寒武纪去年发布会的新闻,发现陈天石博士在去年曾提到一款名为“MLU200”的云端芯片。这次泄露的MLU270芯片已经研制成功,但是否就是去年发布会时陈天石提到的MLU200,抑或是寒武纪还另有名为MLU200的产品?

无论如何,大型AI芯片能在一年时间迭代一代确实令人意外,但如果寒武纪能够同时研发多款高复杂度的芯片,这可能意味着寒武纪已经具备非常完备的芯片研发能力,在迈向AI芯片新巨头的道路上又前进了一步。

我们今天如何造芯?回望寒武纪三年AI修行之路

那么,寒武纪在智能芯片这条路上到底是如何发展的呢?新智元对此做了一下梳理:

2016年发布的寒武纪1A处理器(Cambricon-1A),是世界首款商用深度学习专用处理器。

2017年8月,寒武纪科技一亿美元的A轮融资消息传出,在A轮融资后估值达到10亿美元,成为全球AI芯片领域第一个独角兽初创公司。

2016年发布的寒武纪1A处理器(Cambricon-1A)

2017年11月,寒武纪召开自成立以来的首场发布会,公布了系列新品及公司未来路线图——“3年内占领10亿智能AI终端,占领中国云端高性能芯片1/3市场份额”。发布会上,寒武纪三款全新的智能处理器IP产品亮相:面向低功耗场景视觉应用的寒武纪1H8、拥有更广泛通用性和更高性能的寒武纪1H16,以及面向智能驾驶领域的寒武纪1M。

2017年11月寒武纪首场发布会

2018年5月,寒武纪发布第三代IP产品Cambricon 1M,以及最新一代云端AI芯片MLU100和板卡产品。其中,MLU100采用寒武纪最新的MLUv01架构和TSMC 16nm的先进工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。

2018年5月发布的寒武纪MLU100

2018年6月,寒武纪宣布完成数亿美元的B轮融资,投后整体估值达25亿美元,继续领跑全球智能芯片创业公司。

按照寒武纪惯例,今年上半年应该会有一次发布会。在这次发布会上是否能够顺利地看到此次遭泄露的“思元270”,又是否真如曝光数据所示,峰值高达256Tops,亦或像网友猜测的那样,在低精度训练领域中实现了关键性突破?值得期待。

那么根据此次曝光的资料,你更倾向于哪种猜测呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 寒武纪
    +关注

    关注

    11

    文章

    185

    浏览量

    73857
  • AI芯片
    +关注

    关注

    17

    文章

    1859

    浏览量

    34900
  • 自然语言处理

    关注

    1

    文章

    611

    浏览量

    13503
收藏 人收藏

    评论

    相关推荐

    下一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级AI中更快的嵌入处理

    电子发烧友网站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高级AI系统高级AI
    发表于 08-15 11:06 0次下载
    <b class='flag-5'>下一代</b>高功能新<b class='flag-5'>一代</b><b class='flag-5'>AI</b>加速器(DRP-<b class='flag-5'>AI</b>3):10x在高级<b class='flag-5'>AI</b>系统高级<b class='flag-5'>AI</b>中更快的嵌入处理

    算力概念股寒武纪20cm涨停市值重回千亿

    大涨。 在AI火爆的背景下,业界多认为AI推动算力需求攀升,相关企业有望持续受益。AI芯片企业寒武纪作为算力代表性厂商24年以来股价涨幅已经
    的头像 发表于 07-17 15:30 542次阅读

    全新AI产品&quot;直答&quot;亮相第十届盐Club新知青年大会

    在知识的海洋中,每次探索都是次对未知的旅程。6月29日,第十届盐Club新知青年大会上,以其敏锐的科技洞察力,正式推出了全新AI产品
    的头像 发表于 07-01 16:55 453次阅读

    赛轮与NVIDIA合作,利用生成式AI打造下一代车内体验

    AI 驱动的移动出行创新企业与 NVIDIA 合作,打造下一代车内体验。
    的头像 发表于 05-23 10:12 1204次阅读

    丰田、日产和本田将合作开发下一代汽车的AI芯片

    丰田、日产和本田等日本主要汽车制造商确实计划联手开发下一代汽车的软件,包括在生成式人工智能(AI)和半导体(芯片)等领域进行合作。
    的头像 发表于 05-20 10:25 935次阅读

    寒武纪2023年报出炉:营收稳健亏损收窄 毛利率达69.16%

    年报信息显示,寒武纪全年实现收入7.09亿人民币,其中毛利率达到69.16%,比去年提高了3.40个百分点。在经历过上年度寛泛亏损之后,本年度盈利情况明显改善,向股东返还利润407913000,降幅达32.47%。
    的头像 发表于 04-30 09:39 698次阅读

    三星电子已开始与Naver合作开发下一代AI芯片Mach-2

    三星电子与Naver合作开发下一代AI芯片Mach-2,这举措标志着两家公司在人工智能领域的深度合作进步加强。
    的头像 发表于 04-18 14:40 651次阅读

    NVIDIA的专用AI平台如何推动下一代医疗健康行业的发展

    医疗科技创新企业在 GTC 上介绍了 NVIDIA 的专用 AI 平台如何推动下一代医疗健康行业的发展。
    的头像 发表于 04-09 10:10 1237次阅读

    英伟达的下一代AI芯片

    根据英伟达(Nvidia)的路线图,它将推出其下一代black well架构很快。该公司总是先推出个新的架构与数据中心产品,然后在几个月后公布削减的GeForce版本,所以这也是这次的预期。
    的头像 发表于 03-08 10:28 849次阅读
    英伟达的<b class='flag-5'>下一代</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>

    AI芯片股”,7年亏损近50亿!

    下降2.70%。归母净利润为-83,561.40 万,较上年同期亏损收窄33.50%。 虽然,寒武纪的亏损较往期有所降低,但营收依旧赶不上亏损。此外,这也是有着“AI芯片
    的头像 发表于 03-05 09:24 622次阅读

    AI芯片股”寒武纪发布2023年度业绩快报 亏8.36亿

    AI芯片股”寒武纪(688256)在2024年2月28日发布2023年度业绩快报。
    的头像 发表于 03-04 13:41 823次阅读
    “<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>第<b class='flag-5'>一</b>股”<b class='flag-5'>寒武纪</b>发布2023年度业绩快报 亏8.36亿<b class='flag-5'>元</b>!

    寒武纪与智象未来联手,推动视觉大模型的技术创新与应用

    在大模型领域,寒武纪自底层硬件架构至基础软件更新,皆针对大模型的实际应用场景进行了细致优化。依托高效的推理引擎MagicMind,寒武纪MLU
    的头像 发表于 01-24 09:59 808次阅读

    寒武纪与智象未来达成战略合作并完成大模型适配

    1月22日,寒武纪与智象未来 (HiDream.ai) 在北京签订战略合作协议,双方将通过资源共享、优势互补,依托各自在大模型领域的技术积累,持续产品适配,携手推动视觉大模型的创新与落地。
    的头像 发表于 01-23 13:46 502次阅读
    <b class='flag-5'>寒武纪</b>与智象未来达成战略合作并完成大模型适配

    寒武纪MLU云端智能加速卡在中国移动推出,助推AI业务发展

    中国移动以云边端协作管理结构和强大的智能计算感知调配技术为基础,根据东西部枢纽节点构建了大型AI算力集群,能够满足各种复杂AI场景的计算需求,为整个中国移动的AI业务提供支持。
    的头像 发表于 12-28 10:00 1008次阅读

    特| ​半导体巨头竞相制造下一代尖端芯片

    然而,过渡到下一代工艺的成本正在增加,而性能的提升也已达到高峰,因此,对于客户来说,这过渡可能不再具有那么大的吸引力,芯片小型化带来的性能提升瓶颈即将出现。反而对芯片制造业巨头来说,
    的头像 发表于 12-17 11:30 716次阅读
    浮<b class='flag-5'>思</b>特| ​半导体巨头竞相制造<b class='flag-5'>下一代</b>尖端<b class='flag-5'>芯片</b>