0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为发布最外那个算力AI芯片

h1654155282.3538 来源:沈苗 2019-08-23 17:15 次阅读

华为全场景AI方案构建完成!

在今天深圳的发布会上,华为副董事长、轮值董事长徐直军发布了最新商用AI芯片昇腾910(Ascend 910),以及首款国产的全场景AI计算框架——MindSpore计算框架。

至此,从去年发布“五大AI战略”,短短一年时间,在各方压力下的华为,已经迅速完成了全场景AI方案的全部部件构建。华为表示,接下来会专注于各部件的优化和升级。

在答记者问的环节徐直军也提到,“516事件”(美国商务部以国家安全为由,将华为公司及其70家附属公司列入出口管制「实体名单」)对华为战略推荐和全场景产品研发没有任何影响,尽管外部环境发生了很多变化,但是整个AI战略和产品商用依然在稳步推进,也达到了预期结果。

而对于华为在计算框架生态的构建上,如何与谷歌和Facebook等已经长期耕耘的公司竞争的问题,徐直军表示,华为的优势在于有自己的移动终端产品,并且利用算力和计算框架结合,可以打造很多其他框架不能实现的功能。

其实在8月21日开幕的第31届Hot Chips大会上,华为作为主角之一与AMDIntelARM等巨头同台亮相时,就推出了AI芯片所用的“Da Vinci(达芬奇)”架构,以及昇腾310、昇腾910芯片和麒麟810芯片。

昇腾310、昇腾910芯片早在去年10月10日的华为全链接2018大会上就已首次亮相。

聚焦低功耗的昇腾310已经量产商用,那今天发布的昇腾910(Ascend 910)AI处理器和MindSpore计算框架又有什么新的亮点呢?

最新商用AI芯片昇腾910发布

先看昇腾910,据华为介绍,这款芯片在算力方面超过了预期,同等规格下,昇腾910达到并超过了C级规格,能在一个时钟周期下完成4096次计算。

这个成绩得益于基于达芬奇架构的AI核的计算核心,除了标量和矢量计算单元,AI核集成了3D立方体计算引擎,与CPUGPU相比,有两个数量级上的提升。

昇腾910更是集成了32个立方体计算引擎,能够输出256TFLOPS(每秒256万亿次浮点指令),所以昇腾910不仅是一个AI芯片,更是一个高度集成的片上系统,集成了CPU、DVBP及任务管理器。

同时昇腾910拥有自治能力,使其可以独立完成整个AI训练流程,最小化和Host的交互,从而发挥其强大的算力。

再看昇腾910的通信机制,昇腾910集成了HCCS、PCLe和RoCE三种高速接口,其中自研的HCCS可以提供单接口240Gbps的传输,从而实现芯片构建训练系统的性能和灵活性的大幅提升。

华为也表示,将继续面向未来投资,针对不同场景进行研发,提供更强大经济的算力需求。昇腾310、昇腾910仅仅是一个开始,未来将推出昇腾920。

在价格上,华为也表示,这款芯片的售价还没有确定,但是绝不会高于同性能芯片的售价。

发布首款国产全场景AI计算框架——MindSpore

接下来,华为还发布了一款全场景AI计算框架——MindSpore。

徐直军表示,目前国内还没有一款能够对标Tensorflow的全场景AI计算框架,MindSpore希望能够弥补国内的这一空白。

在性能上,MindSpore对开发者非常友好,能够有效减少模型开发时间,降低开发门槛。相同场景需求下,减少模型代码量20%,效率能够整体提升50%以上。

具体来说,MindSpore自动微分采用Source 2 Source方式实现,在性能和可编程性上,明显优于业界图和运算符重载方式,同时能够实现任意算子的微分表达和编译优化,实现反向算子自动生成,从而极大方便模型开发。

随着数据集和模型规模越来越大,模型并行成为必然,手工切分的模型并行存在门槛高、效率低、调优难的缺陷,而MindSpore只需要定义单机模型,即可实现多机混合并行运行,无需了解AI集群细节。

MindSpore同时支持静态图和动态图,且可用一条语句实现无缝切换,从而让调试也变得简单而高效。

不仅有开发态的高效,运行态的友好同样是MindSpore的追求目标。MindSpore大大提高了运算性能,并且除了支持华为的昇腾910外,也支持其他业界其他CPU、GPU。

MindSpore还提供了Ascend Native运行技术,助力昇腾算力最佳发挥。主从控制模式中,CPU和GPU交互,引入内存和数据开销,在芯片上完成神经网络模型所需要的所有控制和执行。

至于很多人问为什么有了TensorFlow还要开发MindSpore,徐直军表示:目前没有任何一个国产框架支持全场景。华为目前的业务包括云、端、边,这些都需要全场景支持的AI框架。在不同的运行环境中,架构上支持可大可小,适应全部场景部署。

在隐私保护方面,MindSpore不带有隐私信息的梯度模型,能够在保证保护用户隐私的前提下,跨场景协同。

总的来说,支持端、边、云独立和协同的统一训练和推理的MindSpore计算框架,降低了AI的开发和使用门槛,释放AI生产力,最大程度发挥AI芯片算力潜力,从而鼓励开发人员共同打造AI生态,推动AI产业落地。

华为称,MindSpore将在明年一季度开源,让更多开发者参与将MindSpore打造好。

华为全场景AI构建方案完成

最后,让我们再回顾一下华为去年发布的AI五大战略:

投资基础研究:在计算视觉、自然语言处理、决策推理等领域构筑数据高效(更少的数据需求)、能耗高效(更低的算力和能耗),安全可信、自动自治的机器学习基础能力

打造全栈方案:打造面向云、边缘和端等全场景的、独立的以及协同的、全栈解决方案,提供充裕的、经济的算力资源,简单易用、高效率、全流程的AI平台

投资开放生态和人才培养:面向全球,持续与学术界、产业界和行业伙伴广泛合作,打造人工智能开放生态,培养人工智能人才

解决方案增强:把AI思维和技术引入现有产品和服务,实现更大价值、更强竞争力

内部效率提升:应用AI优化内部管理,对准海量作业场景,大幅度提升内部运营效率和质量

而今年芯片和计算架构的发布,也是华为对这一战略的落地实践。这也标志着华为全场景AI构建方案完成。

目前从世界范围来看,在桌面CPU上,Intel和AMD处于绝对的统治地位;GPU方面,则是英伟达在领跑;至于手机处理器,则基本握在了ARM手中。尽管华为有备胎计划,但是性能方面预计很难超过这些技术成熟、人才资本雄厚的企业。

深圳半导体协会秘书长常军锋曾指出,国外半导体巨头通过国际标准、行业标准、专利保护建立了技术壁垒。

AI芯片,则成为了国产芯片弯道超车的绝佳机会。

AI芯片从发育到成熟落地,国内基本和国外大厂处于同一起跑线上,并且如今华为昇腾系列已经商业化,昇腾910作为是目前单芯片计算密度最大的芯片,计算力也超过了谷歌及英伟达竞品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    215

    文章

    34269

    浏览量

    251083
  • AI
    AI
    +关注

    关注

    87

    文章

    29928

    浏览量

    268238
  • AI芯片
    +关注

    关注

    17

    文章

    1852

    浏览量

    34882
收藏 人收藏

    评论

    相关推荐

    企业AI租赁是什么

    企业AI租赁是指企业通过互联网向专业的提供商租用所需的计算资源,以满足其AI应用的需求。
    的头像 发表于 11-14 09:30 91次阅读

    亿铸科技熊大鹏探讨AI芯片的挑战与解决策略

    在SEMiBAY2024《HBM与存储器技术与应用论坛》上,亿铸科技的创始人、董事长兼CEO熊大鹏博士发表了题为《超越极限:大芯片的技术挑战与解决之道》的演讲,深入剖析了AI大模型
    的头像 发表于 10-25 11:52 313次阅读

    AI芯片供电电源测试利器:费思低压大电流系列电子负载

    AI芯片作为驱动复杂计算任务的核心引擎,其性能与稳定性成为了决定应用成败的关键因素。而在这背后,供电电源的稳定性和高效性则是保障AI
    的头像 发表于 10-25 11:26 215次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>供电电源测试利器:费思低压大电流系列电子负载

    一体架构创新助力国产大AI芯片腾飞

    在湾芯展SEMiBAY2024《AI芯片与高性能计算(HPC)应用论坛》上,亿铸科技高级副总裁徐芳发表了题为《存一体架构创新助力国产大
    的头像 发表于 10-23 14:48 218次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    1章 从TOP500和MLPerf看芯片格局 1.1科学最前沿TOP500 1.2 AI
    发表于 10-15 22:08

    中国大会召开,业界首个高质量评估体系发布

    首次完整地构建了人工智能时代高质量的理论体系,并探索性提出业界首个 "五位一体"的高质量评估体系。 发布现场 在当前由大模型和AIG
    的头像 发表于 09-28 16:50 220次阅读
    中国<b class='flag-5'>算</b><b class='flag-5'>力</b>大会召开,业界首个<b class='flag-5'>算</b><b class='flag-5'>力</b>高质量评估体系<b class='flag-5'>发布</b>

    名单公布!【书籍评测活动NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架构分析

    ,在全球范围内,对于推动科技进步、经济发展及社会整体的运作具有至关重要的作用。随着信息技术的高速发展,高性能计算(HPC)和人工智能(AI)等技术在多个领域的应用变得日益广泛,芯片
    发表于 09-02 10:09

    大模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    安谋科技异构赋能AI计算,此芯科技首款AI PC芯片发布

    7月30日,此芯科技集团有限公司(以下简称“此芯科技”)AI PC战略暨首款芯片发布会在上海举行,正式推出了其首款专为AI PC打造的异构高能效芯片
    发表于 07-31 14:36 996次阅读
    安谋科技异构<b class='flag-5'>算</b><b class='flag-5'>力</b>赋能<b class='flag-5'>AI</b>计算,此芯科技首款<b class='flag-5'>AI</b> PC<b class='flag-5'>芯片</b><b class='flag-5'>发布</b>

    一图看懂星河AI数据中心网络,全面释放AI时代

    华为中国合作伙伴大会 | 一图看懂星河AI数据中心网络,以网强,全面释放AI时代
    的头像 发表于 03-22 10:28 696次阅读
    一图看懂星河<b class='flag-5'>AI</b>数据中心网络,全面释放<b class='flag-5'>AI</b>时代<b class='flag-5'>算</b><b class='flag-5'>力</b>

    晶晟微纳发布N800超大规模AI芯片测试探针卡

    近日,上海韬盛科技旗下的苏州晶晟微纳宣布推出其最新研发的N800超大规模AI芯片测试探针卡。这款高性能探针卡采用了前沿的嵌入式合金纳米堆叠技术,旨在满足当前超大规模
    的头像 发表于 03-04 13:59 895次阅读

    数据语料库、算法框架和芯片AI大模型中的作用和影响

    数据语料库、算法框架和芯片的确是影响AI大模型发展的三大重要因素。
    的头像 发表于 03-01 09:42 962次阅读

    立足,聚焦AI!顺网科技全面走进AI时代

    “立足,聚焦AI”,顺网科技进军AI时代的号角已被吹响。 1月18日,顺网科技(300113.SZ)以“跃迁·向未来”为主题的战略升
    的头像 发表于 01-19 10:57 437次阅读
    立足<b class='flag-5'>算</b><b class='flag-5'>力</b>,聚焦<b class='flag-5'>AI</b>!顺网科技全面走进<b class='flag-5'>AI</b>智<b class='flag-5'>算</b>时代

    弘信电子与AI服务器合资,助力国产芯片落地

    此外,弘信电子近期在AI业务上取得了突破性进展,这并非源自本土化的积累,而是依赖于团队敏锐的战略眼光和强烈的创新动力。此次投资是弘信电子在AI
    的头像 发表于 12-25 09:30 815次阅读

    浅谈为AI而生的存-体芯片

    大模型爆火之后,存一体获得了更多的关注与机会,其原因之一是因为存一体芯片的裸相比传统架构的AI
    发表于 12-06 15:00 364次阅读
    浅谈为<b class='flag-5'>AI</b>大<b class='flag-5'>算</b><b class='flag-5'>力</b>而生的存<b class='flag-5'>算</b>-体<b class='flag-5'>芯片</b>