0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为推出全球最快AI训练集群Atlas 900,计算产业战略全公布

章鹰观察 来源:华为微信号 作者:华为 2019-09-18 14:50 次阅读

9月18日上午消息,2019华为全联接大会于9月18-20日举行,华为轮值董事长胡厚崑在会上发表题为《共创智能新高度》的演讲。华为在会上首次发布了计算战略,基于架构创新、投资全场景处理器族、有所为有所不为的商业策略、构建开放生态进行布局。同时,华为发布了全球全球最快AI训练集群Atlas 900,加速科学研究与商业创新的智能化进程。

发布计算战略 投入15亿美元构建开放生态

华为此前提出了新的愿景:构建万物互联的智能世界。胡厚崑表示,智能世界的构建有两大关键技术:联接与计算。华为对计算的投入已经超过10年,未来也必须持续投入。

从大型机、PC、手机、可穿戴设备,计算已经成为人类能力的延伸,计算能力的提升成为人类能力提升密不可分的一部分。而计算模式不断演进:从基于规则的计算(CPU),到基于统计的计算(NPU)。

华为轮值董事长胡厚崑分享了华为在计算方面的洞察和战略。胡厚崑认为,未来基于统计的计算将成为主流,未来五年其算力将占社会算力的80%以上。这意味着计算已经进入智能时代:暴力计算、计算无处不在、端边云协同。

2万亿美元的计算产业和华为战略布局

未来十年也将是计算产业的黄金十年,他援引Gartner数据称,计算产业会是个每年2万亿美元的大蓝海。在计算的智能时代,我们认为有三个重要特征。

第一个特征,需要超强的算力。统计计算本身就是一种暴力计算,高度依赖于算力。举个例子,为了让计算机认识一只猫,就需要数百万图片的训练,这对算力的消耗是非常惊人的,面向自动驾驶、天文探索、气象预测等更复杂场景,对算力的需求将会更大。

第二个特征,计算和智能将会无处不在,而不仅仅是分布在中心侧。从中心节点的暴力计算,到边缘侧的专业计算,如基因测序,以及端侧的个性计算,如耳机、手机,一起构成了未来智能时代的计算形态。

第三个特征,端边云之间需要高效的协同。中心侧负责通用模型的计算,为端侧的个性化计算和边缘侧的专业化计算,提供协同支撑。

华为坚定不移地投入计算产业,我们主要从四个方面来布局,包括对架构创新的突破、对全场景处理器族的投资,坚持有所为有所不为的商业策略,以及不遗余力地构建开放生态。

架构创新

从我们前面的洞察来看,未来计算无处不在、智能无所不及,这其中算力是关键基础。

而目前产业界算力供给却是稀缺的,算力供给的关键在于处理器的效能,当前摩尔定律已经几乎走到极限的时候,从产业发展角度,我们必须要在处理器架构上寻求突破,要用新的处理器架构来匹配算力的增速。

另一方面,从华为自身的业务布局来看,既有网络业务,也有终端业务,又涉及公有云服务,全面覆盖端、边、云,所以全场景智能,本身就是华为业务智能化的基本需求。

因此,我们推出了达芬奇架构,以实现计算和智能的无处不在,这是自然而然的选择。到目前为止,达芬奇计算架构是业界唯一能够覆盖“端、边、云”全场景的处理器架构,这也是华为打造计算产业的坚实基础。

投资全场景处理器

处理器是整个计算产业最基础的部分,经过多年投资努力,华为已经发布了多个系列的处理器。

具体包括支持通用计算的鲲鹏系列,支持AI的昇腾系列,支持智能终端的麒麟系列,以及支持智慧屏的鸿鹄系列。未来将持续不断地对处理器进行投资,将来还将推出一系列处理器,面向更多的场景。

商业策略“有所为有所不为”

我们的商业策略,用一句话概括就是“有所为有所不为”。总体而言,我们不直接对外销售处理器,以云服务面向客户,以部件为主面向合作伙伴,优先支持合作伙伴发展整机。具体来说,我们有三个方面的考虑:

1、硬件开放:我们把服务器主板、AI模组和板卡等硬件开放给伙伴,帮助伙伴做好整机和解决方案。

2、软件开源:我们把服务器操作系统、数据库、AI开发框架等软件开源,帮助伙伴做好商用版本,让软件开发更简单。

3、使能应用开发和迁移:我们不做应用,但我们提供工具和团队,帮助伙伴更高效地做好应用开发和迁移。

我们希望通过这样一种“有所为有所为不为”的商业策略,来更好地支持我们的伙伴。

构建开放生态

最后,计算产业是个开放的产业,高度依赖于生态,需要全球的协作。

2015年,华为首次发布了沃土计划,在过去的四年以来,我们进展非常顺利,已经发展了130多万开发者和14000多家ISV。

今天,我们将升级沃土计划,继续投入15亿美元,使开发者的规模扩大到500万人,使能全球合作伙伴发展应用及解决方案,在本次大会的第三天,我的同事将会发布详细的计划。

通用计算业务策略

在通用计算领域,我们投资鲲鹏系列,打造有竞争力的通用计算处理器。

在此基础上,我们还在持续不断地对板卡、服务器、操作系统、数据库、编译器等关键技术和产品进行投资,希望通过强力投资,打通生态全链条,让我们的合作伙伴更有信心、更坚定地参与打造鲲鹏产业。

我们也正在联合伙伴们打造鲲鹏产业生态基地。

我们与各地的政府、合作伙伴一起,结合当地的优势,打造鲲鹏计算产业的创新基地和孵化平台。以平台为载体,聚合生态伙伴,开展应用示范,培养产业人才,孵化产业标准。

目前工作开展非常顺利,我们已经在北京、上海、深圳等城市开始实施落地,预计未来将会有更多的合作伙伴,加入我们的行列。

AI计算:全栈全场景AI解决方案全面落地

去年全联接大会上,华为发布了全栈全场景的AI解决方案,坦率地讲,当时我们只交付了用于推理的昇腾310处理器和ModelArts应用开发平台。

今年,我们的用于训练的昇腾处理器和AI计算框架MindSpore都已经发布了。至此,华为的全栈全场景AI解决方案全面落地,大家可以放心地和我们来开展合作。

发布Atlas 900:全球最快的AI训练集群

今天,我们将发布一款重量级的产品——Atlas 900,这款产品汇聚了华为几十年的技术沉淀,是当前全球最快的AI训练集群,由数千颗昇腾处理器组成。

在衡量AI计算能力的金标准ResNet-50模型训练中,Atlas 900只用了59.8秒就完成了训练,这比原来的世界记录还快了10秒。这是什么概念?相当于短跑冠军跑完终点,喝完一瓶水才等到第二名。

我们相信Atlas 900的强大算力,可广泛应用于科学研究和商业创新。比如天文探索、石油勘探等领域,都需要进行庞大的数据计算和处理,原来可能花费好几个月的工作,现在交给Atlas 900,就是几秒钟的事情。

以下是一张南半球的星空图,这张图上有20万颗星星,用人眼是看不见这么多星星的,这些画面来自于SKA射电望远镜的数据。

当前条件下,天文学家要从这20万颗星星中,找出某种特征的星体,相当困难,一个天文学家需要耗费169天的工作量,才能完成这项工作。现在用上Atlas 900,只用10秒,就从20万颗星星中检索出了相应特征的星体。

发布基于昇腾的华为云EI集群服务

为了让大家马上就能用上Atlas 900的超强算力,我们已经把它部署到华为云上,并以极优惠的价格向全球科研机构和大学开放,欢迎大家申请使用。

本文来自华为微信号,本文作为转载分享。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    216

    文章

    34440

    浏览量

    251766
  • 算力
    +关注

    关注

    1

    文章

    977

    浏览量

    14822
收藏 人收藏

    评论

    相关推荐

    国产千卡GPU集群完成大模型训练测试,极具高兼容性和稳定性

    集群的方式成为了必然的选择。   2023年底,摩尔线程推出首个全国产千卡千亿模型训练平台“摩尔线程KUAE智算中心”。摩尔线程相关负责人此前谈到,百卡或更小规模都是实验性的,千卡才是大集群
    的头像 发表于 06-11 07:50 3292次阅读
    国产千卡GPU<b class='flag-5'>集群</b>完成大模型<b class='flag-5'>训练</b>测试,极具高兼容性和稳定性

    GPU是如何训练AI大模型的

    AI模型的训练过程中,大量的计算工作集中在矩阵乘法、向量加法和激活函数等运算上。这些运算正是GPU所擅长的。接下来,AI部落小编带您了解GPU是如何
    的头像 发表于 12-19 17:54 126次阅读

    华迅光通AI计算加速800G光模块部署

    ,都需要更多的光模块来进行光纤通信。对于使用gpu的广泛AI训练应用,在NVIDIA的DGX H100服务器中,集成了8个H100 gpu,对计算和存储网络的需求相当于大约12个800G光模块和18个
    发表于 11-13 10:16

    华为AI解决方案加速超宽带产业创新

    华为UBBF 2024第十届全球超宽带高峰论坛期间,华为常务董事、ICT基础设施业务管理委员会主任汪涛发表了“AI加速超宽带产业创新,共赢
    的头像 发表于 11-01 15:03 331次阅读

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算

    、超大规模的 AI 工厂提供卓越性能而设计的 RDMA(Remote Direct Memory Access)网络。   Colossus 是世界上最大的 AI 超级计算机,目前正被用于训练
    发表于 10-30 09:33 153次阅读
    NVIDIA 以太网加速 xAI 构建的<b class='flag-5'>全球</b>最大 <b class='flag-5'>AI</b> 超级<b class='flag-5'>计算</b>机

    Supermicro推出面向AI数据中心的液冷超级集群

    Supermicro, Inc.,作为人工智能(AI)、云端、存储和5G/Edge领域的整体IT解决方案提供商,近日宣布推出面向人工智能数据中心的液冷超级集群。该集群由英伟达GB200
    的头像 发表于 10-22 17:37 495次阅读

    马斯克官宣超级AI训练集群Colossus上线

    特斯拉CEO埃隆·马斯克引领的科技巨浪再添新章,其倾力打造的超级AI训练集群Colossus已正式投入运营。该集群自7月初步建成以来,已展现出惊人的10万张H100 GPU算力。而今
    的头像 发表于 09-04 16:13 385次阅读

    马斯克宣布开始在“全球最大AI训练集群”上训练

    训练项目,这一壮举被马斯克本人誉为“全球最强大的AI训练集群”,标志着人工智能算力竞赛进入了一个全新的纪元。
    的头像 发表于 07-23 17:44 645次阅读

    摩尔线程与师者AI携手完成70亿参数教育AI大模型训练测试

    近日,国内知名的GPU制造商摩尔线程与学科教育AI大模型“师者AI”联合宣布,双方已成功完成了一项重要的大模型训练测试。此次测试依托摩尔线程夸娥(KUAE)千卡智算
    的头像 发表于 06-14 16:31 583次阅读

    技嘉科技推出GIGABYTE AI TOP,引领本地AI训练新纪元

    技嘉科技在COMPUTEX 2024前夕推出GIGABYTE AI TOP,引领本地AI训练新纪元   在即将到来的COMPUTEX 2024科技盛会前夕,
    的头像 发表于 06-11 14:11 914次阅读

    万卡集群解决大模型训算力需求,建设面临哪些挑战

      电子发烧友网报道(文/李弯弯)万卡集群是指由一万张及以上的加速卡(包括GPU、TPU及其他专用AI加速芯片)组成的高性能计算系统,主要用于加速人工智能模型的训练和推理过程。这种
    的头像 发表于 06-02 06:18 4746次阅读
    万卡<b class='flag-5'>集群</b>解决大模型训算力需求,建设面临哪些挑战

    商汤SenseChat大模型成功通过与华为Atlas服务器的相互兼容性测试

    近日,经华为综合评测,SenseCore商汤大装置AI云、商汤日日新·商量SenseChat大语言模型成功通过与华为Atlas系列服务器的相互兼容性测试,获得HUAWEI COMPAT
    的头像 发表于 03-22 13:38 679次阅读
    商汤SenseChat大模型成功通过与<b class='flag-5'>华为</b><b class='flag-5'>Atlas</b>服务器的相互兼容性测试

    韩国拟建全球最大半导体产业集群

    韩国政府近日宣布了一项宏伟的计划,拟在首尔南部建设一个名为“半导体巨型集群”的产业园区。这个园区将成为全球最大的半导体产业集群,推动三星电子
    的头像 发表于 01-22 15:06 863次阅读

    软通动力与华为强强联手推动AI技术发展

    近日,软通动力天璇MaaS平台2.0与华为的两大旗舰服务器——昇腾Atlas 800训练服务器(型号:9000)和Atlas 800推理服务器(型号:3000)——成功完成兼容性测试。
    的头像 发表于 01-05 15:06 755次阅读

    软通天璇MaaS平台2.0与华为昇腾AI完成兼容性测试认证

    近日,软通动力天璇MaaS平台2.0与华为昇腾Atlas 800训练服务器(型号:9000)、Atlas 800推理服务器(型号:3000)完成并通过相互兼容性测试认证。测试期间整体运
    的头像 发表于 01-05 11:41 912次阅读