0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

揭秘Arm人工智能战略:不仅CPU/GPU会支持,还有独立的AI产品线

cMdW_icsmart 来源:未知 作者:邓佳佳 2018-03-22 16:05 次阅读

随着智能手机需要处理的内容变得日益复杂,用户对当今主流和入门级移动设备的要求已越来越高。而人工智能技术的日益成熟,以及边缘计算的兴起,使得人工智能成为了提升智能手机体验的重要法宝。目前众多的高端智能手机都已经开始引入人工智能技术。去年,华为、苹果等厂商都推出了集成人工智能核心的手机处理器,而作为全球最大的移动芯片IP提供商,Arm自去年以来也在不断的加码人工智能。

日前,Arm正式发布了全新的DynamIQ技术,加入了针对人工智能的指令集和优化库,ARMV8.2版本的指令集开始支持神经网路卷积运算,极大的提升人工智能和机器学习的效率。随后在去年5月底,Arm发布了首款DynamIQ技术处理器Cortex-A75/A55。今年2月下旬,Arm又宣布了针对人工智能的ProjectTrillium项目,推出了多款独立的人工智能IP。

Arm在北京召开2018全球技术发布会,再次详细介绍了ProjectTrillium项目,同时Arm还正式发布了全新的面向主流市场的图形处理器Mali-G52,以及面向入门级的Mali-G31。特别值得一提的是,Mali-G52还首次加入了对于机器学习的支持,进一步加码人工智能。而且新的IP套件可与现有基于DynamIQ的CPU和其他Arm IP无缝集成。

ProjectTrillium:全新人工智能IP

ProjectTrillium是今年2月Arm公布的针对人工智能的Arm IP 套件。包括了全新的机器学习处理器IP、目标检测处理器IP和神经网络软件库。

得益于终端侧人工智能市场的快速增长,以及ARM在移动及物联网市场的巨大优势,ProjectTrillium项目目前主要针对的也是移动终端和物联网设备。

1、全新架构的机器学习处理器IP

根据Arm及研究机构的预计,到 2028 年,移动设备的数量将从现在的17亿台增长到 22 亿台,智能IP Camera将由现在的1.6亿台增长到13亿台。在终端侧具有人工智能的设备将会由现在的3亿台增长到32亿台。足见人工智能市场增长之迅速。而Arm的机器学习处理器IP的推出则是顺应了市场对于专用的人工智能加速芯片的需求。

据介绍,Arm的机器学习处理器IP依托于Arm多年的研究成果,采用的是全新的架构,可以为其CPU和GPU遇到的挑战提供解决方案。该架构还为16位整数运算进行了优化。

根据Arm公布的数据显示,其机器学习处理器IP的性能最高可以达到每平方毫米(芯片面积)超过4.6 TOPs的性能,而且在实际应用中,结合系统及应用优化,可以实现2-4倍提升。

那么Arm的机器学习处理器的4.6 TOPs/平方毫米的性能属于一个什么水平呢?我们拿华为麒麟970所集成的NPU来比较一下。

据华为介绍,麒麟970集成的NPU专用硬件处理单元,设计了HiAI移动计算架构,其AI性能密度大幅优于CPU和GPU。相较于四个Cortex-A73核心,处理相同AI任务,新的异构计算架构拥有约50倍能效,以及25倍性能优势,面积只有CPU的1/2,运算能力达到了1.92TOPs。

根据Arm的资料显示,Cortex-A73是采用ARMv8-A架构中核心最小的处理器,每核心面积在0.65平方毫米。四个Cortex-A73核心,面积至少应该是2.6平方毫米。那么华为麒麟970的NPU的面积应该是在1.3平方毫米左右。换算下来,麒麟970的NPU每平方毫米的性能约为1.48 TOPs。也就是说,Arm新推出的机器学习处理器IP的单位面积性能可能达到麒麟970的NPU的4倍,确实非常的强悍。

另外,对于移动设备和一些物联网设备,能效也是非常重要的,Arm的机器学习处理器IP在能效上可以实现3 TOPs/W,Arm认为3 TOPs/W将是移动AI芯片的一个“甜蜜点”。

在Arm看来,其目前的主要优势还是在移动市场,而且现在很多AI创新都是从移动端发生的。另外,Arm的业务模式主要是进行IP授权,这就需要体量比较大的市场来支撑,显然目前移动市场对于人工智能的需求量最最为庞大的。所以Arm的人工智能处理器会先从移动市场进行切入。

根据Arm的机器学习处理器的路线图也显示,移动市场将会是Arm的机器学习处理器首先切入的市场。Arm透露,其首款针对移动市场的机器学习处理器IP将会在2018年年中推向市场。

另外,Arm也表示,其机器学习处理器IP是具有高可扩展性、兼容性和可编程的,可以提供计算性能最低从2 GOPs到超过70 TOPs的产品。除了移动市场之外,Arm的机器学习处理器IP也将会开始向物联网、工业、汽车、网络以及服务器市场进军。

2、第二代的目标检测处理器

除了首次推出的机器学习处理器IP之外,Arm此次还针对安防监控市场带来了其第二代的目标检测处理器。其实早在2016年Arm就推出了其首款目标检测处理器Spirit,随后被其2016年收购的计算机视觉和图像处理器的公司Apical(其产品覆盖超过15亿设备)所采用,随后广泛的用于英国智能家居品牌Hive安防摄像头当中。如果说,Arm此前推出的目标检测处理器Spirit是一次试水,那么这次的第二代的目标检测处理器产品则将是Arm全面进军安防监控市场的开始。

根据Arm公布的数据显示,其第二代目标检测处理器可以支持全高清画质下60fps实时检测,支持50×60像素以上的无限数量的目标检测。其还提供了详细的人体模型提供了丰富的源数据,使人脸、方向、轨迹、姿势和动作检测成为可能。

Arm表示,其还可提供集成解决方案,采用其机器学习处理器+目标检测处理器,可以更高效的实现比如人脸、物体识别等应用。在实时目标识别任务中,目标检测处理器会首先分离出区域,比如人脸、物体。这样,机器学习处理器就能够分析更少的像素,以实现更快、更精细的结果。

3、神经网络软件库

Arm的神经网络库包括:CMSIS-NN,Compute Library和Object DetectionLibraries。

CMSIS-NN是Arm提供的神经网络推理运算库,根据Arm此前的数据,其对于运行时间/吞吐量将会有4.6倍的提升,而对于能效将有4.9倍的提升;Arm Compute Library是Arm公司去年发布的开源工具,旨在为图像/视频/多媒体/计算机视觉等领域的开发者提供Arm平台的硬件加速库;Object DetectionLibraries则是Arm针对其目前检测处理器的目标检测库。

据介绍,Arm的神经网络库可支持主流的神经网络框架,如TensorFlow、Caffe/Caffe2、mxnet等。此外,Arm的神经网络库还针对 Arm Cortex CPU、Mali GPU 和新的机器学习处理器和目标检测处理器进行了优化。通过以上这些主流框架,开发者可以轻松调用Arm的神经网络库API,从而发挥出Arm的AI/ML硬件IP的性能。

Mali-G52发布,Arm GPU首次加入了对于机器学习的支持

在3月6日的发布会上,Arm发布了两款全新的GPU产品:针对中端市场Mali-G52和针对入门级市场的Mali-G31。

其中,Mali G31是基于Arm此前只用于中高端产品线当中的Bifrost架构,是Arm目前最小的GPU,还加入了对于Vulkan的支持。可以说Mali-G31的推出是Arm首次将之前一些中高端产品的能力开始引入到入门级产品当中。

而Mali-G52则是Mali-G51的升级产品,不仅可从容应对更高的图形复杂度,允许在主流移动系统的功率和带宽限制内实现更多的机器学习功能。

根据Arm的资料显示,Mali-G52由于采用了更宽的执行引擎,相比前代产品的4线程,Mali-G52最多可提供8线程,可在相同芯片面积上,提供更高的图形性能,性能密度相对于Mali-G51提高了30%。另外,在能效方面,Mali-G52也提高了15%。这里需要指出的是,Mali-G52的面积是G51的1.2倍。

当然,更为值得关注的是Mali-G52首次加入了对于INT8数据类型的支持,再加上Mali-G52的执行引擎增加到了8个,使得其可以更加高效的进行进行针对人工智能的运算。

我们都知道,相对于CPU来说,采用GPU来做AI运算效率会更高一些。所以,我们看到Nvidia的人工智能计算卡主要也是基于GPU来运算的。

根据Arm公布的数据显示,与Mali-G51相比,在图形识别能力方面,Mali-G52的性能提升了3.6倍,在Yolonetwork卷积性能测试当中,性能提升了3.5倍。

近年来随着Arm GPU产品线的越来越强大,目前Arm的Mali系列GPU已经成为全球出货最多的GPU。根据资料显示,2017年Arm的Mali系列GPU出货超过12亿颗。随着此次,Arm首次使得其Mali-G52 GPU开始支持机器学习,相信后续将会有更多的新的Arm GPU也将会支持。

据了解,今年年中,Mali-G52 GPU就将会推向市场。

将人工智能带入到每一个设备当中

Arm认为机器学习正变得日益普及,可跨越多个设备,触达每一位用户。而Arm的愿景则是让将机器学习在更多智能设备中普及。

目前一些高端智能设备当中的人脸识别、物体识别、指纹识别、用户习惯学习等应用都有用到机器学习,有些厂商还在SoC上配置了独立的人工智能处理器来进行加速。但是对于目前的主流智能手机市场来说,都配备专门的人工智能处理器并不实际,所以这些任务可以交给SoC上的其他单元来进行 ,比如DynamIQ CPU和Mali-G52 GPU,以提升现有应用的机器学习性能。

Arm资深市场营销总监Ian Smythe先生也在会上表示:“对终端设备而言,支持丰富的多层用户界面以及一系列广泛的最新应用已成为必然趋势。更为重要的是,机器学习不再是高端智能手机的专有配置。各级用户都希望轻松使用配备机器学习功能的各类APP应用。”

当然,对于需要用到专用的人工智能处理器的设备和市场,Arm此次也推出了ProjectTrillium项目,推出了专用的独立的机器学习处理器IP和目标检测处理器IP。并且,Arm的机器学习和目标检测处理器IP是具有高可扩展性、兼容性和可编程的,可以覆盖更为广泛的市场。

另外值得一提的是,Arm此次推出的新的ProjectTrillium项目的IP套件可与现有基于DynamIQ的CPU、Mali-G52 GPU和其他Arm IP无缝集成。

根据IDC的研究数据显示,目前90%的具有人工智能能力的设备都是基于Arm的(主要是基于ARM的CPU/GPU)。而随着Arm将人工智能的能力带入其GPU产品,以及ProjectTrillium项目的推出,再加上去年就推出的针对人工智能优化的DynamIQ CPU,未来这一比例可能将进一步提升。

显然,从前面的一系列介绍,我们不难看出,现在的Arm已经开始全面拥抱AI,并希望通过AI获取更大的市场份额。

得益于Arm在移动CPU及GPU市场的领先地位和生态优势,随着ProjectTrillium的推出,Arm的人工智能IP或将成为Arm一条全新的产品线,而且随着人工智能在终端侧的快速发展,未来其有望成为与Cortex系列CPU、Mali系列多媒体IP并驾齐驱的第三大产品线。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9104

    浏览量

    367782
  • AI
    AI
    +关注

    关注

    87

    文章

    30993

    浏览量

    269278
  • 人工智能
    +关注

    关注

    1791

    文章

    47350

    浏览量

    238741

原文标题:揭秘Arm人工智能战略:不仅CPU/GPU会支持,还有独立的AI产品线!

文章出处:【微信号:icsmart,微信公众号:芯智讯】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    嵌入式和人工智能究竟是什么关系?

    学习和更新提供了可能,从而使人工智能应用能够不断适应和优化。 总的来说,嵌入式系统在人工智能中的作用不容忽视。它不仅为人工智能硬件加速提供了强大的支持,还在边缘计算、物联网以及算法优
    发表于 11-14 16:39

    AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得一好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应用。这一章详细
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    很幸运社区给我一个阅读此书的机会,感谢平台。 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们揭示了人工智能技术在生命科学领域中的广泛应用和
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    非常高兴本周末收到一本新书,也非常感谢平台提供阅读机会。 这是一本挺好的书,包装精美,内容详实,干活满满。 关于《AI for Science:人工智能驱动科学创新》第二章“AI
    发表于 10-14 09:16

    AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据,发现传统方法难以捕捉的模式和规律。这不仅
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    、RISC-V在人工智能图像处理中的应用案例 目前,已有多个案例展示了RISC-V在人工智能图像处理中的应用潜力。例如: Esperanto技术公司 :该公司制造的首款高性能RISC-V AI处理器旨在
    发表于 09-28 11:00

    人工智能ai 数电 模电 模拟集成电路原理 电路分析

    人工智能ai 数电 模电 模拟集成电路原理 电路分析 想问下哪些比较容易学 不过好像都是要学的
    发表于 09-26 15:24

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟
    发表于 09-09 15:36

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    ! 《AI for Science:人工智能驱动科学创新》 这本书便将为读者徐徐展开AI for Science的美丽图景,与大家一起去了解: 人工智能究竟帮科学家做了什么?
    发表于 09-09 13:54

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    8月28日至30日,2024深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会将在深圳国际会展中心(宝安)举办。大会以“魅力AI·无限未来”为主题,致力于打造全球通用人工智能
    发表于 08-22 15:00

    Marvell推出新的 Alaska P PCIe Retimer产品线

    新的 Alaska P PCIe Retimer产品线基于 Marvell 行业领先的 5nm PAM4 技术构建,可扩展人工智能加速器、GPUCPU 和服务器内其他组件之间的连接。
    的头像 发表于 07-11 16:02 1011次阅读

    Arm人工智能提供新设计和软件

    近日,全球知名的半导体IP供应商Arm公布了全新的芯片蓝图和软件工具,旨在显著提升智能手机处理人工智能任务的能力。这一创新举措不仅优化了中央处理器(
    的头像 发表于 05-30 14:45 518次阅读

    为什么跑AI往往用GPU而不是CPU

    今天,人工智能AI)已经在各个领域遍地开花,无论身处哪个行业,使用AI来帮助获取业务洞察,并建立竞争优势,已经非常常见。不过一个有趣的现象是,在用户采购AI基础设施时,几乎所有厂商都
    的头像 发表于 04-24 08:27 1923次阅读
    为什么跑<b class='flag-5'>AI</b>往往用<b class='flag-5'>GPU</b>而不是<b class='flag-5'>CPU</b>?

    AI训练,为什么需要GPU

    随着由ChatGPT引发的人工智能热潮,GPU成为了AI大模型训练平台的基石,甚至是决定性的算力底座。为什么GPU能力压CPU,成为炙手可热
    的头像 发表于 04-24 08:05 1075次阅读
    <b class='flag-5'>AI</b>训练,为什么需要<b class='flag-5'>GPU</b>?

    嵌入式人工智能的就业方向有哪些?

    。 国内外科技巨头纷纷争先入局,在微软、谷歌、苹果、脸书等积极布局人工智能的同时,国内的BAT、华为、小米等科技公司也相继切入到嵌入式人工智能的赛道。那么嵌入式AI可就业的方向有哪些呢? 嵌入式
    发表于 02-26 10:17