0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能将会无处不在,ai处理器领跑人工智能

wg7H_MooreNEWS 来源:未知 作者:龚婷 2018-03-12 10:56 次阅读

经历了十数年的高速发展之后,以智能手机为代表的移动设备开始迈入下半场。大家对新设备的关注重点从过往的多核、RAMROM大小转移到了人工智能、3D游戏和混合现实等新方向上来。这就吸引了包括高通、华为、苹果和联发科等众多移动SoC厂商密锣紧鼓地投入其中。作为全球移动芯片基石的Arm也正在加紧布局,拥抱新时代。

Arm资深市场营销总监Ian Smythe表示,现代人类使用设备的的方式增加了对设备性能的期望值,这就促使Arm达到一个新的愿景——所有人都能够使用这些新技术。这就要求Arm让这些处理器能够胜任各种各样的计算任务,这首先体现在人工智能方面。其实Arm现在在人工方面的表示也不错。根据IDC的调查数据显示,现在市场上有人工智能能力的设备,80%是基于Arm的处理器实现的。但在Ian Smythe看来,这还不够。

Arm的人工智能策略

根据他的看法,人工智能将会无处不在,应用也会多元化,实现人工智能的关键——机器学习往“边缘”转移是一个必然的趋势,因为只有在“边缘”部署,才能解决带宽、功耗、成本、延迟、可靠性和安全等几方面的问题。针对AI的这些特点,Arm升级了他们的AI布局,首先祭出了他们的项目:机器学习运算平台Project Trillium。这是一套包括新的高度可扩展处理器的Arm IP组合,这些产品可以提供增强的机器学习和神经网络功能。

Arm Project Trillium项目

从上图我们可以看出,在Arm的这个项目里,Arm本身的CPUGPU、ML(Machine Learning)和OD(Obeject Detect)处理器,加上合作伙伴的DSPFPGA等加速器IP会是整个项目中最基本的硬件支持。

在中间的软件产品层,Project Trillium提供了专门针对Arm硬件优化的软件库,其中包括了Arm NN、CMSIS-NN、Compute Library和Object Detection Libraries。

在应用方面,项目会对TsensorFlow、Caffe、Caffe2、Mxnet和Android NNAPI等主流框架的支持。

Ian Smythe告诉记者:“Arm Project Trillium提供了相应的接入硬件、软件的框架,并相应地为CPU和GPU提供了针对机器学习的加速,这样开发人员就能更好地基于Arm的所有硬件去进行开发,还能非常方便地获得这些开发框架和一些工具系统”。那就意味着开发者如果要开发一个手机应用,不需要去担心这个手机硬件本身的适配性能问题,只需要关心出来的手机应用的性能是最好的。

举个例子,如果开发人员用的是安卓神经网络的API,那么底层的硬件无论是CPU、GPU还是OD、ML都不重要,因为Project Trillium都能够实现最优的处理器的性能,同时也会提供去访问这些Arm底层硬件处理器的软件库,这样就可以节约开发人员大量的精力。

CPU和GPU是Arm AI芯片先锋

由上可知,底层硬件是Arm人工智能策略的关键,而其实对于这些芯片的应用,Arm方面也有了明确清晰的定位。如应用广泛的CPU和GPU将会是他们的AI芯片先锋。

首先是Cortex-A系列处理器。Ian Smythe表示,经过了多年的迭代,Arm的Cortex-A系列处理器的SIMD性能有了极大的提升,尤其是在引入了DynamIQ技术之后,这系列处理器对人工智能的支持有了质的飞跃。

DynamIQ是Arm公司针对机器学习和人工智能应用,面向新一代Cortex-A处理器推出的技术,不同于之前的多核处理设计,DynamIQ能够对单一计算集群上的大小核进行配置,例如1+3或者1+7的SoC设计配置,而这在过去是不可能的。

Arm DynamIQ的作用

据Arm介绍,第一代采用DynamIQ的Cortex-A系列处理器在优化应用后,能够在未来三到五年内实现比基于Cortex-A73的设备高50倍的人工智能性能,最多可将CPU和SoC上特定硬件加速器的反应速度提升10倍;

同时,SoC设计者还可以在单个集群中最多部署8个核心,而且每一个核心都可以有不同的性能特性。这些先进的能力可以为机器学习和人工智能带去更快的响应速度。全新设计的内存子系统也将实现更快的数据读取和更加高效的节能特性;

另外还能通过对每一个处理器进行独立的频率控制,高效地在不同的任务间切换最合适的处理器,所以能够在严苛的发热限制实现更高的性能。当然还有更安全的自动安全系统,能够让合作伙伴在故障情况下也能实现安全运行。

Arm同时也为Cortex-M系列其引入包括机器学习、内核加速的计算库,也就是CMSIS-NN,这就让这系列的处理器能够很好地支持机器学习的算法

Arm Cortex-A、Cortex-M和GPU对ML的支持

至于Mali-GPU,由于GPU本身的产品特性,让它成为Arm人工智能策略中不可或缺的一部分。作为智能手机领域出货量最大的一系列产品,搭载Mali-GPU的SoC在去年出货总计达到12亿套。高度的客户认同感,驱使Arm更积极地将它推向了人工智能,完善AI芯片布局。

Arm的GPU架构

日前,Arm更是推出了Bifrost架构之下的第二代产品Mali-G52 。作为Arm GPU的新一代架构,全新的Bifrost 针对几大方向做了改良:分别是藉由Claused Shaders 技术,以及基于查表索引的向量着色架构与Wire Light 管线设计所带来的能源效率(Energy Efficiency)提升、结合CCI-550,可让CPU和GPU存取同一快取区块的异构计算(Heterogeneous computing)的一致性最佳化,以及最重要的Vulkan API 支援。这让G52能更好的满足产品的设计要求。

Mali –G52 GPU

据Ian Smythe介绍,这个GPU采用了典型的四核布局,不同于上一代产品的四线程执行引擎,新的GPU将这个数据提高到八线程,因此在复杂的指令方面,就能实现两倍的性能提升;另外,通过添加一些具体的指令,G52能够更好地支持机器学习,在性能方面也有了更大的改善。这样的提升势必会给中端设备带来非常高质量的表现。

Mali G52出色的机器学习性能

从测试结果也看到,G52较上一代提高了30%的性能密度,能效提高了15%,机器学习性能更是上一代的3.6倍。

ML和OD处理器是重要组成部分

除了CPU和GPU,Arm AI芯片库里还有ML和OD处理器这两个重要部分。在前面介绍Project Trillium的时候,我们曾经提到了这两个产品。这一段里,我们会深入探讨Arm对这两个芯片的期望。

其实关于Arm 的AI芯片,市场上有很多说法,最多的是在大家都在争先恐后拥有人工智能,华为甚至在Kirin 970中引入了寒武纪的NPU芯片,作为智能手机芯片的最大IP供应商的Arm似乎无动于衷,但随着Project Trillium的公布,Arm的专门AI芯片终于揭开了其神秘面纱。

Ian Smythe告诉记者,ML和OD处理器是Arm公司从零开始的设计。与CPU和GPU相比,他们的性能和效率有了大幅的提升;另外,Arm还很有想法地加入DSP的功能。这让这两系列处理器非常适合于机器学习。首先我们先来了解一下ML处理器。

据Arm方面介绍,这个全新架构的处理器是7nm工艺下实现的,拥有非常高的性能性能密度,能够实现每平方毫米多达4.6万亿次的计算能力。这款处理器将会在2018年中,通过合作伙伴推向市场。

Arm ML处理器

OD处理器则是Arm AI芯片领域的另一个关注点。这是Arm公司基于2016年收购的Apical公司的技术开发的第二代产品。后者作为影像处理与嵌入式机器视觉技术市场的绝对专家,让我们坚信Arm OD处理器的实力。

Arm OD处理器

Ian Smythe指出,新一代的OD处理器能够实现非常高速的目标检测:在每秒钟可以实现无限次数量的帧的鉴别,这样就可以以非常搞的速度去检测丰富的内容。

比如说我们可以想象一个场景,在这个场景中OD处理器能以60FPS的速度,在全高清的环境下实时识别无限数量的物体,并找到这个识别目标物体的原数据,然后把原数据发给下一个要进行处理的处理器。

如果我们把Arm机器学习处理器和目标检测处理器合起来用,必然能很好地提升计算机的视觉能力。

更多的多媒体套件辅助

对于Arm包括AI在内的很多应用,想显示出来,就必须要有更好的多媒体条件支持,而Arm本身就是这样一个角色。在CPU、GPU和AI芯片之外,Arm还有DPU和VPU这样的产品,他们将是将Arm产品性能结果展示到用户面前的一个重要桥梁,Arm在日前也对其做了更新,首先就是Mali-D51。

Arm的多媒体套件赋能下一代技术

据介绍,Mali-D51是第一款基于Komeda架构构建的主流显示处理器,拥有2017年出品的高端显示处理器Mali-D71的众多优势,并将之整合至迄今为止Arm旗下最小的DPU上。,实现的性能包括:

与上一代的Mali-DP650相比较,D51实现了两倍的面积效率,30%的系统功耗额,内存延迟也降低了50%;场景复杂度也加倍,还与Mali-D71一样支持8层图像处理能力。Ian Smythe表示,经过全面优化,D51可与Mali多媒体套件中的其他IP无缝协作,结合Assertive Display 5技术使用,甚至可将HDR(高动态范围图像)带入主流设备;结合CoreLink MMU-600,可提升系统内存管理效率。

Arm的显示解决方案

视频处理器V52则是Arm的另一个高质量产品。与上一代的V61相比,V52在每一个核的解码性能是翻了一番,能够实现了4K,每秒30帧的高画质显示支持;在硅面积方面,与V61相比,同样实现4K60显示的情况下,V52的硅面积与后者相比,减少了38%。

而在解码质量方面,V52同样也有了20%的提升。换句话说,就是在达到同样的图像质量的前提之下,在比特数上面V52能够减少20%。对于一些非常关键的应用,比如说视频会议而言,如果带宽条件有限的话,其实这种更少的比特数是非常关键的。

这颗芯片能支持现在市面上包括HEVC、VP9、VP8、H.264、AVS+、Legacy在内的几乎所有标准。能够满足越来越多4K内容制作需求。

在GPU方面,Arm还带来了全新的G31。这是他们Bifrost架构家族中,G30系列的第一款GPU。主要是针对可能低端配置的智能手机和数字电视应用。它的总硅面积降低了20%,在性能密度上有20%的提高,同时在UI的性能方面有12%的提升。

这款产品具备可配置性的特点,让开发者在执行引擎方面,可以选择一个或者是两个;同时在显示时钟也可以配置每个是一个像素还是两个像素。据介绍,这款极小的GPU还能够以极低的成本支持OpenGL ES3.2和Vulkan,这势必将帮助开发者在低端产品里实现更高的性能。

在Arm这些的产品赋能下,一个全新的科技世界即将到来,你准备好迎接了吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30894

    浏览量

    269084
  • 人工智能
    +关注

    关注

    1791

    文章

    47279

    浏览量

    238486
  • AI处理器
    +关注

    关注

    0

    文章

    92

    浏览量

    9491

原文标题:AI处理器领衔,Arm全面赋能未来科技

文章出处:【微信号:MooreNEWS,微信公众号:摩尔芯闻】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    嵌入式和人工智能究竟是什么关系?

    、连接主义和深度学习等不同的阶段。目前,人工智能已经广泛应用于各种领域,如自然语言处理、计算机视觉、智能推荐等。 嵌入式系统和人工智能在许多方面都存在密切的关联性。首先,嵌入式系统可
    发表于 11-14 16:39

    AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    不仅提高了能源的生产效率和管理水平,还为未来的可持续发展提供了有力保障。随着技术的不断进步和应用场景的不断拓展,人工智能将在能源科学领域发挥更加重要的作用。 总结 《AI for Science:人工智能
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    农业、环保等,为人类社会的可持续发展做出贡献。 总结 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们展示了一个充满希望和机遇的未来。在这个未来中,
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量
    发表于 10-14 09:12

    risc-v在人工智能图像处理应用前景分析

    、RISC-V在人工智能图像处理中的应用案例 目前,已有多个案例展示了RISC-V在人工智能图像处理中的应用潜力。例如: Esperanto技术公司 :该公司制造的首款高性能RISC-
    发表于 09-28 11:00

    人工智能ai 数电 模电 模拟集成电路原理 电路分析

    人工智能ai 数电 模电 模拟集成电路原理 电路分析 想问下哪些比较容易学 不过好像都是要学的
    发表于 09-26 15:24

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟
    发表于 09-09 15:36

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    ! 《AI for Science:人工智能驱动科学创新》 这本书便将为读者徐徐展开AI for Science的美丽图景,与大家一起去了解: 人工智能究竟帮科学家做了什么?
    发表于 09-09 13:54

    人工智能技术跃进:英特尔引领AI无处不在新纪元

    人工智能AI)技术日新月异的今天,从机器学习的初步探索到深度学习的广泛应用,再到如今生成式AI的蓬勃兴起,每一步都标志着AI向“无处不在
    的头像 发表于 09-04 14:59 609次阅读

    报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI

    8月28日至30日,2024深圳(国际)通用人工智能大会暨深圳(国际)通用人工智能产业博览会将在深圳国际会展中心(宝安)举办。大会以“魅力AI·无限未来”为主题,致力于打造全球通用人工智能
    发表于 08-22 15:00

    FPGA在人工智能中的应用有哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 一、深度学习加速 训练和推理过程加速:FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性
    发表于 07-29 17:05

    人工智能的工作原理和特点

    在科技日新月异的今天,人工智能(Artificial Intelligence,简称AI)已成为一个炙手可热的话题。从智能家居到自动驾驶,从医疗诊断到金融服务,人工智能的身影
    的头像 发表于 07-01 11:39 1343次阅读

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V2)

    ://t.elecfans.com/v/27185.html *附件:语音对话机器人案例.pdf 人工智能 AI泛边缘:智能安防实训 31分38秒 https://t.elecfans.com/v/25509.html
    发表于 05-10 16:46

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V1)

    机器人案例.pdf 人工智能 AI泛边缘:智能安防实训 31分38秒 https://t.elecfans.com/v/25509.html *附件:泛边缘案例课.pdf 人工智能
    发表于 04-01 10:40

    嵌入式人工智能的就业方向有哪些?

    。 国内外科技巨头纷纷争先入局,在微软、谷歌、苹果、脸书等积极布局人工智能的同时,国内的BAT、华为、小米等科技公司也相继切入到嵌入式人工智能的赛道。那么嵌入式AI可就业的方向有哪些呢? 嵌入式
    发表于 02-26 10:17