0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能最后一公里,Google和英伟达谁能跑得赢?

DPVg_AI_era 来源:lq 2019-05-05 10:46 次阅读

Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。

边缘智能被称作是人工智能的最后一公里。

Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:

英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派嵌入式电脑设备,其搭载了四核Cortex-A57处理器GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。

目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。

Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。

首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。

对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。

对比结果

先来看最终的结果:

线性刻度,FPS

对数刻度,FPS

线性刻度,推理时间(250x)

Sam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。

对比分析

第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。

我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。

NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。

然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。

NVIDIA Jetson Nano

尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:

它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。

来源:NVIDIA

Google Coral Edge TPU

Sam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。

Penny for scale,来源:谷歌

Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。

Google Coral Edge TPU USB加速器

下图显示了Edge TPU的基本原理。

来源:谷歌

像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:

卷积

这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。

我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。

总结

为什么GPU没有8位模型?

GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。

为何选择MobileNetV2?

主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。

Edge TPU还有哪些其他产品?

它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。

Raspberry Pi + Coral与其他人相比

为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口

i7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。

来源:NVIDIA

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    455

    文章

    50816

    浏览量

    423627
  • 人工智能
    +关注

    关注

    1791

    文章

    47279

    浏览量

    238499
  • 英伟达
    +关注

    关注

    22

    文章

    3776

    浏览量

    91104

原文标题:最新千元边缘AI芯片比拼:谷歌Coral和英伟达Jetson谁更厉害?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    软银升级人工智能计算平台,安装4000颗英伟Hopper GPU

    软银公司宣布,其正在扩展的日本顶级人工智能计算平台已安装了约4000颗英伟Hopper GPU。这举措显著提升了平台的计算能力。据悉,该平台自2023年9月开始运行,最初配备了大约
    的头像 发表于 11-04 16:18 437次阅读

    解决验证“最后一公里”的挑战:芯神觉Claryti如何助力提升调试效率

    过程中必不可少的环,它帮助工程师找到问题的根源并进行优化。随着设计复杂性的提升,调试作为验证的“最后一公里”正面临越来越多的挑战。如何有效提升调试效率,已成为行
    的头像 发表于 10-26 08:03 304次阅读
    解决验证“<b class='flag-5'>最后</b><b class='flag-5'>一公里</b>”的挑战:芯神觉Claryti如何助力提升调试效率

    英伟市值飙升,逼近苹果

    。 这一里程碑式的成就,不仅彰显了英伟人工智能领域的深厚积累和卓越贡献,也反映了全球市场对英伟
    的头像 发表于 10-23 09:31 301次阅读

    《AI for Science:人工智能驱动科学创新》第人工智能驱动的科学创新学习心得

    。 5. 展望未来 最后,第章让我对人工智能驱动的科学创新未来充满了期待。随着技术的不断进步和应用场景的拓展,AI将在更多领域发挥关键作用,从基础科学到应用科学,从理论研究到实践应用,都将迎来前所未有
    发表于 10-14 09:12

    英伟利用人工智能和Omniverse加速人形机器人开发

    8月6日,英伟揭晓了项创新工作流程,该流程深度融合了人工智能技术与其Omniverse平台,旨在为人形机器人的研发按下加速键。通过巧妙结合苹果Vision Pro的先进功能与
    的头像 发表于 08-06 17:29 720次阅读

    英伟与戴尔帮助企业创建“人工智能工厂”

    英伟公司首席执行官黄仁勋近日表示,英伟与戴尔科技公司的合作将极大地推动人工智能技术的普及。双方的合作旨在帮助企业和组织建立自己的“
    的头像 发表于 05-22 09:37 382次阅读

    步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    引入英伟机密计算技术,在不影响性能的情况下,增强了大规模实时s生成式人工智能推理的安全性。该架构还具有新的解压缩引擎和用于人工智能预防性维护的可靠性引擎,有助于诊断并预测潜在的可靠
    发表于 05-13 17:16

    Meta将率先使用英伟最新人工智能芯片

    近日,Meta向外媒透露,他们预计将在今年晚些时候收到英伟最新旗舰人工智能芯片的首批出货,这也标志着英伟正式开启了B200芯片的出货之旅
    的头像 发表于 03-22 10:16 564次阅读

    英伟洽谈收购以色列人工智能公司Run:ai

    英伟(NVIDIA)正在与以色列的人工智能基础设施编排和管理平台Run: AI进行深入谈判,商讨收购事宜。
    的头像 发表于 03-20 13:57 639次阅读

    英伟拟收购以色列人工智能初创公司Run:AI

    据最新消息,英伟正在与以色列的人工智能初创公司Run:AI进行深入谈判,计划收购这专注于AI基础设施编排和管理平台的公司。据悉,此笔交易的价值预计将达到数亿美元,甚至有可能攀升至1
    的头像 发表于 03-19 11:25 702次阅读

    孙正义筹集千亿美元,欲挑战英伟,进军人工智能芯片市场 

    关于该项目资助来源以及具体的投资方向仍未最终确定。在此过程中,孙正义始终在寻找扩大Arm在人工智能市场影响力的机会,探索各种先进的芯片研发技术。尽管尚未明确哪家公司将承担主要责任,以应对英伟这个高端
    的头像 发表于 02-18 09:41 575次阅读

    英伟注资聊天机器人制造商Kore.ai,进军人工智能市场

    近年来,英伟与新兴人工智能科技公司展开频繁合作,如Hugging Face、Cohere和Mistral AI。其顶级芯片系统在生成式AI的训练和开发过程中发挥着关键作用。自去年OpenAI推出ChatGPT以来,
    的头像 发表于 01-31 10:02 646次阅读

    英伟推出新款人工智能GPU,瞄准AI笔记本电脑市场

    英伟高级副总裁Jeff Fisher所述,未来人工智能体验将以云端运算和个人计算机计算的融合形式呈现。自从ChatGPT问世以来,众多公司纷纷借助数据中心和云服务培训并部署生成式人工智能
    的头像 发表于 01-11 10:13 716次阅读

    英伟发布三款用于人工智能个人电脑的新芯片

    英伟在2024年国际消费电子展(CES)上发布了三款用于人工智能个人电脑的新芯片,旨在让游戏玩家、设计师和其他电脑用户更轻松地利用人工智能技术,而无需依赖远程互联网服务。
    的头像 发表于 01-10 15:04 889次阅读

    英伟、AMD在2024年继续全力冲刺人工智能加速器市场

    英伟、AMD在2024年继续全力冲刺人工智能(AI)加速器市场。
    的头像 发表于 01-08 17:27 1220次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>、AMD在2024年继续全力冲刺<b class='flag-5'>人工智能</b>加速器市场