0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能芯片与传统芯片有何区别

JIWa_melux_net 来源:未知 作者:胡薇 2018-06-20 16:33 次阅读

作为AI芯片两大领域的交差点,AI芯片已经成了最热门的投资领域,各种AI芯片如雨后春笋冒出来,但是AI芯片领域生存环境恶劣,能活下来的企业将是凤毛麟角。

谷歌在I/O大会发布了其第三代TPU,并宣称其性能比去年的TUP 2.0 提升8倍之多,达到每秒1000万亿次浮点计算,同时谷歌展示了其一系列基于TPU的AI应用。

可以说,AI已经成为科技行业除了区块链之外最热门的话题。AI芯片作为AI时代的基础设施,也成为目前行业最热门的领域。

可以看到,AI芯片已经成为资本追逐的最热门领域,资本对半导体芯片的热情被AI技术彻底点燃。在创业公司未真正打开市场的情况下,AI芯片初创企业已经诞生了不少的独角兽,多笔融资已经超过亿元。

AI技术的革新,其从计算构架到应用,都和传统处理器算法有巨大的差异,这给创业者和资本市场无限的遐想空间,这也是为什么资本和人才对其趋之若鹜的原因。

首先我们来分析下目前对AI芯片的需求主要集中在哪些方面。

先来讲讲AI目前芯片大致的分类:从应用场景角度看,AI芯片主要有两个方向,一个是在数据中心部署的云端,一个是在消费者终端部署的终端。从功能角度看,AI芯片主要做两个事情,一是Training(训练),二是Inference(推理)。

目前AI芯片的大规模应用分别在云端和终端。云端的AI芯片同时做两个事情:Training和Inference。Training即用大量标记过的数据来“训练”相应的系统,使之可以适应特定的功能,比如给系统海量的“猫”的图片,并告诉系统这个就是“猫”,之后系统就“知道”什么是猫了;Inference即用训练好的系统来完成任务,接上面的例子,就是你将一张图给之前训练过的系统,让他得出这张图是不是猫这样的结论。

Training 和 Inference 在目前大多数的AI系统中,是相对独立的过程,其对计算能力的要求也不尽相同。

Training需要极高的计算性能,需要较高的精度,需要能处理海量的数据,需要有一定的通用性,以便完成各种各样的学习任务。

对于芯片厂家来说,谁有数据,谁赢!

Inference相对来说对性能的要求并不高,对精度要求也要更低,在特定的场景下,对通用性要求也低,能完成特定任务即可,但因为Inference的结果直接提供给终端用户,所以更关注用户体验的方面的优化。

谷歌TensorFlow团队:深度学习的未来,在单片机的身上

Pete Warden,是谷歌TensorFlow团队成员,也是TensorFLow Mobile的负责人。

Pete 坚定地相信,未来的深度学习能够在微型的、低功耗的芯片上自由地奔跑。

单片机 (MCU) ,有一天会成为深度学习最肥沃的土壤。

为什么是单片机?单片机遍地都是

今年一年全球会有大约400亿枚单片机 (MCU) 售出。MCU里面有个小CPURAM只有几kb的那种,但医疗设备、汽车设备、工业设备,还有消费级电子产品里,都用得到。

这样的计算机,需要的电量很小,价格也很便宜,大概不到50美分。

之所以得不到重视,是因为一般情况下,MCU都是用来取代 (如洗衣机里、遥控器里的) 那些老式的机电系统——控制机器用的逻辑没有发生什么变化。

CPU和传感器不太耗电,传输耗钱、耗电!CPU和传感器的功耗,基本可以降到微瓦级,比如高通的Glance视觉芯片。

相比之下,显示器和无线电,就尤其耗电了。即便是WiFi和蓝牙也至少要几十毫瓦。

因为,数据传输需要的能量,似乎与传输距离成正比。CPU和传感器只传几毫米,如果每个数据都需要端管云这样传输,每个算法都需要输送到云端进行处理,自然代价就要贵得多。

传感器的数据很多,传输起来很费劲!传感器能获取的数据,比人们能用到的数据,多得多。例如:卫星的图片数据很多,但是传到地球很困难。

卫星或者宇宙飞船上的宇航员可以用高清相机来拍高清视频。但问题是,卫星的数据存储量很小,传输带宽也很有限,从地球上每小时只能下载到一点点数据。

地球上的很多传感器也一样,本地获得很容易,但是传输到远端的数据中心就需要很多的代价。

跟深度学习有什么关系

如果传感器的数据可以在本地运算,又不需要很多的代价和电力。

我们需要的是,能够在单片机上运转的,不需要很多电量的,依赖计算不依赖无线电,并且可以把那些本来要浪费掉的传感器数据利用起来的。

这也是机器学习,特别是深度学习,需要跨越的鸿沟。

相比之下,神经网络大部分的时间,都是用来把那些很大很大的矩阵乘到一起,翻来覆去用相同的数字,只是组合方式不同了。

这样的运算,当然比从DRAM里读取大量的数值,要低碳得多。

需要的数据没那么多的话,就可以用SRAM这样低功耗的设备来存储。

如此说来,深度学习最适合MCU了,尤其是在8位元计算可以代替浮点运算的时候。

1、深度学习很低碳

那么AI的计算,每次运算需要多少皮焦耳?

比如,MobileNetV2的图像分类网络最简单的结构,大约要用2,200万次运算。

如果,每次运算要5皮焦,每秒钟一帧的话,这个网络的功率就是110微瓦,用纽扣电池也能坚持近一年。

2、对传感器也友好

最近几年,人们用神经网络来处理噪音信号,比如图像、音频、加速度计的数据等等。

如果可以在MCU上运行神经网络,那么更大量的传感器数据就可以得到处理,而不是浪费。

那时,不管是语音交互,还是图像识别功能,都会变得更加轻便。

Training将在很长一段时间里集中在云端,Inference的完成目前也主要集中在云端,但随着越来越多厂商的努力,很多的应用将逐渐转移到终端。

目前的市场情况:云端AI芯片市场已被巨头瓜分殆尽,创业公司生存空间几乎消失。

云端AI芯片无论是从硬件还是软件,已经被传统巨头控制,给新公司预留的空间极小。不客气的说,大多数AI芯片公司、希望在云端AI做文章的初创公司几乎最后都得死。

数据越多,对应用场景越理解的公司,对算法、硬件的需求越清楚、越理解深入。

我们可以看到,芯片巨头Nvidia(英伟达)已经牢牢占据AI芯片榜首,由于CUDA开发平台的普及,英伟达的GPU是目前应用最广的通用AI硬件计算平台。除了有实力自研芯片的企业(全世界也没几家),如果需要做AI相关的工作,必定需要用到Nvidia的芯片。Nvidia的芯片应用普遍,现在所有的AI软件库都支持使用CUDA加速,包括谷歌的Tensorflow,Facebook的Caffe,亚马逊的MXNet等。

除了一骑绝尘的英伟达,其他老牌的芯片巨头都没闲着,特别是Intel通过买、买、买奋力的将自己挤到了头部玩家的位置。微软在最新的Build大会上公布了基于英特尔FPGA的 AI 方案,而英特尔的 FPGA 业务正是通过收购Altera获得的。

除此之外,我们可以看到像Google这样的互联网厂商也乱入了前五。这当然要归功于上面提到的TPU,虽然谷歌不直接售卖芯片,但是谷歌通过云服务提供TPU的调用服务。谷歌很早就开源了Tensorflow软件平台,这使得Tensorflow成为最主流的机器学习软件平台,已经成了事实上行业的软件平台标准。而Tensorflow最佳的计算环境必定就是谷歌自己的云服务了,通过软件、硬件(或者说云)环境的打通,谷歌妥妥的成为AI芯片领域的一方霸主。

现在业界争论的焦点是AI芯片的处理器架构用哪种是最好的,有前面提及的有GPU、FPGA、DSPASIC,甚至还有更前沿的脑神经形态芯片。现在GPU可以认为是处于优势地位,但其他几种的处理器架构也各有优势。Intel则是多方下注,不错过任何一种处理器架构。谷歌在TPU(其实就是一种ASIC)方面的巨大投入带来了硬件效能的极大提高,目前看来对GPU的冲击将是最大的,原因不单单是因为专用架构带来的效率优势,还有商业模式方面带来的成本优势。在半导体行业内的普遍观点是,一旦AI的算法相对稳定,ASIC肯定是最主流的芯片形态。看看挖矿芯片的进化历程,这个观点非常有说服力。

在云端,互联网巨头已经成为了事实上的生态主导者,因为云计算本来就是巨头的战场,现在所有开源AI框架也都是这些巨头发布的。在这样一个生态已经固化的环境中,留给创业公司的空间实际已经消失。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    452

    文章

    50150

    浏览量

    420512
  • 人工智能
    +关注

    关注

    1789

    文章

    46576

    浏览量

    236899
  • AI芯片
    +关注

    关注

    17

    文章

    1849

    浏览量

    34833

原文标题:央视报道《人工智能芯片与传统芯片的区别》

文章出处:【微信号:melux_net,微信公众号:人工智能大趋势】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据,发现传统方法难以捕捉的模式和规律。这不仅极大地提高了数据处理
    发表于 10-14 09:12

    智能制造与人工智能区别

    智能制造与人工智能在定义、技术组成、应用领域以及发展重点等方面存在明显的区别
    的头像 发表于 09-15 14:27 540次阅读

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    材料基因组工程的推动下,人工智能如何与材料科学结合,加快传统材料和新型材料的开发过程。 第4章介绍了人工智能在加快药物研发、辅助基因研究方面及在合成生物学中的普遍应用。 第5章介绍了人工智能
    发表于 09-09 13:54

    FPGA在人工智能中的应用哪些?

    FPGA(现场可编程门阵列)在人工智能领域的应用非常广泛,主要体现在以下几个方面: 一、深度学习加速 训练和推理过程加速:FPGA可以用来加速深度学习的训练和推理过程。由于其高并行性和低延迟特性
    发表于 07-29 17:05

    人工智能芯片与服务器芯片区别

    人工智能芯片(AI芯片)与服务器芯片在多个方面存在显著差异,这些差异主要体现在设计目标、功能特性、应用场景以及技术发展趋势上。以下是对两者区别
    的头像 发表于 07-12 18:21 1347次阅读

    人工智能神经网络芯片的介绍

    : 概述 人工智能神经网络芯片是一种新型的处理器,它们基于神经网络的计算模型,通过模拟人脑神经元的连接和交互方式,实现对数据的高效处理。与传统的CPU和GPU相比,神经网络芯片具有更高
    的头像 发表于 07-04 09:33 514次阅读

    神经网络芯片传统芯片区别和联系

    引言 随着人工智能技术的快速发展,深度学习算法在图像识别、自然语言处理、语音识别等领域取得了显著的成果。然而,深度学习算法对计算资源的需求非常高,传统的计算芯片已经无法满足其需求。因此,神经网络
    的头像 发表于 07-04 09:31 629次阅读

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V2)

    人工智能 工业检测:芯片模组外观检测实训part1 11分40秒 https://t.elecfans.com/v/25609.html *附件:芯片模组外观检测实训.pdf 人工智能
    发表于 05-10 16:46

    5G智能物联网课程之Aidlux下人工智能开发(SC171开发套件V1)

    https://t.elecfans.com/v/27186.html *附件:引体向上测试案例_20240126.pdf 人工智能 工业检测:芯片模组外观检测实训part1 11分40秒 https
    发表于 04-01 10:40

    fpga芯片人工智能芯片区别

    FPGA芯片人工智能芯片(AI芯片)在设计和应用上存在一些关键的区别,这些区别主要体现在它们的
    的头像 发表于 03-14 17:26 1088次阅读

    嵌入式人工智能的就业方向哪些?

    嵌入式人工智能的就业方向哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式
    发表于 02-26 10:17

    aigc是什么意思和人工智能有什么区别

    ,AIGC具有许多区别和优势。 首先,AIGC是基于通用计算的人工智能平台,它不仅仅局限于特定应用领域或任务,而是具有更广泛的应用潜力。传统人工智能技术通常针对特定的问题进行优化,例
    的头像 发表于 01-11 09:49 9764次阅读

    LED洗墙灯跟线条灯的区别,使用的芯片差异?

    LED洗墙灯跟线条灯的区别,使用的芯片差异?
    的头像 发表于 01-05 14:30 1623次阅读

    人工智能芯片革命:HBM崛起

    大量数据生成式人工智能应用对传统存储芯片的性能产生了巨大挑战。为了应对这个问题,我们需要更快的数据传输速度和更高的处理效率,从而导致更密集的芯片布局以及更大的能耗输出。一直以来,
    的头像 发表于 12-19 14:18 579次阅读

    异构集成 (HI) 与系统级芯片 (SoC) 区别

    异构集成 (HI) 与系统级芯片 (SoC) 区别
    的头像 发表于 11-29 15:39 1860次阅读
    异构集成 (HI) 与系统级<b class='flag-5'>芯片</b> (SoC) <b class='flag-5'>有</b><b class='flag-5'>何</b><b class='flag-5'>区别</b>?