0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一款采用单位元精度的深度学习推论(inference)芯片原型

dKBf_eetop_1 来源:未知 作者:李倩 2018-05-31 17:18 次阅读

比利时研究机构Imec在近日举行的年度技术论坛(ITF BELGIUM 2018)上透露,该机构正在打造一款采用单位元精度的深度学习推论(inference)芯片原型;Imec并期望在明年收集采用创新资料型态与架构──采用存储器内处理器(processor-in-memory,PIM),或是Analog存储器结构(analog memory fabric)──的客户端装置有效性资料。

学术界已经研究PIM架构数十年,而该架构越来越受到资料密集的机器演算法欢迎,例如新创公司Mythic以及IBM Research都有相关开发成果。许多学术研究机构正在实验1~4位元的资料型别(data type),以减轻深度学习所需的沉重存储器需求;到目前为止,包括Arm等公司的AI加速器商用芯片设计都集中在8位元或更大容量的资料型别,部分原因是编程工具例如Google的TensorFlow缺乏对较小资料型别的支援。

Imec拥有在一家晶圆代工厂制作的40nm制程加速器逻辑部份,而现在是要在自家晶圆厂添加一个MRAM层;该机构利用SRAM模拟此设计的性能,并且评估5nm节点的设计规则。此研究是Imec与至少两家匿名IDM业者伙伴合作、仍在开发阶段的专案,从近两年前展开,很快制作了采用某种电阻式存储器(ReRAM)的65nmPIM设计原型。

该65nm芯片并非锁定深度学习演算法,虽然Imec展示了利用它启动一段迷人的电脑合成音乐;其学习模式是利用了根据以音乐形式呈现、从感测器所串流之资料的时间序列分析(time-series analysis)。而40nm低功耗神经网路加速器(Low-Energy Neural Network Accelerator,LENNA)则会锁定深度学习,在相对较小型的MRAM单元中运算与储存二进位权重。

Imec技术团队的杰出成员Diederik Verkest接受EE Times采访时表示:「我们的任务是定义出我们应该利用新兴存储器为机器学习开发什么样的半导体技术──或许我们会需要制程上的调整,」以取得最佳化结果。该机构半导体技术与系统部门执行副总裁An Steegen则表示:「AI会是制程技术蓝图演化的推手,因此Imec会在AI (以及PIM架构)方面下很多功夫──这方面的工作成果将会非常重要。」

Imec声称其LENNA芯片在推论任务上的表现将超越现有的CPUGPU

确实,如来自英国的新创公司Graphcore执行长Nigel Toon所言,AI标志着「运算技术的根本性转变」;该公司将于今年稍晚推出首款芯片。Toon在Imec年度技术论坛上发表专题演说时表示:「今日的硬体限制了我们,我们需要某种更灵活的方案…我们想看到能根据经验调整的(神经网路)模型;」他举例指出,两年前Google实习生总共花了25万美元电费,只为了在该公司采用传统x86处理器或Nvidia GPU的资料中心尝试最佳化神经网路模型。

实现复杂的折衷平衡

Imec希望LENNA能在关于PIM或Analog存储器架构能比需要存取外部存储器的传统架构节省多少能量方面提供经验;此外该机构的另一个目标,是量化采用二进制方案在精确度、成本与处理量方面的折衷(tradeoff)。

加速器芯片通常能在一些热门的测试上提供约90%的精确度,例如ImageNet竞赛;Verkest表示,单位元资料型别目前有10%左右的精度削减,「但如果你调整你的神经网路,可以达到最高85%~87%的精确度。」他原本负责督导Imec的逻辑制程微缩技术蓝图,在Apple挖脚该机构的第一个AI专案经理之后,又兼管AI专案。

Verkest表示,理论上Analog存储器单元应该能以一系列数值来储存权重(weights),但是「那些存储器元件的变异性有很多需要考量之处;」他指出,Imec的开发专案将尝试找出能提供最佳化精度、处理量与可靠度之间最佳化平衡的精度水准。

而Toon则认为聚焦于资料型别是被误导了:「低精度并没有某些人想得那么严重,存储器存取是我们必须修正之处;」他并未详细介绍Graphcore的解决方案,但声称该公司技术可提供比目前采用HBM2存储器的最佳GPU高40倍的存储器频宽。

在芯片架构方面,Imec的研究人员还未决定他们是要设计PIM或采用Analog存储器结构;后者比较像是一种Analog SoC,计算是在Analog区块处理,可因此减少或免除数位-Analog转换。不同种类的神经网路会有更适合的不同架构,例如卷积神经网路(CNN)会储存与重复使用权重,通常能以传统GPU妥善运作;归递神经网路(RNN)以及长短期记忆模型(long short-term memories,LSTMs)则倾向于在使用过后就抛弃权重,因此更适合运算式存储器结构

Imec可能会以存储器结构来打造LENNA,让运算留在Analog功能区块

新的平行架构非常难编程,因此大多数供应商正在尝试建立在TensorFlow等现有架构中摄取程式码的途径。而Graphcore则是打造了一种名为Poplar的软体层,旨在以C++Python语言来完成这项工作;Toon表示:「我们把在处理器中映射图形(graphs)的复杂性推到编译器(也就是扮演该角色的Poplar)。」

Graphcore的客户很快就会发现该程序会有多简单或是多困难;这家新创公司预计在年中将第一款产品出货给一线大客户,预期他们会在今年底采用该款芯片执行大型云端供应商的服务。Toon声称,其加速器芯片将能把CNN的速度提升五至十倍,同时间采用RNN或LSTM的更复杂模型则能看到100倍的效能提升。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    38

    文章

    7378

    浏览量

    163210
  • 加速器
    +关注

    关注

    2

    文章

    787

    浏览量

    37270
  • AI芯片
    +关注

    关注

    17

    文章

    1831

    浏览量

    34729

原文标题:Imec等多家公司正力促AI芯片设计最佳化

文章出处:【微信号:eetop-1,微信公众号:EETOP】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Tractica:预计2025年深度学习芯片销量达到29亿单位

    Tractica预测,AI市场的这种增长和演变将推动深度学习芯片组的出货量从2018年的1.649亿增长到2025年的29亿单位以上。届时,深度
    的头像 发表于 06-09 23:39 7300次阅读

    一款用于无线音箱的电源芯片

    `面对生活中的压力,曲优美的音乐,总会让人舒缓身心,忘却烦恼。无线音箱的快捷方便,深受人们青睐。近期银联宝公司推出一款5V1A的开关电源芯片TB5806,专门适用于无线音箱方面。有效缩短了其充电
    发表于 10-10 10:14

    一款新的化学传感器原型

    一款新的化学传感器原型能够在距离100英尺以外的地方检测到“指纹痕量”的化学物质和其它物质,其开发者正在努力将其尺寸缩小到鞋盒大小。
    发表于 08-19 06:05

    一款采用TL494芯片的开关电源电路分析

    一款采用TL494芯片的开关电源电路分析
    发表于 04-26 06:23

    如何挑选一款不错的高精度授时模块呢?

    如何挑选一款不错的高精度授时模块呢?
    发表于 05-17 07:04

    一款精度降压型大功率 LED 恒流驱动芯片

    `AP5161 宽电压 LED 降压型恒流芯片概述AP5161 是一款精度降压型大功率LED 恒流驱动芯片。适用于输入电压 100V以内的大功率 LED 恒流驱动电源。专利的高端电流
    发表于 07-06 10:20

    一款精度降压型大功率 LED 恒流驱动芯片

    `AP5161 宽电压 LED 降压型恒流芯片概述AP5161 是一款精度降压型大功率LED 恒流驱动芯片。适用于输入电压 100V以内的大功率 LED 恒流驱动电源。专利的高端电流
    发表于 07-14 17:47

    怎么快速设计一款智能温控器产品原型

    我主要从开发角度讲讲怎么快速设计一款智能温控器产品原型吧。温湿度传感器作为基础传感类别,在智能家居领域应用广泛。通过温湿度传感器采集温度和湿度,可以实现多样化的智能场景联动。比如在炎热的夏季,温湿度
    发表于 11-04 08:29

    如何开发一款自己的App

    新手些建议。、误区在讲如何开发一款app之前,先说下定要避免的些误区。借鉴与copy表面与原理效果与
    发表于 12-17 06:10

    什么是深度学习?使用FPGA进行深度学习的好处?

    延迟,这对深度学习推理也很有效。上述图像识别的深度学习有望应用于自动驾驶等对精度要求较高的系统中。然而,由于它也是
    发表于 02-17 16:56

    拆解深度学习生态系的五个层级

    浅谈深度学习的架构,主要可分为训练(Training)与推论(Inference)两个阶段。简单来说,就是训练机器学习,以及让机器展现
    发表于 02-09 08:48 2937次阅读

    IBM研制可兼顾高精度学习和低精度推理的深度学习芯片

    深度学习领域仍在不断发展,特别地,专家们认识到如果芯片能够使用低精度的计算方式得出近似答案,神经网络就可以用很少的资源完成大量的计算。
    的头像 发表于 07-10 08:56 2359次阅读

    亚马逊推出了一款名为Inferentia的新型专用机器学习芯片

    据报道,在拉斯维加斯举行的AWS re:Invent上,亚马逊宣布了一款名为Inferentia的新型专用机器学习芯片
    发表于 11-29 14:19 1725次阅读

    Socionext成功开发了一款集成有量化深度神经网络技术的原型芯片

    为提高边缘计算处理器AI处理性能并减少系统功耗,Socionext成功开发了一款集成有量化深度神经网络(DNN)技术的原型芯片,通过“YOLOv3”它能以不到5W的低功耗及30fps的
    的头像 发表于 11-04 16:27 1513次阅读

    传苹果正在测试一款完全没有“刘海”的iPhone原型

    13 的原型看起来很像 iPhone 12,但现在另位爆料者声称,苹果正在测试一款完全没有“刘海”的原型机。 大量生产高端设备的公司在决定批量生产
    的头像 发表于 01-29 16:31 1497次阅读