0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Cornami构建了一个革命性的脉动阵列架构

SSDFans 来源:cc 2019-01-15 16:01 次阅读

科技界出现了许多为人工智能机器学习开发特殊芯片的初创公司。在加州圣克拉拉由老牌半导体分析公司Linley集团主办的Linley集团秋季处理器会议上,出现了一些最有趣的产品

一家总部位于圣克拉拉的创业公司Cornami进行了一场演讲。

其联合创始人和首席技术官Paul Masters描述了一种机器学习的新方式,可以安排芯片的各个元素进行机器学习“训练”(神经网络就是在这里发展起来的)和“推理”(神经网络在不断的基础上提供答案)。

Cornami一直在秘密运作,这是Masters首次公开关于该公司芯片运作方式的一些细节。

Cornami的目标是向大众市场提供芯片,包括“边缘计算”领域,其中汽车和消费电子产品特别需要具有高响应性能的芯片,并且在运行神经网络方面具有高能效。

Masters说,该芯片可追溯到20世纪70年代和80年代的技术,称为脉动阵列。脉动阵列具有很多计算元件,例如乘法—累加器,以执行作为神经网络的基本计算单元的矩阵乘法。用线将这些元素彼此连接,并连接到网格中的内存。脉动矩阵是根据心脏的收缩功能来命名的:就像血流一样,数据是通过这些计算元素“泵”出来的。

根据演示,脉动阵列在它们首次出现时并未真正被重视,但它们正在成为构建AI芯片的主要方式。Masters表示:“你已经看到了,它很酷,它来自70年代。”

“谷歌正在使用它们,还有微软以及数十家初创公司,”他观察到脉动阵列的普及。

但Masters讨论了Cornami如何采用独特的脉动阵列方法。“脉动阵列的诅咒在于它们是方形的,”Masters说。他指的是乘数累加器的对称排列。由于这种刚性布局,将数据移入和移出这些计算元素将占用芯片大量的工作,甚至比每个计算元素中的计算本身还要多。

Masters 说“传统芯片的功耗在哪里?”,这是个大问题。“数据被转储到DDR [DRAM内存]中,它必须进入核心进行计算,因此数据从DDR进入三级高速缓存,二级高速缓存和一级高速缓存,然后进入寄存器,之后开始进行计算。如果核心耗尽,就必须反过来,先退出并将所有临时数据转储回寄存器,L1缓存,L2,L3,一遍又一遍。“

Masters解释说,只要用到L1缓存就需要四倍于实际计算的功耗。如果要用DRAM,几乎很难做到,而且需要更大的功率来驱动芯片

Masters说:“传统机器中能效最低的就是移动数据”。解决方案是拥有数千个核心,通过保持数千个核心繁忙,可以避免返回到内存子系统,而只是简单地将计算的输入和输出从一个元素路由到下一个元素。“如果拥有8,000到32,000个核心,我们可以保持整个神经网络在一个芯片上”他说。

因此,为了降低进出内存的成本,Cornami芯片重新排列他们的电路,使计算元件可以切换到各种几何布局,有效地组织芯片上的计算活动,以满足目前的神经网络的需求。

“Cornami构建了一个可以根据需要构建任何尺寸,任何形状的脉动阵列的架构。” 脉动阵列可以被动态地重新排列成非正方形的各种新几何图形。这些奇怪的数组形状使得在计算元素之间移动输入和输出变得非常有效。因此,Cornami芯片可以最小化内存和缓存使用,从而“显著降低功耗和延迟,并提高性能”。

Masters自豪地说,凭借这种灵活性,单个Cornami芯片就可以处理整个神经网络,并且能够取代通常用于运行神经网络的CPUGPUFPGAASIC的各种组合。他表示,这是一个“芯片上的数据中心”,对于将AI置于汽车等“边缘计算”中具有重要意义。

Masters展示了一些性能统计数据:运行“SegNet”神经网络进行图像识别,与Nvidia“Titan V”GPU相比,Cornami芯片能够每秒处理877帧,功耗只有30瓦。而Titan GPU功耗250瓦,每秒只能处理8.6帧。

Cornami于2016年9月从Impact Venture Capital获得了300万美元的B轮风险投资。随后,该公司已收到资金,但尚未披露具体数额。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47274

    浏览量

    238481
  • 机器学习
    +关注

    关注

    66

    文章

    8418

    浏览量

    132629
  • AI芯片
    +关注

    关注

    17

    文章

    1887

    浏览量

    35020

原文标题:Cornami AI芯片:革命性的脉动阵列架构

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    东软医疗光子计数CT获得革命性突破

    近日,由东软集团旗下的创新公司东软医疗自主研发的国产光子计数CT获得革命性突破,首幅人体影像成功出图!这不仅是东软医疗自主创新的再次突破,更是中国在超高端医学影像设备领域具有里程碑意义的重大突破!
    的头像 发表于 11-06 14:25 389次阅读

    安宝特案例 | AR技术在院外心脏骤停急救中的革命性应用

    随着远程医疗技术的迅速发展,医生与急救人员之间的实时交流和精准指导变得至关重要。增强现实 (AR) 技术正为院外急救提供革命性的解决方案。梅奥诊所(MCAS)首次将这创新技术应用于OHCA救援,整合了头戴式增强现实设备、高清4K摄像头以及Wi-Fi与卫星通讯终端。
    的头像 发表于 10-29 10:36 454次阅读
    安宝特案例 | AR技术在院外心脏骤停急救中的<b class='flag-5'>革命性</b>应用

    PC示波器:电子测试与测量的革命性工具

    领域带来了革命性的变化。 PC示波器通过将多个测试仪器集成在小型装置中,实现了前所未有的轻便与便携。与传统示波器相比,PC示波器不仅重量更轻、体积更小,而且当与笔记本电脑配合使
    的头像 发表于 10-09 10:46 284次阅读

    使用OPA129构建了电荷放大器,6脚输出经常出现尖峰的原因?

    使用OPA129构建了电荷放大器,电路图和出现的问题如附件中所示。 根据芯片手册给出的电荷放大电路,构建了如下所示的电路 但是在使用过程中,6脚输出经常出现尖峰,如下图所示
    发表于 08-30 06:33

    颠覆!硅光“黑马”打造革命性光学IO技术,可取代芯片内铜线

    来源: Evelyn维科网光通讯 近日,位于加利福尼亚州的硅光子初创公司Ayar Labs透露,其革命性的光学I/O技术即将面世: 这突破成果可以取代芯片内部的铜线,在芯片内部进行更快的通信。它
    的头像 发表于 08-13 15:20 714次阅读
    颠覆!硅光“黑马”打造<b class='flag-5'>革命性</b>光学IO技术,可取代芯片内铜线

    全新雷达水位流速仪,让河流管理更智能,革命性水文监测

    在水资源管理日益复杂的今天,高精度、高可靠的水文监测设备正变得愈发重要。今天,我们很荣幸为大家介绍革命性的产品——全新雷达水位流速仪。这款设备凭借其卓越的性能和创新的技术,正在彻底改变水文监测
    的头像 发表于 08-12 13:40 247次阅读
    全新雷达水位流速仪,让河流管理更智能,<b class='flag-5'>革命性</b>水文监测

    日本推出革命性的人形机器人

    8月2日,日本科技界传来新突破,立命馆大学携手滋贺县草津市的“人机体”机器人创新企业,共同揭幕了革命性的人形机器人。这款机器人以其卓越的自适应平衡能力,在未预先测绘环境的情况下,通过远程精准操控,展现了前所未有的灵活性与安
    的头像 发表于 08-02 17:08 699次阅读

    Transformer架构在自然语言处理中的应用

    随着人工智能技术的飞速发展,自然语言处理(NLP)领域取得了显著的进步。其中,Transformer架构的提出,为NLP领域带来了革命性的变革。本文将深入探讨Transformer架构的核心思想、组成部分以及在自然语言处理领域的
    的头像 发表于 07-09 11:42 780次阅读

    苹果新专利,Apple Pencil将迎来革命性升级

    在科技日新月异的今天,苹果公司再次以其前瞻的创新引领了数字交互的新纪元。近日,美国商标和专利局最新公示的项专利,为我们揭示了Apple Pencil即将迎来的革命性升级——它不仅将作为传统意义上
    的头像 发表于 07-03 17:06 555次阅读

    占位符还是革命性突破?RISC-V处理器架构引领中国芯片产业新机遇!

    过程中的过渡方案,还是RISC-V处理器架构本身就是革命性的创新。不论结果如何,对于更加灵活多变的处理器
    的头像 发表于 06-08 08:36 326次阅读
    占位符还是<b class='flag-5'>革命性</b>突破?RISC-V处理器<b class='flag-5'>架构</b>引领中国芯片产业新机遇!

    革命性的图形分析: NVIDIA cuGraph 加速的下架构

    在我们的 先前的图分析探索 中,我们使用 NVIDIA cuGraph 揭示了 GPU-CPU 融合的变革力量。基于这些见解,我们现在引入了革命性的新架构,它重新定义了图处理的边界。 图形处理
    的头像 发表于 06-04 17:54 7572次阅读
    <b class='flag-5'>革命性</b>的图形分析: NVIDIA cuGraph 加速的下<b class='flag-5'>一</b>代<b class='flag-5'>架构</b>

    英伦科技室内裸眼3D广告机会议体机正以其革命性的视觉体验引领着新的趋势

    在科技的浪潮中,我们常常追求那些能够颠覆传统的革新力量。而在显示技术的领域里,英伦科技室内裸眼3D广告机会议体机正以其革命性的视觉体验,引领着新的趋势。今天,就让我们起深入了解
    的头像 发表于 05-22 10:45 381次阅读
    英伦科技室内裸眼3D广告机会议<b class='flag-5'>一</b>体机正以其<b class='flag-5'>革命性</b>的视觉体验引领着新的趋势

    长电科技推出了革命性的高精度热阻测试与仿真模拟验证技术

    在芯片封装技术日益迈向高密度、高性能的今天,长电科技引领创新,推出了革命性的高精度热阻测试与仿真模拟验证技术。
    的头像 发表于 03-08 13:33 548次阅读

    利用太赫兹超构表面开发革命性的生物传感器

    据麦姆斯咨询报道,近期,伦敦玛丽女王大学(Queen Mary University of London)和格拉斯哥大学(University of Glasgow)多学科研究人员展开合作,利用太赫兹超构表面(Metasurface)开发了革命性的生物传感器
    的头像 发表于 02-25 10:23 777次阅读
    利用太赫兹超构表面开发<b class='flag-5'>一</b>款<b class='flag-5'>革命性</b>的生物传感器

    XR虚拟拍摄技术:短剧与微剧制作的革命性工具

    剧制作带来了革命性的变革,成为了引领行业发展的新引擎。 XR虚拟拍摄技术结合了扩展现实(XR)和虚拟拍摄两大核心要素,为短剧与微剧制作提供了前所未有的创意空间。通过运用先进的虚拟场景构建技术,制作人员可以轻松地打造出逼
    的头像 发表于 02-19 10:54 747次阅读