0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Mythic公司推出业界首款模拟矩阵处理器M1108 AMP

我快闭嘴 来源:半导体行业观察综合 作者:半导体行业观察综 2020-11-25 15:27 次阅读

领先的模拟AI处理器公司Mythic日前宣布,公司正式推出业界首款模拟矩阵处理器(Mythic AMP™)M1108 AMP。按照他们的说法,这个新产品的发布预示了AI激动人心的新纪元,因为它首次提供了一种模拟计算解决方案,该解决方案可实现一流的性能和性能,并且其精度可与数字设备媲美。报道指出,M1108 AMP能为边缘部署提供了无与伦比的可能性,应用市场包括智能家居,AR / VR无人机视频监控,智能城市以及工厂车间的自动化。凭借其革命性的技术,M1108 AMP处于AI处理重大新趋势的最前沿。报道指出,M1108集成了108个AMP tiles ,每个tiles都配有一个Mythic模拟计算引擎(MythicACE™),该引擎具有闪存单元、ADC阵列、32位的RISC-V处理器、SIMD矢量引擎,SRAM和一个高吞吐量的片上网络(NOC)路由。

此外,四个控制tiles为系统主机处理器提供了高带宽PCIe2.0接口。M1108具有108个AMP tiles,可提供高达35万亿次/秒的运算(TOPS),可在单个芯片上以高效率、低延迟地高效执行复杂的AI模型(例如ResNet-50,YOLOv3和OpenPoseBody25)。在峰值吞吐量下运行复杂的AI模型时,M1108的典型功耗约为4W。而且,凭借利用成熟的40nm技术的固有成本优势,并且不需要任何外部DRAM或SRAM, M1108 AMP 将以 PCIe M.2 和 PCIe卡形式提供,并且 M1108PCIe 评估套件可应要求提供。

模拟AI芯片怎么玩?Mythic详细讲述

说到人工智能硬件,我们向来事无巨细。WikiChip密切关注的一家公司是Mythic。这家公司还没有完全公开他们的架构和产品,但一些细节已经开始慢慢浮出水面。在最近的人工智能硬件峰会上,该公司的创始人兼首席执行官Mike Henry)绍了该芯片的最新情况。

这家位于奥斯汀的初创公司由Mike Henry和Dave Fick于2012年创立,最近完成了7000万美元的B轮融资,总融资额刚刚超过8500万美元。如今,公司员工已增至110人。

Mythic是一家模拟公司。但是,在我们探讨细节之前,必须指出,它们目前仅专注于推理,无论是在数据中心还是在边缘。到2024年,这两个市场的TAM(Total Available Market总体有效市场)。

预计将达到250亿美元,这就是为什么这里有如此多的关注点的原因。从长远来看,Mythic计划针对大众市场的消费品和汽车产品。

把所有东西都放在芯片上,放在闪存里

随着模型准确性的提高,其大小也会随之增加。如今,模型达到了数亿个参数,甚至达到数十亿。最重要的是,通常实时地需要确定性行为,例如一致的帧速率和延迟。这就是Mythic的作用。Mythic的论点很简单:将足够的存储与大量并行计算单元打包在芯片上,以最大化内存带宽并减少数据移动的能力。但是有一个转变——这就是Mythic的原始方法的闪光点——该公司抛弃了传统的SRAM,转而使用更密集的闪存,此外,Mythic还计划在模拟环境下直接在内存中进行本地计算。

但是为什么是闪存?答案很简单:因为它密度大,功耗低,而且便宜,几乎比SRAM的密度大两个数量级。

理论上,Mythic的芯片更像内存,而不是传统的CMOS。从更长的路线图来看,随着SRAM bit cell的扩展变得越来越困难,它带来的好处也越来越深远。总的来说,从每美元的性能、每单位成本的密度和每瓦特的性能来看,这是一个潜在的巨大胜利。

多年来,我们看到了一大堆路线图,当他们开始谈论未来10年的时候,很容易忽视它。但对Mythic来说,有一些不同之处。值得特别指出的是,目前Mythic正在研究40纳米的嵌入式闪存。他们有一个相当清晰的28nm和22nm的路径,因此,粗略地说,这个图的一半是基于今天已经发布的现有节点。

Mythic公司的首席执行官Mike Henry似乎相信他们可以继续这样做,但是尽管正在进行一些工作以继续扩展到16/14纳米节点,还不清楚它是否会上市。

许多业内人士认为,嵌入式闪存在22纳米的时候遭遇了瓶颈。在与Mythic的一次简短交谈中,他们告诉我们,他们并没有与嵌入式闪存结合,如果其中一项新兴技术(如多位ReRAM、PCM或NRAM)作为一种强大的替代技术出现,他们肯定会考虑迁移到这种技术。

IPU

Mythic的芯片被称为IPUs或智能处理单元。在外设方面,该芯片非常简单,由PCIe的x4通道和DNN平铺网格组成,PCIe是负责整个芯片管理的基本控制处理器。由于芯片的设计是为了存储整个模型,没有DRAM。

Mythic表示,由于这是一个基于tiles的设计,如果有需求,他们可以通过添加直接的音频/视频和各种其他接口来进一步定制。在去年的Hot Chip上,Mythic谈论的是一款5000万权值(weights)的初始产品。在最近的人工智能硬件峰会上,Mike Henry表示,初始产品权值将达到1.2亿,这比最初的计划要多很多。在富士通的40nm制程中,近标线全尺寸芯片应具有约300M权值的容量,因此120M仍然是一个相当大的芯片。

IPU的作用是作为一个连接到主机的PCIe加速器。对于大型模型或多个模型,可以使用多个IPU。模型最初被加载到IPU中,并保持静止。没有DRAM和编程闪存相对较慢,因此模型应该能够适应芯片与多个应用映射到同一芯片。这对于许多边缘应用程序来说非常典型。在正常操作下,主机CPU将数据发送到IPU,并通过PCIe端口接收结果。

该芯片由DNN tiles构成网格。在一个tiles里面是一个模拟矩阵乘法器,它建立在一个巨大的嵌入式闪存池的顶部,用来计算权值。嵌入式闪存单元使用浮动栅极通过存储电荷、控制阈值电压来存储位。晶体管支持256级电导(G=1/R)之间的完全关闭和打开状态,Mythic用它来表示8位值。

通过将所有神经元的权值映射到闪光晶体管上,他们可以利用欧姆定律自然地进行矩阵乘法运算。实现的方法是使用闪光晶体管将权值表示为可变电阻。这在计算之前执行一次。使用8位DAC,输入矢量作为一组电压通过可变电阻。根据欧姆定律,输出电流是输入数据与权值向量(I = V x G)相乘的结果。最后,一组adc将产生的电流转换回数字值,成为输出矢量。ReLu和其他各种非线性操作也由adc在那个时间点完成。

围绕这个组件还有一些额外的逻辑。不管工作条件如何,DAC/ADC封装器都会进行补偿和校准,以获得精确的8位计算—类似于今天的图像传感器所做的工作。

需要指出的是,这个方案没有实际的内存访问。矩阵相乘是在内存中完成的,利用欧姆定律,所以没有权值访问能量。使用固定权值时,也没有批量大小或其他特殊处理。虽然固定容量可能会带来一些问题。顺便说一下,它们支持神经元稀疏,但不支持权值稀疏性。

有趣的是,Mythic说,对于他们的第一代,为了加快开发和上市时间,他们不会使用DAC作为输入。相反,他们使用一个数字近似电路,由此分别计算每个输入位,然后累加结果。他们将在将来用DAC消除这种情况,这有望为他们提供一些很好的改善。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19161

    浏览量

    229122
  • 芯片
    +关注

    关注

    453

    文章

    50402

    浏览量

    421800
  • AI
    AI
    +关注

    关注

    87

    文章

    30137

    浏览量

    268411
  • 人工智能
    +关注

    关注

    1791

    文章

    46854

    浏览量

    237551
收藏 人收藏

    评论

    相关推荐

    Rambus推出业界首HBM4控制IP

    Rambus Inc.,业界知名的芯片和半导体IP供应商,近日宣布了一项重大突破:推出业界首HBM4(High Bandwidth Memory 4,高带宽内存4代)内存控制
    的头像 发表于 11-14 16:33 398次阅读

    PI推出业界首1700V氮化镓开关IC

    深耕于高压集成电路高能效功率变换领域的知名公司Power Integrations(纳斯达克股票代号:POWI)今日推出InnoMux-2系列单级、独立调整多路输出离线式电源IC的新成员。新器件采用公司专有的PowiGaN技术制
    的头像 发表于 11-05 13:40 236次阅读

    盛显科技:在拼接处理器上配置混合矩阵的步骤是什么?

    相信大家都知道,在拼接处理器上配置混合矩阵,主要涉及到将混合矩阵的输出与拼接处理器的输入相连接,并通过拼接处理器的软件或界面进行配置,以实现
    的头像 发表于 09-26 18:09 285次阅读

    思瑞浦车规级产品矩阵,全面覆盖汽车级CAN&LIN、LDO需求

    聚焦高性能模拟芯片和嵌入式处理器近期,思瑞浦为广大工程师带来了《思瑞浦车规级产品矩阵,全面覆盖汽车级CAN&LIN、LDO需求》的在线研讨会直播,重点介绍了思瑞浦汽车产品布局与
    的头像 发表于 09-21 08:10 388次阅读
    思瑞浦车规级产品<b class='flag-5'>矩阵</b>,全面覆盖汽车级CAN&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;LIN、LDO需求

    盛显科技:拼接处理器为什么要配置混合矩阵?

    拼接处理器和混合矩阵作为视频显示与控制系统的关键组件,各自具有独特的功能和优势。它们之间既存在区别又相互关联,共同为用户提供了高效、灵活的视频处理与显示解决方案。在实际应用中,我们通常会把两者搭配
    的头像 发表于 09-06 11:23 279次阅读
    盛显科技:拼接<b class='flag-5'>处理器</b>为什么要配置混合<b class='flag-5'>矩阵</b>?

    新思科技推出业界首PCIe 7.0 IP解决方案

    《Acquired》栏目邀请,共同分享了当前全球EDA(电子设计自动化)领域的前沿技术进展,以及EDA如何加速人工智能(AI)、智能汽车等核心科技产业变革,赋能万物智能时代加速到来。   新思科技推出业界首
    的头像 发表于 06-29 15:13 578次阅读

    新思科技推出业界首PCIe 7.0 IP解决方案

    新思科技(Synopsys)近日宣布,推出业界首完整的PCIe 7.0 IP解决方案,包括控制、IDE安全模块、PHY和验证IP。该解决方案可以助力芯片制造商满足计算密集型AI工作
    的头像 发表于 06-25 09:46 455次阅读

    柏恩Bourns发布业界首平面信号BMS变压

    美国柏恩 Bourns 全球知名电源、保护和传感解决方案电子组件领导制造供货商,发布业界首平面信号BMS变压
    的头像 发表于 03-28 14:01 723次阅读

    业界首基于Arm Cortex-M85处理器的MCU

    所有RA8系列MCU均利用Arm Cortex-M85处理器和Arm的Helium技术所带来的高性能,结合矢量/SIMD指令集扩展,能够在数字信号处理器(DSP)和机器学习(ML)的实施方面获得相比Cortex-
    发表于 03-05 14:14 634次阅读
    <b class='flag-5'>业界首</b><b class='flag-5'>款</b>基于Arm Cortex-<b class='flag-5'>M</b>85<b class='flag-5'>处理器</b>的MCU

    瑞萨电子发布业界首基于Cortex-M85处理器的全新超高性能MCU

    去年10月,瑞萨电子重磅发布了业界首基于Cortex-M85处理器的全新超高性能MCU:RA8M1系列微
    的头像 发表于 02-26 10:27 599次阅读
    瑞萨电子发布<b class='flag-5'>业界首</b><b class='flag-5'>款</b>基于Cortex-<b class='flag-5'>M</b>85<b class='flag-5'>处理器</b>的全新超高性能MCU

    铠侠正式发布业界首车载UFS 4.0嵌入式闪存

    存储解决方案的全球领导者铠侠株式会社宣布,该公司已开始提供业界首面向车载应用的通用闪存(UFS)4.0版嵌入式闪存设备的样品。
    的头像 发表于 02-22 16:21 954次阅读

    Kioxia推出业界首面向汽车应用的UFS 4.0版嵌入式闪存器件

    全球领先的存储解决方案提供商Kioxia Corporation今天宣布推出[1]业界首[2]面向汽车应用的通用闪存[3](UFS) 4.0版嵌入式闪存器件样品。这些性能更高的新型器件封装小巧
    的头像 发表于 01-31 18:19 550次阅读

    美光推出业界首标准低功耗压缩附加内存模块

    美光科技近日宣布推出业界首标准低功耗压缩附加内存模块(LPCAMM2),这款产品提供了从16GB至64GB的容量选项,旨在为PC提供更高性能、更低功耗、更紧凑的设计空间及模块化设计。
    的头像 发表于 01-19 16:20 664次阅读

    Bourns发布业界首平面信号BMS变压

    美国柏恩Bourns近日发布了业界首平面信号BMS变压。这款新型变压,美国专利 Bourns SM91806,专为满足高压电动车(EV)和其他高能量储存系统对平面技术的持续增长需
    的头像 发表于 01-18 20:10 1277次阅读

    国科微推出业界首支持TV及商显的标准鸿蒙系统平台

    日前,国科微正式发布基于8K超高清显示芯片GK6780V100的OpenHarmony开发平台,这也是业界首支持TV及商显的标准OpenHarmony平台,为OpenHarmony生态带来全新的高性能SoC芯片支持。
    的头像 发表于 12-01 09:14 454次阅读