0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅谈智能芯片的分类以及它的关键技术

独爱72H 来源:百家号 作者:佚名 2019-10-30 16:03 次阅读

(文章来源:百家号)

人工智能芯片目前有两种发展路径:一种是延续传统计算架构,加速硬件计算能力,主要以 3 种类型的芯片为代表,即 GPUFPGAASIC,但 CPU依旧发挥着不可替代的作用;另一种是颠覆经典的冯·诺依曼计算架构,采用类脑神经结构来提升计算能力, 以 IBM TrueNorth 芯片为代表。GPU 作为最早从事并行加速计算的处理器,相比 CPU 速度快, 同时比其他加速器芯片编程灵活简单。

程序在 GPU系统上的运行速度相较于单核 CPU往往提升几十倍乃至上千倍。随着英伟达AMD公司不断推进其对 GPU 大规模并行架构的支持,面向通用计算的 GPU(即GPGPU, GENERAL PURPOSE GPU,通用计算图形处理器)已成为加速可并行应用程序的重要手段,GPU 的发展历程可分为 3 个阶段:

第一代GPU(1999年以前 ) , 部分功能从CPU分离 , 实现硬件加速 , 以GE(GEOMETRY ENGINE)为代表,只能起到 3D 图像处理的加速作用,不具有软件编程特性。

第二代 GPU(1999-2005 年), 实现进一步的硬件加速和有限的编程性。1999年,英伟达发布了“专为执行复杂的数学和几何计算的” GeForce256 图像处理芯片,将更多的晶体管用作执行单元, 而不是像 CPU 那样用作复杂的控制单元和缓存,将 T&L (TRANSFORM AND LIGHTING) 等功能从 CPU 分离出来,实现了快速变换,这成为 GPU 真正出现的标志。

之后几年, GPU 技术快速发展,运算速度迅速超过 CPU。2001 年英伟达和 ATI 分别推出的GEFORCE3 和 RADEON 8500,图形硬件的流水线被定义为流处理器,出现了顶点级可编程性,同时像素级也具有有限的编程性,但 GPU 的整体编程性仍然比较有限。

第三代 GPU(2006年以后), GPU实现方便的编程环境创建, 可以直接编写程序。2006年英伟达与 ATI分别推出了 CUDA (Compute United Device Architecture,计算统一设备架构)编程环境和 CTM(CLOSE TO THE METAL)编程环境, 使得 GPU 打破图形语言的局限成为真正的并行数据处理超级加速器。

2008年,苹果公司提出一个通用的并行计算编程平台 OPENCL(OPEN COMPUTING LANGUAGE,开放运算语言),与CUDA绑定在英伟达的显卡上不同,OPENCL 和具体的计算设备无关。

目前, GPU 已经发展到较为成熟的阶段。谷歌、 FACEBOOK、微软、 TWITTER 和百度等公司都在使用 GPU 分析图片、视频音频文件,以改进搜索和图像标签等应用功能。此外,很多汽车生产商也在使用 GPU 芯片发展无人驾驶。不仅如此, GPU 也被应用于VR/AR 相关的产业。

但是 GPU也有一定的局限性。深度学习算法分为训练和推断两部分, GPU 平台在算法训练上非常高效。但在推断中对于单项输入进行处理的时候,并行计算的优势不能完全发挥出来。

FPGA 是在 PAL、 GAL、 CPLD 等可编程器件基础上进一步发展的产物。用户可以通过烧入 FPGA 配置文件来定义这些门电路以及存储器之间的连线。这种烧入不是一次性的,比如用户可以把 FPGA 配置成一个微控制器 MCU,使用完毕后可以编辑配置文件把同一个FPGA 配置成一个音频编解码器。因此, 它既解决了定制电路灵活性的不足,又克服了原有可编程器件门电路数有限的缺点。

FPGA 可同时进行数据并行和任务并行计算,在处理特定应用时有更加明显的效率提升。对于某个特定运算,通用 CPU 可能需要多个时钟周期;而 FPGA 可以通过编程重组电路,直接生成专用电路,仅消耗少量甚至一次时钟周期就可完成运算。

此外,由于 FPGA的灵活性,很多使用通用处理器或 ASIC难以实现的底层硬件控制操作技术, 利用 FPGA 可以很方便的实现。这个特性为算法的功能实现和优化留出了更大空间。同时 FPGA 一次性成本(光刻掩模制作成本)远低于 ASIC,在芯片需求还未成规模、深度学习算法暂未稳定, 需要不断迭代改进的情况下,利用 FPGA 芯片具备可重构的特性来实现半定制的人工智能芯片是最佳选择之一。

功耗方面,从体系结构而言, FPGA 也具有天生的优势。传统的冯氏结构中,执行单元(如 CPU 核)执行任意指令,都需要有指令存储器、译码器、各种指令的运算器及分支跳转处理逻辑参与运行, 而 FPGA 每个逻辑单元的功能在重编程(即烧入)时就已经确定,不需要指令,无需共享内存,从而可以极大的降低单位执行的功耗,提高整体的能耗比。

目前以深度学习为代表的人工智能计算需求,主要采用 GPU、 FPGA 等已有的适合并行计算的通用芯片来实现加速。在产业应用没有大规模兴起之时,使用这类已有的通用芯片可以避免专门研发定制芯片(ASIC)的高投入和高风险。但是,由于这类通用芯片设计初衷并非专门针对深度学习,因而天然存在性能、 功耗等方面的局限性。随着人工智能应用规模的扩大,这类问题日益突显。

深度学习算法稳定后, AI 芯片可采用 ASIC 设计方法进行全定制, 使性能、功耗和面积等指标面向深度学习算法做到最优。

(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片技术
    +关注

    关注

    1

    文章

    159

    浏览量

    17498
  • AI
    AI
    +关注

    关注

    87

    文章

    30315

    浏览量

    268572
收藏 人收藏

    评论

    相关推荐

    哪些关键技术助力智慧园区建设

    在如今数字化转型的浪潮中,智慧园区已经成为城市发展的重要组成部分。建设智慧园区需要借助一系列关键技术来实现其智能化、高效化和可持续发展。其中,物联网技术被认为是连接各类设备、传感器和系统的核心
    的头像 发表于 11-29 13:58 36次阅读

    紫光同芯亮相SAECCE 2024汽车芯片关键技术及产业化应用论坛

    近日,SAECCE 2024汽车芯片关键技术及产业化应用论坛顺利举行。本次活动主要从汽车芯片关键技术、核心制造工艺、检测认证体系建设及产业化应用等方面讨论我国当前汽车
    的头像 发表于 11-17 09:28 333次阅读

    LLM大模型推理加速的关键技术

    LLM(大型语言模型)大模型推理加速是当前人工智能领域的一个研究热点,旨在提高模型在处理复杂任务时的效率和响应速度。以下是对LLM大模型推理加速关键技术的详细探讨,内容将涵盖模型压缩、解码方法优化、底层优化、分布式并行推理以及
    的头像 发表于 07-24 11:38 798次阅读

    深度学习在自动驾驶中的关键技术

    随着人工智能技术的飞速发展,自动驾驶技术作为其中的重要分支,正逐渐走向成熟。在自动驾驶系统中,深度学习技术发挥着至关重要的作用。通过模拟人脑的学习过程,实现对车辆周围环境的感知、理解
    的头像 发表于 07-01 11:40 698次阅读

    智能制造的关键技术有哪些?

    制造模式。智能制造的关键技术主要包括以下几个方面: 工业物联网(Industrial Internet of Things,IIoT) 工业物联网是智能制造的基础,通过将传感器、执行
    的头像 发表于 06-07 15:30 2207次阅读

    储能BMS的关键技术是什么

    组成部分,其关键技术对于提高储能系统的安全性、经济性和可靠性具有重要意义。本文将深入探讨储能BMS的关键技术,以期为相关研究和应用提供参考。
    的头像 发表于 05-17 15:28 682次阅读

    车载电池的类型及关键技术分析

    车载电池的关键技术涉及多个方面,这些技术共同决定了电池的性能、安全性、寿命以及成本,从而直接影响着电动汽车的整体竞争力和市场接受度。
    的头像 发表于 04-12 16:26 1336次阅读
    车载电池的类型及<b class='flag-5'>关键技术</b>分析

    EMI滤波器:工业应用的关键技术与性能优势?

    EMI滤波器:工业应用的关键技术与性能优势?|深圳比创达电子
    的头像 发表于 03-05 10:12 487次阅读
    EMI滤波器:工业应用的<b class='flag-5'>关键技术</b>与性能优势?

    浅谈电动车智能充电设计及研究

    浅谈电动车智能充电设计及研究 张颖姣 安科瑞电气股份有限公司 上海嘉定 201801 摘要:优化智能充电桩的设计可以解决相关问题,因此利用文献资料法等方法对电动汽车智能充电桩设计及
    的头像 发表于 02-26 10:48 392次阅读
    <b class='flag-5'>浅谈</b>电动车<b class='flag-5'>智能</b>充电设计及研究

    光伏逆变器拓扑概述及关键技术

    光伏逆变器拓扑概述及关键技术
    的头像 发表于 02-21 09:47 749次阅读
    光伏逆变器拓扑概述及<b class='flag-5'>关键技术</b>

    浅谈基于数字孪生的配电室关键技术研究

    ”的“数字孪生体”,提升“数据驱动”的全生命周期以及应用效能。而对于配电室而言,在其内部使用数字孪生技术,可以有效地提高配电室的运营和管理效率,并以数字孪生技术为基础,对其关键技术要素
    发表于 01-09 15:49

    浅谈基于数字孪生的配电室关键技术研究

    数字孪生配电室关键技术应运而生,数字孪生配电技术主要依托于孪生全景三维建模技术,构建配电室及配电设备的三维全景虚拟模型;再根据其中数据对此进行建模,掌握和操控配电室的运行状态。数字孪生配电室
    的头像 发表于 12-22 09:00 551次阅读
    <b class='flag-5'>浅谈</b>基于数字孪生的配电室<b class='flag-5'>关键技术</b>研究

    浅谈基于数字孪生的配电室关键技术研究

    摘要:在传统配电室的应用过程中,受环境、运维以及管理等外界因素的影响,导致传统配电室难以发挥实际价值。在此基础上,数字孪生配电室关键技术应运而生,数字孪生配电技术主要依托于孪生全景三维建模技术
    的头像 发表于 12-20 15:59 3179次阅读
    <b class='flag-5'>浅谈</b>基于数字孪生的配电室<b class='flag-5'>关键技术</b>研究

    人工智能中文本分类的基本原理和关键技术

    在本文中,我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用,以及从RNN到Transformer的技术演进。文章详细
    的头像 发表于 12-16 11:37 1191次阅读
    人工<b class='flag-5'>智能</b>中文本<b class='flag-5'>分类</b>的基本原理和<b class='flag-5'>关键技术</b>

    新型电力系统的智能装备关键技术

    智能电网技术主要用于保障电网运行的稳定性,因为新能源电源接入会引起系统电压和频率的偏差、电压波动和闪变等问题,从而影响到大电网系统的电能质量。开展智能配电网态势感知关键技术的研究,并促
    发表于 12-07 13:55 2165次阅读
    新型电力系统的<b class='flag-5'>智能</b>装备<b class='flag-5'>关键技术</b>