智能科技已经无缝融入到每个人的生活中。使用智能音箱查询天气、播放歌曲、甚至进行会议提醒确实很方便,但如果黑客能够访问你所有的数据和交易信息,那会不会是一场灾难呢?在万物智能(Pervasive Intelligence)时代,人工智能(AI)和安全已经成为超越传统芯片设计界限的关键因素。
半导体行业的迅猛增长主要是由AI(人工智能)、ML(机器学习)和DL(深度学习)等技术的广泛应用所驱动的,这些技术对计算要求极高,需要专用芯片和高效的设计来支持智能功能。从语音和文本识别到高性能计算(HPC)、数据中心、搭载AI的个人电脑及自动驾驶汽车等,这些计算密集型任务依赖于先进的架构。这些架构不仅能够提供强大的计算能力,还能随着时间的推移优化,不断提升决策能力。尤其是在科学和医学研究、气象预报、金融、石油与天然气勘探等细分领域,需要更强大的算例资源,以有效进行数据分析和数字计算。
人工智能的发展势头正在加速。随着越来越多的智能设备接入云端,人工智能的潜力呈指数级增长,从而创造了庞大的市场机遇。为了让设备根据现实条件快速做出决策,AI相关计算的关键部分必须在硬件中完成。专用的“AI芯片”对于经济高效地实现规模化AI应用至关重要,它们为特定应用带来了创新且颠覆性的解决方案。
当前用于AI/ML/DL应用的芯片含有定制的处理器架构和复杂的数据路径,能够准确执行所需的算术分析。行业对数据处理能力的需求日益增长,对功能自动化的期望不断提高,智能技术在各类应用中的广泛集成,芯片开发者和验证团队也亟需采用现代化的验证技术,推动人工智能技术进一步发展。
在本文中我们将共同探讨以下几个问题:AI芯片对硅工程的影响,以及开发者面临的关键功耗、性能和面积(PPA)有哪些挑战?将AI芯片普及到各应用领域的潜在机遇有哪些?对高级验证有哪些需求?为何硬件安全在未来将变得至关重要?
不是只有半导体公司才能设计芯片
随着摩尔定律逐渐接近极限,从通用处理器获得期望的性能增益变得越来越困难。因此,许多非传统半导体领域的公司开始自行设计芯片,以适应特定应用的需求。
像英伟达、英特尔、AMD、高通、Meta、亚马逊、阿里巴巴、微软和谷歌这样的公司,目前都在积极投资开发自己的定制ASIC(应用特定集成电路)芯片,旨在支持他们的AI软件并满足具体应用的需求。十年前,几乎没有行业专家能预见到像Meta这样的社交媒体公司会涉足这一领域。
此外,汽车、HPC和云计算等市场的系统和软件公司也开始自主构建专用硬件架构。越来越多企业开始涉足芯片开发领域,这样的市场增长孕育了海量全新机遇,为当今要求苛刻的芯片设计环境带来了一系列新的设计工具和解决方案。
在AI设计中采用RISC-V处理器架构
RISC-V起初主要用于嵌入式应用和微控制器领域。经过多年的发展,这个开源标准在汽车、数据中心和高性能计算等诸多应用领域持续受到关注,也越来越多地应用到各式各样的AI工作负载中。以下为广泛采用RISC-V架构的主要领域:
人工智能:AI芯片往往采用异构设计,开发者会尽可能选择RISC-V等现成的处理器,着力于开发高性能、高能效的AI加速器,用于完成诸如神经网络处理和自然语言处理等任务。
汽车:对于汽车SoC,RISC-V处理器可以满足信息娱乐、高级驾驶辅助和通信等系统对性能、功耗、成本和安全性的要求。
高性能计算(HPC)和数据中心:RISC-V内核非常适合使用定制ISA来处理复杂的计算任务,而RISC-V扩展可以支持开发简单、安全和灵活的内核,从而满足这些应用的能效要求。
是什么让AI芯片设计与众不同?
从AI初创公司到全球主要的云服务提供商,各方纷纷加大研发力度,相继推出了GroqChip、Nvidia H100 GPU、Ambarella CV52S、Atlazo AZ-N1、AWS Trainium和Google TPU v4等备受瞩目的AI芯片。这些创新激发了一波又一波的芯片开发浪潮,推动了业界在开发更加快速和高效的AI芯片方面的竞争。
如今,以数据为中心的计算正在改变PC格局。而基于人工智能的PC正蓄势待发,有望为大众带来强大的智能功能。英特尔的目标是到2025年为1亿台支持人工智能的PC提供内核处理器。这家芯片制造巨头正在与微软携手定义人工智能PC,最终的成果预计将配备用于AI工作负载的神经处理单元和微软的Copilot AI聊天机器人。
在当前对AI片上系统(SoC)的新投资中,主要目的之一是让系统能够通过分布式操作执行多重计算任务,这一点超越了传统CPU所提供的有限并行处理能力。AI/ML硬件设计包括多个数据密集型模块,如控制路径和计算模块。控制路径通过状态机根据特定输入处理输出;计算模块则包含加法器、减法器、乘法器和除法器等算术逻辑单元,负责执行各类数据运算。这些功能极大地提高了AI算法处理大量重复、可预测和独立计算任务的速度。
虽然计算模块对于大多数设计团队来说可能难度不大,但随着算术模块和位数的增加,其实施复杂程度也将急剧攀升,从而给验证团队带来额外的压力。
我们以一个简单的4位乘法器为例。为了验证它的完整功能,开发者需要为24=16种输入组合编写测试向量。那么挑战在哪里呢?在验证当今AI芯片的实际场景时,由于数据处理量巨大,团队需要验证具有64位输入的加法器。也就是说需要验证264个状态,如果依靠传统方法,则需要花费数年时间才能完成。
而这只是在设计中包含单一乘法器或除法器的情况。随着AI芯片的应用领域快速扩展,数据量的增长也在持续爆炸,这一趋势使得整个情况变得更加复杂。为了应对硬件验证中的各种挑战和耗时任务,开发者迫切需要一种安全且灵活的现代化验证解决方案。
芯片验证所面临的主要挑战
在团队设计AI芯片时,通常会选择运行速度较快且用途较广的C/C++来编写设计算法。编写完功能代码后,需要使用RTL(寄存器传输语言)将信息转换为更适用于硬件的表示形式,以便实现设计。为此,团队要么为所有可能的组合开发测试向量,要么验证RTL是否与原始的C/C++架构模型保持一致,这两项任务相当艰巨,无论作何选择,都需要投入大量的时间和精力。
当需要全面验证而连续迭代方法显得不现实时,可以采用形式化验证等技术。形式化验证通过数学分析,允许一次性全面考虑整个硬件设计,从而无需为每种输入组合编写测试向量。相反,可以使用模型检测器,根据一系列预定义的行为断言来验证设计。
十年前,形式化验证需要使用高级断言,被视为一项仅限专家操作的技术。但现在情况已大为不同。如今,任何RTL开发者或验证开发者都能迅速掌握相关技能并将其应用于设计中,这要求当前的验证工具必须简单易用。此外,改善工具的调试功能也极为关键,它有助于开发者理解复杂且不熟悉的设计行为,以及统一多样化且复杂的设计环境。
然而,鉴于当前AI芯片的巨大尺寸、规模和复杂性,通过模型检测实现完整的验证已不再可行。从长远来看,使用传统方法来验证这些数学功能不仅效率低下、耗时,也是不现实的。对于灵活且可定制的RISC-V架构来说,每当添加新的自定义指令时,确保所有配置都经过彻底验证是另一个挑战。
AI和ML应用亟需高级数据路径验证
验证开发者可以通过等效性检查等其他形式化验证来高效验证复杂的AI数据路径。这种方法可以比较同一设计的两种表示形式,由此能够证明这两种形式是否等效,识别出它们之间的具体差异。借助强大的形式化验证引擎,这两种表示形式可以处在截然不同的抽象层次上,甚至可以用不同的编程语言编写,这无疑是巨大的优势。这种方法通常用于根据逻辑综合所生成的门级网表来检查RTL输入。
例如,可以将芯片设计的详细RTL实现与高级C/C++架构模型进行比较。这种比较可以确认对于这两种表示形式,同一组输入会生成相同的输出。这个有效的方法适合很多AI项目,因为大多数项目已拥有C/C++模型,可用于仿真中的结果检测,或作为虚拟平台的一部分来支持早期软件开发和测试。
要根据经验证的参考模型对设计数据路径进行详尽验证,形式化等效性检查仍然是目前少数可行的技术。为了推动AI应用不断发展,并验证今后热门AI应用中的复杂功能单元,验证工具和解决方案需要简单易用,可扩展到更大的设计规模,并拥有能快速检测错误的高级调试功能。
在实现层面,要达到所需的PPA通常会遇到一些挑战。对此,新型全环绕栅极(GAA)技术节点和Multi-Die设计架构可以提供帮助。Synopsys.ai全栈式AI驱动型EDA整体解决方案可处理重复性任务,例如设计空间探索、验证覆盖和回归分析,从而更快完成PPA的优化。
从当前的AI加速器到日后的认知系统
硬件设计已成为AI创新的核心推动力。当前计算工作负载的加速发展,对于缩短设计和验证周期的迫切需求仍将保持增长。如今,新思科技提供多款成熟可靠的验证解决方案,助力开发者在众多应用领域中验证复杂的AI架构。
新思科技VC Formal等新一代形式化验证解决方案为开发团队带来所需的速度、容量和灵活性,助其验证复杂的SoC设计。该解决方案包含全面的分析和调试技术,可帮助团队通过新思科技Verdi调试平台快速识别根本原因。
VC Formal解决方案提供了一套广泛的形式化验证应用,其中包括集成了HECTOR技术的VC Formal数据路径验证(DPV)应用。其中,HECTOR技术已成功部署于许多要求苛刻的AI芯片项目。借助定制优化和用于数据路径验证的引擎(ALU、FPU、DSP等),VC Formal解决方案可报告RTL和C/C++模型结果中的所有差异,以便在Verdi SoC调试平台中进行诊断,并验证二者是否已消除所有差异且达到等效目标。VC Formal解决方案已帮助多家创新芯片开发商和新兴AI/ML芯片公司收获累累硕果。
此外,我们的解决方案还利用了并行处理的优点,允许同时在多个内核上运行仿真,享受云端的优势。这意味着,即使是那些有临时性、高强度计算需求的企业,也可以使用我们的工具来设计AI硬件。AI市场日新月异、蓬勃发展,我们很高兴能够通过前沿的验证解决方案为AI行业提供支持,助力开创AI芯片和软件的新时代。
不久的将来:AI芯片将实现同态加密
AI行业将持续处理数万亿字节的数据,并且需要高性能芯片来维持这种计算范式,因此数据位数的增加无可避免。全球众多大学和研究机构正积极探索处理大规模位数输入数据(如4096位)的可行性,并致力于构建相应的解决方案,以设计支持此类庞大数据输入量的芯片。而这正是VC Formal数据路径验证和形式化安全验证(FSV)应用的理想应用场景。
海量数据正如潮水般涌入,对硬件安全防护的需求也随之加剧。比如,最近发生了一起价值6亿美元的加密货币盗窃案,这是去中心化金融领域有史以来金额最庞大的盗窃案,暴露出了一些可能被网络犯罪分子所利用的紧急威胁和漏洞,凸显了端到端安全的重要性。同态加密将成为AI/ML芯片发展不可或缺的一部分。简单地说,借助同态加密,您可以加密数据并在不解密的情况下执行AI系统所需的相同算术计算,从而降低数据泄露的风险。同态加密是前景可期的发展方向,有望提升AI芯片设计的效率和结果质量。为了推动同态加密的广泛采用,我们亟需开发下一代工具来助力其快速增长。
总结
人工智能日渐普及各方面计算应用,无论在哪个细分市场,AI芯片要想取得成功,都需要对设计进行充分验证。没有人希望自己的自动驾驶汽车撞上那些被图像识别分析所忽略的障碍物。新的边缘AI设备将推动实时海量数据计算爆炸式增长,并改变芯片开发者的半导体设计方式,由此会提高生产力、缩短周转时间并带来更出色的验证解决方案。
一个以人工智能为核心的新时代即将来临。如今,我们还需要引导才能回答问题的虚拟助手,未来是否能发展成像钢铁侠中的J.A.R.V.I.S那样的智能助理呢?一切答案,时间将会揭晓。
评论
查看更多