0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何优化AI SoC及其上面运行的软件

半导体芯科技SiSC 来源:半导体芯科技SiSC 作者:半导体芯科技SiS 2022-06-15 14:35 次阅读

人工智能机器学习应用数据处理的强劲需求下,大规模并行计算迅速兴起,导致芯片复杂性呈现爆炸式增长。这种复杂性体现在 Cerebras 晶圆级引擎等设计中,该设计是一种平铺多核、多晶片设计,将晶体管数量增加至数万亿个,拥有近百万个计算内核。

人工智能 (AI) SoC 的市场持续增长,竞争也日趋激烈。半导体公司根据性能、成本和灵活性,来找到自己的定位,并不断自我优化,从而导致了新型多核架构的爆发式增长。系统架构师正在尝试不同的方法,希望可以将这种复杂性转化为竞争优势。

在所有复杂性来源中,有一个在多核 AI SoC 中非常重要的来源:即当有多个线程在共享数据上并行运行时,会出现功能错误和性能降低问题。过去,设计人员可以使用经典的 CPU 运行控制来调试问题,但这种方法对多核架构并无效果。导致软件问题的根本原因错综复杂,包括往返时延、内核数量、控制和数据并行、多层层次结构和互相依赖的进程,设计人员从中找出真正根源的机会渺茫。

另外,设计人员还需要考虑软硬件协同优化,这需要大量的功能分析。为了在 SoC 上部署 AI 应用,设计人员必须编译源代码,以充分利用多核架构。这通常需要充分了解 SoC 架构的定制工具链。这个过程包括一个硬件和软件优化及测试周期,从 SOC 仿真开始,一直贯穿至第一次投片和后续器件迭代。

通过这一功能分析周期,团队能够了解以下内容:

· 数据共享的效率;

· 片上网络 (NoC) 是否超载或不平衡;

· 如何在不影响代码执行的情况下评估应用性能;

· 如何优化内存控制器配置文件以提升数据处理能力;

· 如何关联整个 SoC 中的事件;

要做到这一点,我们需要一种全新的方法来优化 AI SoC 及其上面运行的软件。要将高质量的 AI SoC 及时推向市场并在完成部署后保持性能,必须要进行系统范围的功能分析。系统范围功能分析的部分功能包括:

· 深入洞察子系统或组件 ;

· 对整个系统从启动开始的准确、连贯的全景图;

· 事物感知(Transaction-aware) 的互连监控和统计信息

· 传统的处理器运行控制和追踪;

· 支持所有常见的指令集和互连协议;

· 提供选择或更改重要子系统的灵活性;

· 用于产生数据可见性的灵活强大的工具;

用于监控和分析 IP 的片上基础架构和软件提供了所有这些功能,覆盖范围可从仿真到部署。下图即显示了 SoC 功能监控和分析的典型架构。

接下来的图中展示的示例是一个多核芯片配备片上网络 (NoC) 监视器,可跟踪所有 NoC 事务到循环缓冲器。由于 NoC 监视器具有事务感知功能,可将其配置为检测特定总线条件,例如导致事务持续时间超过特定阈值(按周期数计算)的死锁。当超过阈值时,NoC 监视器可以输出死锁事务以及之前事务的详细信息,以便对问题进行诊断。

同一个 NoC 监视器也可配置为在检测到相同死锁条件时——例如通过跟踪硬件加速器行为的状态监视器模块——使用嵌入式分析消息基础设施的交叉触发功能,在系统中的其他位置触发跟踪。

了解实施有效的系统验证和优化环境时涉及的问题,是成功交付多核 SoC 的关键,与该领域内的专业供应商合作可实现事半功倍的效果。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • soc
    soc
    +关注

    关注

    38

    文章

    3814

    浏览量

    216289
  • AI
    AI
    +关注

    关注

    87

    文章

    27442

    浏览量

    265122
  • 人工智能
    +关注

    关注

    1781

    文章

    44952

    浏览量

    232367
收藏 人收藏

    评论

    相关推荐

    西门子推出Catapult AI NN软件,加速神经网络在ASIC和SoC上综合

    在数字化工业的新浪潮中,西门子数字化工业软件再次引领潮流,日前推出了名为Catapult™ AI NN的革新性软件,旨在为神经网络加速器在专用集成电路(ASIC)和芯片级系统(SoC
    的头像 发表于 06-18 17:29 359次阅读

    已有超过500款AI模型在英特尔酷睿Ultra处理器上得以优化运行

    近日,英特尔宣布在全新英特尔 酷睿 Ultra处理器上,有超过500款AI模型得以优化运行
    的头像 发表于 05-11 09:31 445次阅读

    SiMa.ai推出针对Edge AI调整的SoC

    公司SiMa.ai现在正试图通过设计“软件优先”的硬件来应对这一挑战,以实现前所未有的边缘AI性能。本周,SiMa.ai发布了他们的新MLSoC平台,这是一个以ML为中心的
    的头像 发表于 05-07 17:00 962次阅读
    SiMa.<b class='flag-5'>ai</b>推出针对Edge <b class='flag-5'>AI</b>调整的<b class='flag-5'>SoC</b>

    SoC底层软件低功耗系统设计与实现》阅读笔记

    本帖最后由 缪靠斯兔 于 2023-10-18 12:51 编辑 花了一些时间阅读完了这本《SoC底层软件低功耗系统设计与实现》,收获良多,行业前辈的SOC底层软件的设计和调试经
    发表于 10-18 03:27

    超微收购Nod.ai 提升开源AI软件实力

    加速器、Ryzen AI处理器、EPYC处理器、Versal系统单晶片(SoC)以及Radeon显示卡等最佳化的AI解决方案部署。这项协议与AMD以开放软件产业体系为主轴的
    的头像 发表于 10-16 16:55 600次阅读

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    支持。需要做的不只是执行几条命令,还需要了解赛灵思硬件平台的特点,选择合适的模型和框架,使用 Vitis AI 提供的工具和库进行优化和编译,最后在目标设备上运行您的 AI 应用。这个
    发表于 10-14 15:34

    SoC系统中的软件结构设计

    在一个SoC的系统结构设计中,除了硬件结构以外,软件结构的设计对整个SoC的性能有很大的影响。
    的头像 发表于 09-25 15:14 705次阅读

    赛灵思AI引擎及其应用

    电子发烧友网站提供《赛灵思AI引擎及其应用.pdf》资料免费下载
    发表于 09-18 10:10 0次下载
    赛灵思<b class='flag-5'>AI</b>引擎<b class='flag-5'>及其</b>应用

    AI引擎及其应用

    电子发烧友网站提供《AI引擎及其应用.pdf》资料免费下载
    发表于 09-14 10:21 0次下载
    <b class='flag-5'>AI</b>引擎<b class='flag-5'>及其</b>应用

    【KV260视觉入门套件试用体验】部署DPU镜像并运行Vitis AI图像分类示例程序

    本文首先将会对Vitis统一软件平台和Vitsi AI进行简单介绍,然后介绍如何在KV260上部署DPU镜像,最后在KV260 DPU镜像上运行Vitis AI自带的图像分类示例。通过
    发表于 09-10 23:01

    软件优化指南

    优化对不同的人意味着不同的事情。 在某些情况下,您可能只是希望代码尽可能快地运行。 但是,如果您正在为嵌入式系统编写代码,您可能更喜欢优化代码密度以减少应用程序的内存占用。 通常,这些优化
    发表于 08-28 06:41

    优化责任国(SOC)精确度和电池管理系统(BMS)设计

    优化责任国(SOC)精确度和电池管理系统(BMS)设计
    的头像 发表于 08-25 15:35 923次阅读
    <b class='flag-5'>优化</b>责任国(<b class='flag-5'>SOC</b>)精确度和电池管理系统(BMS)设计

    ai芯片和soc芯片的区别

    ai芯片和soc芯片的区别 随着人工智能技术的快速发展,AI芯片和SoC芯片成为了当今最热门的话题之一。很多人对这两种芯片可能会存在一些混淆,甚至认为它们是同一种芯片。然而,实际上,这
    的头像 发表于 08-08 19:00 3217次阅读

    AI芯片和SoC芯片的区别

    AI芯片和SoC芯片都是常见的芯片类型,但它们之间有些区别。本文将介绍AI芯片和SoC芯片的区别。
    的头像 发表于 08-07 17:38 2763次阅读

    【书籍评测活动NO.19】 SoC底层软件低功耗系统设计与实现

    余年经验总结,底层软件低功耗领域里程碑作品(2)系统剖析SoC底层软件低功耗系统的设计、实现与定制化,全面讲解低功耗的知识点以及各种低功耗问题的定位和优化
    发表于 07-28 11:09