0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MCU+NPU集成迎来新突破?

Big-Bit商务网 来源:Big-Bit商务网 作者:Big-Bit商务网 2024-12-13 14:28 次阅读

随着MCU主要应用领域工业和汽车领域对智能化的需求增加,高性能、智能化、低延迟、决策更快的实时控制成为MCU发展的重要方向。基于此,作为全球头部半导体厂商TI提供了怎样的产品方案

当下,MCU应用已经渗透到智能家居工业自动化汽车电子、航空航天等多个领域。MCU在从8位到32位,再到64位过程中,处理能力日益强大。并且更多外设和功能与MCU集成到单一芯片上,实现了更高程度的集成化和微型化的MCU。

不过产品性能快速发展的同时,目前MCU也面临许多应用上的痛点:随着应用越来越复杂,对MCU的性能要求越来越高,但也需要寻求MCU性能与成本、MCU算力与功耗的平衡。

同时,随着网络安全威胁的增加,MCU需要集成更多的安全特性来保护系统免受攻击。尤其是在关键应用中,如汽车和工业控制,高可靠性和稳定性的MCU是必不可少的。

此外,随着MCU算法性能的提升,MCU需要处理的数据也越来越复杂。提高故障检测的实时性、准确性,降低复杂性也是集成化MCU应用锁面临的重要挑战。

为了解决以上MCU应用领域的痛点,当下主流MCU厂商陆续设计了不同角度的方案,例如以开源软件和开发工具实现成本降低;或是采用模块化设计减少开发和测试成本,等等。

作为全球头部的半导体厂商,近日德州仪器(以下简称“TI”)也发布了两款新型C2000TMMCU——TMS320F28P55x系列和F29H85x系列,致力于提高系统效率、安全性和可持续性。

据悉,TI的嵌入式产品线涵盖了从Cortex-M0系列到多核异构处理器,后者在汽车、工业及人工智能领域广泛应用,最高算力可达32TOPS。在这一庞大的产品矩阵中,F28P55X与F29H85x仅是其中的两款代表性产品。

那么这两款MCU新品,反映出TI在解决MCU应用痛点的哪些思路和方案?

01 | 实时控制MCU:发展的主要方向

实时控制MCU是面对当下市场趋势下MCU发展的一个趋势和前沿热点。

随着MCU主要应用领域工业和汽车领域对智能化的需求增加,以及消费电子产品性能不断提升,这些领域需要MCU拥有极高的实时响应能力和强大的运算能力。

在此背景下,高性能、智能化、低延迟、决策更快的实时控制MCU成为MCU发展的重要方向。

德州仪器中国区技术支持总监师英对实时控制系统做了解释:实时控制MCU系统的首要之务,便是对真实物理世界进行精密的传感:通过ADC与采样电路,将模拟信号采集并转化为数字信号

“以电机控制系统为例,电流与电压的波形,以及位置传感器的信号,均被送入实时控制MCU中,经过一系列复杂的数学转换与运算,最终通过PWM输出至执行机构。在这个电子化的实时控制世界里,MCU或DSP,无疑是整个系统的智慧大脑。而Sensing部分则如同我们的感官,执行机构则相当于肌肉系统。此外,通信模块也是不可或缺的一环,无论是EtherCAT、以太网CAN,还是串行通信,均构成了这一基础实时控制MCU系统的血脉。”

wKgZO2db1CeAMPKkAABxDuvd-pg086.jpg

德州仪器中国区技术支持总监师英

在现实生活中,特别是在工业与汽车应用领域,马达驱动与数字电源变换是最为常见的实时控制MCU系统。这两种应用均要求处理器具备极高的实时性,不仅要求强大的数学运算与实时处理能力,还需配备出色的ADC与PWM,并通过一系列联动机制,共同构成一个高效、有机的实时控制MCU系统。

02 | 相较于CPU集成方案,MCU+NPU性能提高5-10倍

但是在MCU实际开发过程中,如何运用高级别实时控制MCU,打造一套既精密又安全,同时性价比极高的实时控制MCU系统,是当前工程师在打造实时控制系统难题。

为了解决这个难题,目前主流产品方案是将MCU与收发器接口LDOAFE等模块和电路进行集成,或是MCU集成CPU、DSP、AI加速器,以及AI算法和模型,从而提高MCU的算法性能。

而这次新发布、被TI称为业内率先推出的具有集成神经处理单元的实时控制MCU的C2000TMMCU——TMS320F28P55x,正是在如今MCU市场需求下,MCU+NPU产品方案集成的一大重要成果。

wKgZPGdb1CiAUm0hAAHUETvb1og783.jpg

图源:TI官网

据师英介绍,NPU能够独立完成AI领域常见的运算算子。虽然普通CPU也能完成这一运算,但效率相对较低。而利用神经网络加速单元,其性能将比使用C2000的CPU提高5-10倍。

“关于MCU集成NPU,已有若干实际应用案例崭露头角,例如,在太阳能及供电系统中的电弧检测应用。当接触发生时,高压导线或触点间常常会产生电弧现象,这一潜在危险源可能引发火灾,因此,对电弧的有效检测与预防显得尤为重要;此外,在马达驱动领域,对马达运行状态的预测同样关键,旨在预判其未来可能出现的故障。”

通过F28P55XMCU的运算机制,故障检测的准确率可高达99%。F28P55XMCU是在C2000系列MCU中融入了NPU内核,这意味着,只需通过单一芯片,F28P55XMCU能够用单一型号完成原本需要额外故障检测MCU的功能,从而提供更紧凑、更小尺寸、更低成本的MCU设计方案。

wKgZO2db1CiAKuPIAAAuRJcsDDQ944.jpg

图源:TI官网

师英介绍,该MCU内置的Flash memory最高可达1.1MB。对于实时系统而言,ADC与高精度PWM是两大核心外设。具体而言,F28P55X提供了24个高精度PWM通道以及最多39个ADC通道。

“之所以C2000MCU一直被行业内的工程师认可和青睐,就是因为它切中了实时控制的这个点。对于实时控制来讲,它有高性能的数学运算单元和协处理器单元,ADC和PWM两个关键外设,从sensing到accusation execution的链路整个的一个优化,这是C2000 MCU实时处理核心的竞争力。”

03 | MCU与边缘AI:实现高精度检测性能的发展方向?

在当前工业及汽车领域的实时控制MCU系统中,一个显著趋势是:越来越多的任务倾向于采用更为智能、基于AI的方法来完成。从运算单元的位置来看,AI可分为云端AI与边缘AI两类。对于嵌入式系统或实时控制系统而言,边缘AI无疑是一个必然选择。

边缘AI下的实时性得到显著提升,无需将数据上传至云端,从而避免了传输延迟;其次,通过算法优化及NPU的加入,系统整体功耗得以降低。另外,从安全性与可靠性的角度来看,避免了数据采集与传输至云端的过程,有助于提升设备的安全性。

在传统的非NPU方案中,主要是通过对直流母线电压与电流进行采样,并设置一系列触发阈值或规则来判断电弧是否发生。这种方法存在诸多限制,检测准确率往往难以提升,一般仅能达到85%左右。这便是现有或传统解决方案所面临的问题。

F28P55X这一创新解决方案的过程中,原有的DC/DC转换器逆变器以及MPPT系统均继续沿用了C2000系列的核心技术,这意味着原始的实时控制拓扑结构与硬件配置基本保持不变,特别是软件算法层面无需做出调整。

师英介绍,唯一的变化在于利用F28P55X内置的NPU来专门执行电弧检测任务。

那么,如何实现99%的高检测准确性呢?

“这得益于我们先进的离线边缘AI工具——TI Edge AI Tools。该工具能够针对大量电弧发生时的电流与电压数据进行深度训练,从而构建一个精准的CNN模型。模型训练完成后,通过专用的软件开发工具,即可轻松部署至F28P55X的NPU上。由于这一过程基于庞大的数据集进行训练,而非依赖传统的软件设计规则与触发阈值来判断电弧情况,因此其检测准确率能够高达99%。”

04 | MCU+NPU如何实现功耗与成本控制?

德州仪器中国区技术支持总监师英也介绍了目前F28P55X的使用案例,“我们的合作伙伴已成功开发出基于F28P55X的电弧检测模块。该模块单次电弧判断时间可缩短至5毫秒,且在检测到电弧后的0.2秒内即可迅速自动切断电路,其误报率近乎为零。”

当MCU集成边缘AI等算法性能后,功耗也会相应提高。性能与功耗的相对平衡也是如今许多MCU集成化下遇到的难题之一。

wKgZPGdb1CmAW7_6AABXF4lWhIY133.jpg

TI供图

“从功耗优化的角度来看,执行相同卷积运算时,CPU所需时间可能是NPU的5到10倍。在评估功耗时,需综合考虑电流峰值与工作时间。尽管NPU启动时的电流峰值可能较高,但由于其任务完成时间大约只有原本用时的1/10,从而能够有效降低整体功耗。

在成本控制方面,师英介绍,C2000系列的边缘AI一般是在工业控制领域或者汽车功能控制领域,“针对不同的应用,我们会去匹配相应的算力与功能配置,这是很重要控制成本的一点。”

05 | 实时控制MCU,如何实现运算效率提升?

在实际应用层面,除了更实时和精准的MCU控制外,随着工业与汽车领域执行效率的提升速度日益加快,电机转速也随之提高。在此背景下,新一代功率半导体的应用使得开关调制频率同步增高,这也要求实时运算处理器MCU的运算效率需要实现大幅度提升。

TI此次发布的另一款新品F29H85x 系列,正是致力于提供工业与汽车领域下高算力MCU需求的产品方案。

师英介绍,F29H85x MCU搭载了新型C29内核,这是C2000系列CPU多年来的一次重大迭代升级,其处理位宽从32位跃升至64位,并配备了超长指令级架构,使得单个指令周期最多能并行完成8条指令。

“与上一代C28内核相比,C29在信号链性能上可实现2至3倍的提升。对于马达驱动的数学运算与实时运算而言,其性能可提升2倍;而在电源变换方面,C29的性能则可提升约3倍。若仅就FFT运算而言,C29的运算速度相较于C28可提升5倍。C29的CPU版本在数学运算能力上实现了极为显著的提升。此外,与C28相比,C29的中断响应速度也提升了4倍。”

wKgZO2db1CmAIibbAAPK7gLvMwE885.jpg

图源:TI官网

具体到集成方案设计上,由于F29H85x的中断效率得到提升,并支持功能安全与信息安全,因此仅需一颗MCU便能实现OBC+DC/DC+主机MCU的三合一功能。这不仅提升了效率,还减小了尺寸并降低了成本。

F29H85x能够更快地进行运算和中断响应,因此对于第三代半导体功率半导体的支持也得以大幅度提升PWM的开关频率,从而提高系统的效率。更高的开关频率意味着磁性元器件的尺寸可以减小,进而使得整个系统的尺寸也相应减小。

06 | F29H85x如何实现汽车控制应用的集成化方案?

得益于CPU性能的提升,F29H85x可广泛应用于众多实时控制领域。

例如,汽车中的牵引电机控制往往不仅限于一个电机,而是可能涉及多个电机的协同控制,最常见的配置是双电机应用。

在传统的双电机系统中,每个牵引电机都需要一个独立的电机驱动控制环路,同时还需要一个主机来负责功能安全和AUTOSAR的运行。此外,还需要昂贵的旋变解码器电路来检测驱动牵引电机的转子位置。双电机系统则需要两个这样的控制器和两份旋变解码器电路。

师英介绍,采用F29H85x时,可以利用CPU1和CPU2的锁步运行来完成功能安全和AUTOSAR的任务,同时用CPU3来控制两路电机。值得一提的是,F29H85x内部集成了旋变解码器功能,或者使用TI提供的另一种磁性位置传感解决方案,都可以实现用一个芯片完成所有功能,并集成到整个系统中。

另外,在高压一体化电动汽车中,传统上完成OBC+HVLV DCDC(高低压直流转换器)+主机的功能通常需要三个MCU。

然而,采用F29H85x时,由于其内部集成了一对锁步运行的CPU,以及一个独立的C29内核,因此仅需一颗MCU即可完成整套系统的功能。CPU1和CPU2的锁步运行能够很好地支持ASIL-D级别的功能安全需求,同时两者均可运行AUTOSAR,这是几乎所有设备都需要的。而CPU3则可以独立承担OBC和DCDC的控制环路,实现单芯片系统的高效运行。

07 | 小结

随着应用范围越来越广、应用程度越来越深,具有极高实时响应能力和强大运算能力MCU成为了当下市场主要的需求。

在这种背景下,MCU与TMU、CLA、CPU、NPU等组件进行更深程度的集成和搭配,以实现更高性能的算力和更精准的功能。

发展过程中,集成方案下的性能达成度、功耗与性能的平衡、边缘AI应用下的成本控制等成为MCU集成化发展下的诸多应用难题。这些也将是未来MCU集成化方案下提升的主要方向。

正如德州仪器中国区技术支持总监师英所说,未来还将推出更多不同配置的新产品,以满足基于应用需求的更高性价比要求。MCU集成化下的应用难点,也将随着技术与方案的优化,不断取得突破与升级。

本文为哔哥哔特资讯原创文章,未经允许和授权,不得转载,

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • mcu
    mcu
    +关注

    关注

    146

    文章

    17109

    浏览量

    350894
  • NPU
    NPU
    +关注

    关注

    2

    文章

    277

    浏览量

    18581
收藏 人收藏

    评论

    相关推荐

    解读德州仪器MCU新品:带NPU的C2000有什么不同?

    单元 (FPU)、三角函数加速器 (TMU) 和 VCRC(循环冗余校验)扩展指令集,同时该系列器件还内部集成NPU计算单元,进一步增强了该系列MCU对算法模型的支持能力。   据介绍,TMS320F28P55x系列是德州仪器
    的头像 发表于 11-25 00:21 2534次阅读

    NPU支持的编程语言有哪些

    NPU(Neural Processing Unit)是一种专门为深度学习和人工智能应用设计的处理器。NPU支持的编程语言通常与它所集成的平台或框架紧密相关。以下是一些常见的编程语言和框架,它们可以
    的头像 发表于 11-15 09:21 580次阅读

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习等机器学习任务设计的处理器,其与机器学习算法的关系日益
    的头像 发表于 11-15 09:19 420次阅读

    NPU的工作原理解析

    神经网络的计算流程,显著提高了处理速度和能效。NPU通常集成在SoC(System on Chip)中,与CPU和GPU协同工作,共同完成复杂的计算任务。 NPU的架构 NPU的架构设
    的头像 发表于 11-15 09:17 543次阅读

    如何选择合适的NPU型号

    选择合适的NPU(神经处理单元)型号是一个涉及多个因素的综合考量过程。以下是一些建议,帮助您做出明智的选择: 一、明确应用需求 应用场景 : 根据您的应用场景(如计算机视觉、自然语言处理、自动驾驶
    的头像 发表于 11-15 09:16 370次阅读

    NPU在边缘计算中的优势

    随着物联网(IoT)和5G技术的发展,边缘计算作为一种新兴的计算模式,正在逐渐成为处理和分析数据的重要手段。 NPU的定义与功能 NPU是一种专门为深度学习和神经网络运算设计的处理器。与传统的CPU
    的头像 发表于 11-15 09:13 351次阅读

    NPU技术如何提升AI性能

    随着人工智能技术的飞速发展,深度学习作为AI领域的核心驱动力,对计算能力的需求日益增长。NPU技术应运而生,为AI性能的提升提供了强大的硬件支持。 NPU技术概述 NPU是一种专门为深度学习算法
    的头像 发表于 11-15 09:11 400次阅读

    什么是NPU芯片及其功能

    在人工智能(AI)技术迅猛发展的今天,NPU芯片已经成为推动这一领域进步的关键技术之一。NPU芯片,即神经网络处理单元,是一种专门为深度学习算法设计的硬件加速器。 一、NPU芯片的概念 NPU
    的头像 发表于 11-14 15:48 775次阅读

    NPU在深度学习中的应用

    随着人工智能技术的飞速发展,深度学习作为其核心驱动力之一,已经在众多领域展现出了巨大的潜力和价值。NPU(Neural Processing Unit,神经网络处理单元)是专门为深度学习
    的头像 发表于 11-14 15:17 473次阅读

    NRK3502语音识别芯片赋予取暖桌全新智慧,让温暖更近一步

    九芯电子NRK3502语音识别芯片加入取暖桌,实现语音控制,提升便捷性。芯片采用MCU+NPU架构,支持离线远场识别,为智能家居注入新活力,未来取暖桌将更智能、贴心。
    的头像 发表于 10-27 09:38 198次阅读
    NRK3502语音识别芯片赋予取暖桌全新智慧,让温暖更近一步

    恩智浦推出全新i.MX RT700跨界MCU系列

    高度集成的全新i.MX RT700跨界MCU旨在显著节省功耗,配备eIQ Neutron神经处理单(NPU),可在边缘端提供高达172倍的AI加速。
    的头像 发表于 10-12 11:41 781次阅读

    什么是NPU?什么场景需要配置NPU

    在人工智能(AI)技术如火如荼的今天,NPU神经处理单元(Neural Processing Unit)作为一种新兴的硬件加速器,正在成为ARM主板配置中的新宠。与传统的CPU和GPU相比,NPU
    的头像 发表于 10-11 10:13 1431次阅读
    什么是<b class='flag-5'>NPU</b>?什么场景需要配置<b class='flag-5'>NPU</b>?

    NXP推出集成NPUMCU,支持AI边缘设备!MCU实现AI功能的多种方式

    旨在显著节省功耗,可在边缘端提供高达172倍的AI加速。   MCU 集成NPU 支持AI 功能   恩智浦推出的这款i.MX RT700内部集成了恩智浦自研的eIQ Neutron
    的头像 发表于 09-29 01:11 3726次阅读

    在SITARA MCU器件上集成MbedTLS

    电子发烧友网站提供《在SITARA MCU器件上集成MbedTLS.pdf》资料免费下载
    发表于 08-27 10:44 0次下载
    在SITARA <b class='flag-5'>MCU</b>器件上<b class='flag-5'>集成</b>MbedTLS

    芯旺微电子KungFu内核车规级MCU累计交货突破1亿颗

    芯旺微电子KungFu内核车规级MCU累计交货突破1亿颗
    的头像 发表于 03-19 15:06 929次阅读
    芯旺微电子KungFu内核车规级<b class='flag-5'>MCU</b>累计交货<b class='flag-5'>突破</b>1亿颗