MbedTLS纯软件实现和使用i.MX RT芯片里的硬件加速器实现性能差异-电子发烧友网

近期有i.MX RT客户在集成OTASBL项目，实现产品的2nd bootloader时遇到了 MbedTLS库算法性能问题，客户想知道MbedTLS纯软件实现和使用i.MX RT芯片里的硬件加速器实现，在性能上差距有多大。

借着客户这个问题，我们今天就在i.MX RT上实测看一下两个方式的性能差异。

客户使用的是i.MX RT1170，这个型号上的硬件加速器是CAAM，相比前一代架构 i.MX RT10xx系列上的DCP有升级，我们今天把DCP和CAAM同时测一下。

一、MbedTLS算法库简介

MbedTLS（前身 PolarSSL）是一个开源的 SSL/TLS 算法库，最早由Arm 公司开源和维护，现在已经移交 Trusted Firmware 社区维护。MbedTLS 开源仓库地址为：

项目地址：https://github.com/ARMmbed/mbedtls

MbedTLS代码由 C 语言写成，其以最小的编码占用空间实现了 SSL/TLS 功能及各种加密算法，易于理解、使用、集成和扩展，方便开发人员轻松地在嵌入式产品中使用 SSL/TLS 功能。

MbedTLS软件包主要提供了如下支持:

完整的SSL v3、TLSv1.0、TLSv1.1 和TLS v1.2 协议实现

X.509 证书处理

基于TCP 的TLS 传输加密

基于UDP 的DTLS（DatagramTLS）传输加密

其它加解密库实现

二、i.MX RT上的硬件加速器简介

1, i.MX RT10xx系列上的DCP

DCP 是 Data Co-Processor 的简称，从名字上看是个通用数据协处理器。

在 i.MX RT1060 Security Reference Manual 中有一张系统整体安全架构简图，这个简图中标出了 DCP 模块的主要功能：CRC-32算法、AES算法、Hash算法、类DMA数据搬移。关于进一步用法，见痞子衡两篇旧文《i.MX RT10xx DCP使用时密钥注意事项》、《i.MX RT10xx DCP使用时Cache注意事项》。

2, i.MX RT11xx系列上的CAAM

CAAM 是 Cryptographic Acceleration and Assurance Module 的简称，是个超全功能的安全算法加速器。在 i.MX RT1170 Security Reference Manual 中有一张系统整体安全架构简图，这个简图中标出了 CAAM 模块的主要功能，其在 DCP 已有功能上做了进一步扩展，丰富了算法支持。

三、对比常见算法的软硬件实现性能差异

1，官方SDK例程简介

想要在MCU 上跑 MbedTLS 算法，正常是需要先移植MbedTLS 源码的。但是恩智浦 i.MX RT官方SDK包里已经做好了移植，源码就放在 SDK_2.11.0_MIMXRT1xxx-EVKmiddlewarembedtls下面，所以我们省去了移植步骤。

注：在 SDK 2.11 版本里移植的是 MbedTLS 2.27.0。

此外官方SDK 里还提供给了如下两个关于 MbedTLS 的基础例程，其中 mbedtls_selftest 是遍历全部算法，检测算法执行正确性；mbedtls_benchmark则是提供全部算法的实际运行性能数据（编解码速率 KB/s）。

SDK_2.11.0_MIMXRT1xxx-EVKoardsevkmimxrt1xxxmbedtls_examplesmbedtls_selftest

SDK_2.11.0_MIMXRT1xxx-EVKoardsevkmimxrt1xxxmbedtls_examplesmbedtls_benchmark

2，在i.MX RT1060上实测

我们现在在 MIMXRT1060-EVK 板子上实测算法性能，就用mbedtls_benchmark 例程，选择 debug build，即让代码跑在 TCM 里，这样可以达到最好性能，不让存储器性能成瓶颈从而影响算法性能数据。此外i.MX RT1060 内核频率也是配到了最高 600MHz。

mbedtls_benchmark例程默认是启用硬件加速器 DCP 来实现算法的，因为我们要对比 MbedTLS 纯软件实现和 DCP 硬件实现性能差异，所以在测试纯软件方式时需要在工程源文件 MIMXRT1062_features.h 里将下面这个宏临时设为 0，这时候工程可能会编译不通过（代码链在 128KB ITCM 里），因为纯软件方式代码相比硬件驱动方式代码要大得多，此时可以在benchmark.c 或者 ksdk_mbedtls_config.h 注释掉一些算法执行来减少最终代码体（保留你感兴趣的算法）。

/*@briefDCPavailabilityontheSoC.*/

#defineFSL_FEATURE_SOC_DCP_COUNT(0)

算法性能数据跟 IDE 以及编译优化选项也有关系，我们这里选择了 IAR，优化选项分别测试了 None 以及 High Speed，NoSize constraints 两种，因为算法特别多，我们就摘比较常用的 SHA 和 AES，其对比结果如下：

3，在i.MX RT1170上实测

与上一节同样的方法，在 MIMXRT1170-EVK 板子上也测一下，同样 mbedtls_benchmark 例程 debug build，注意 i.MX RT1170 是双核芯片，我们在 Cortex-M7 下做测试，将内核频率配到最高 996MHz。

测试i.MX RT1170 上纯软件方式时仅需要在工程选项预编译宏里将 CRYPTO_USE_DRIVER_CAAM去掉即可，当然也可以在 MIMXRT1176_cm7_features.h 里将下面这个宏临时设为 0，这时候没有代码空间顾虑，i.MX RT1170 上默认 ITCM 是 256KB。最终测试结果如下：

/*@briefCAAMavailabilityontheSoC.*/

#defineFSL_FEATURE_SOC_CAAM_COUNT(0)

四、性能测试总结

结论1：使用硬件加速器CAAM模块/DCP模块，相比MbedTLS 纯软件实现，对于大部分算法性能都会有提升，但具体提升比例因算法本身复杂度而异。

结论2：硬件加速器方式提升比例较大的是3DES/DES（近10倍）、AES/ECDSA/ECDHE（近7倍）、RSA（3-5倍）、SHA-1/256（近2倍）。

结论3：硬件加速器方式对于部分算法，测试数据长度越大（默认1KB buffer，比如调到10KB），性能提升更明显。

结论4：编译器优化等级设置对 MbedTLS 纯软件和硬件加速器方式都有一定影响。

最后需要强调一点，这些测试数据仅作为参考，不代表硬件模块的真实能力，仅仅是基于当前软件环境的测试结果。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

加速器

加速器

+关注

关注
2

文章
809

浏览量
38206
算法

算法

+关注

关注
23

文章
4637

浏览量
93535
mbedTLS

mbedTLS

+关注

关注
0

文章
6

浏览量
624

原文标题：对比MbedTLS算法库纯软件实现与i.MX RT上硬件加速器实现性能差异

文章出处：【微信号：NXP_SMART_HARDWARE，微信公众号：恩智浦MCU加油站】欢迎添加关注！文章转载请注明出处。

在i.MX RT处理器上使用PXP实现缩放和旋转组合操作

本文主要探讨如何使用PXP实现缩放和旋转组合操作，PXP是NXP推出的一个2D图形加速器，主要完成对图像的数据格式转换、固定角度旋转（90°，180°，270°），任意比例缩放、混色，移位以及翻转等功能。运行平台为i.MX

发表于 02-20 10:53 •370次阅读

在<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>处理<b class='flag-5'>器</b>上使用PXP<b class='flag-5'>实现</b>缩放和旋转组合操作

恩智浦i.MX 94应用处理器如何变革工业和汽车连接

恩智浦半导体发布i.MX 94系列应用处理器，为工业和汽车连接设定了新的标准。作为i.MX 9系列应用处理器的最新成员，i.MX 94旨在提

发表于 01-17 10:51 •324次阅读

恩智浦i.MX 91生态合作伙伴最新开发板资源

恩智浦i.MX 91应用处理器系列能够快速实现基于Linux的经济高效的边缘应用程序。i.MX 91处理器在保持实惠价格的同时，融合了高

发表于 12-20 17:00 •762次阅读

恩智浦i.MX RT700系列MCU的优势

作为边缘智能时代的嵌入式工程师，你对一款理想的MCU有何期待？高性能、高集成、低功耗、更安全，以及出众的AI推理能力……恩智浦半导体新近发布的i.MX RT700跨界MCU系列，就是你想要的答案！

发表于 12-09 09:16 •712次阅读

NXP专为边缘AI打造的i.MX RT700跨界MCU到底强在哪？

i.MX RT700系列提供了高性能、高集成度、先进功能和高能效的优化组合，为支持智能AI的边缘端设备赋能，例如可穿戴设备、消费电子医疗设备、智能家居设备和HMI设备。在i.MX

发表于 11-08 09:40 •1271次阅读

NXP专为边缘AI打造的<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>700跨界MCU到底强在哪？

如何在i.MX RT微控制器上初始化LWIP协议栈

在i.MX RT微控制器上初始化LWIP协议栈是一个复杂但有趣的过程，它涉及多个步骤和关键组件的配置.

发表于 10-12 11:48 •467次阅读

如何在<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>微控制<b class='flag-5'>器</b>上初始化LWIP协议栈

恩智浦推出全新i.MX RT700跨界MCU系列

高度集成的全新i.MX RT700跨界MCU旨在显著节省功耗，配备eIQ Neutron神经处理单(NPU)，可在边缘端提供高达172倍的AI加速。

发表于 10-12 11:41 •897次阅读

i.MX Linux开发实战指南—基于野火i.MX系列开发板

电子发烧友网站提供《i.MX Linux开发实战指南—基于野火i.MX系列开发板.pdf》资料免费下载

发表于 10-10 17:23 •12次下载

NXP推出集成NPU的MCU，支持AI边缘设备！MCU实现AI功能的多种方式

可扩展的硬件加速器架构，专为AI和ML应用而设计。NPU的引入大幅提升了设备的AI工作负载性能和能效，使得本

发表于 09-29 01:11 •4153次阅读

NXP Semiconductors i.MX 93处理器特性概述

NXP Semiconductors i.MX 93节能应用处理器通过集成EdgeLock® 安全飞地提供高效的机器学习 (ML) 加速和高级安全性，支持节能边缘计算。i.MX 93应

发表于 09-25 14:42 •788次阅读

NXP Semiconductors <b class='flag-5'>i.MX</b> 93处理<b class='flag-5'>器</b>特性概述

适用于数据中心应用中的硬件加速器的直流/直流转换器解决方案

电子发烧友网站提供《适用于数据中心应用中的硬件加速器的直流/直流转换器解决方案.pdf》资料免费下载

发表于 08-26 09:38 •0次下载

适用于数据中心应用中的<b class='flag-5'>硬件加速器</b>的直流/直流转换<b class='flag-5'>器</b>解决方案

恩智浦i.MX RT1170 uSDHC eMMC启动时间

大家好，我是痞子衡，是正经搞技术的痞子。今天痞子衡给大家介绍的是恩智浦i.MX RT1170 uSDHC eMMC启动时间。

发表于 08-08 15:32 •733次阅读

恩智浦<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>1170 uSDHC eMMC启动时间

西门子推出Catapult AI NN软件，赋能神经网络加速器设计

西门子数字化工业软件近日发布了Catapult AI NN软件，这款软件在神经网络加速器设计领域迈出了重要一步。Catapult AI NN软件

发表于 06-19 11:27 •966次阅读

PSoC 6 MCUBoot和mbedTLS是否支持加密硬件加速？

。使用 MCUBoot 验证两个应用程序时，运行时间大约需要五秒钟。在 README.md 的 \"安全 \"一栏中写道与软件实现相比，硬件加速加密技术将启动时间缩短了四倍多

发表于 05-29 08:17

Elektrobit利用其首创的硬件加速软件优化汽车通信网络的性能

Elektrobit今日宣布推出 EB zoneo GatewayCore——首款支持、配置和集成现代微控制器新一代硬件加速器的软件产品，可应用于先进的汽车电子/电气架构（基于被广泛采用

发表于 04-17 09:51 •419次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

MbedTLS纯软件实现和使用i.MX RT芯片里的硬件加速器实现性能差异

评论