将静态分析与编译器和数据库集成-电子发烧友网

静态分析工具正越来越多地集成到软件开发过程中。在过程中保存来自编译器的数据、更改历史记录和错误信息，而不是作为后置代码步骤，可以提高静态分析的效率。

高级静态分析工具在嵌入式系统开发中变得越来越重要。远远超出实际上是编码风格检查器的旧静态分析工具，新工具静态分析源程序的控制和数据流，从而检测错误和漏洞，例如潜在的缓冲区溢出、未初始化变量的使用、通过空指针访问，以及对安全攻击（SQL 注入、跨站点脚本等）的敏感性。

然而，这些先进的工具提出了几个问题。首先，工具需要了解被分析程序的语义——也就是说，它们必须编译程序——以执行所需的控制和数据流分析。为此，它们必须紧密集成到构建环境中，以便在编译时识别和使用所有可能需要的包含文件或其他规范模块。其次，这些高级工具产生的输出量可能令人望而生畏，每条诊断信息都需要仔细审查，以确定它是否反映了一个真正的问题，如果是，如何解决它。

将静态分析工具与软件开发工具链更紧密地集成可以缓解这两个挑战。在第一种情况下，将静态分析工具与编译器紧密集成在很大程度上消除了构建环境问题，并使用户界面变得简单和熟悉。在第二种情况下，可以通过将所有输出存储在历史数据库中来管理大量输出，从而允许程序员专注于已知良好版本和源当前状态之间的增量，而不是在每一步处理所有消息。

与编译器集成

超越简单语法检查的静态分析工具通常需要编译器前端的大部分功能，以便它可以根据程序的语义进行分析。这是因为相同的句法形式通常可以根据其成分的含义有不同的解释。例如，Ada 中的表达式 F（N）可能（除其他外）是数组引用、函数调用或类型转换。

访问程序的底层语义允许该工具跟随程序中出现的每个名称回到引入该名称的声明，即使存在重载、通用模板或重命名也是如此。该工具将知道每个对象和每个表达式的类型，并将识别任何隐式运行时检查发生的位置。这些隐式运行时检查可能包括对取消引用空指针的检查和对数组边界之外的索引的检查。即使没有隐式运行时检查的语言也可以将某些运行时操作定义为具有未指定的语义，例如整数算术溢出或超出范围的数组索引。静态分析工具需要知道语言语义何时允许这种未指定（因此不可预测）的行为。

由于需要包含编译器前端的强大功能，许多静态分析工具都建立在感兴趣的语言的现有编译器技术之上。不幸的是，该工具的构建者选择的编译器技术可能与该工具的客户使用的编译器无关。发生这种情况时，静态分析工具可能无法处理客户编写的代码。

例如，如果客户程序使用编译器特定的功能（例如中断处理或特殊的内存映射工具），则无法保证静态分析工具的底层完全或以同样的方式支持它们。编译器前端技术。即使对于可移植代码，客户的编译器和静态分析工具的底层技术也可能存在不同的错误或对语言规则的细微不同的解释。即使解释匹配，编译程序的命令（控制源代码搜索路径、预处理器支持和其他功能的命令行开关）也可能有很大不同。因此，复杂程序的构建过程可能难以转换为对程序执行静态分析的生成过程。

为了解决这些问题，明确的解决方案是将高级静态分析引擎与客户使用的相同编译器技术集成。因此，静态分析引擎必须在某种程度上独立于任何特定编译器技术使用的中间表示，以便该工具可以轻松地适应支持多个编译器前端。

一种方法是让静态分析引擎拥有自己的中间表示，专门设计用于支持工具执行的高级分析。适应支持新的编译器前端需要编写一个转换模块，将编译器的中间表示（前端的输出）转换为静态分析引擎使用的程序表示。翻译模块将结果输出到文件中供以后使用。中间语言翻译器既可以链接到编译器前端，也可以作为独立程序运行，读取编译器的中间表示，转换它，然后写出分析引擎的中间表示。这个过程如图 1 所示。

图 1：中间语言翻译器读取编译器的中间表示，对其进行转换，然后写出静态分析引擎的中间表示。

当采用这种集成方法时，静态分析只是构建过程的另一部分，可以在编译期间执行，或者为了利用整个程序分析，在链接步骤期间执行。对用户的一个关键优势是调用静态分析工具只涉及向编译器和/或链接器提供额外的命令行开关。无需为该工具创建专门的构建脚本或维护两组源（一组与编译器一起使用，另一组与静态分析工具一起使用）。

与开发环境集成

由于软件开发通常通过 Eclipse 等图形集成开发环境（IDE）进行，因此将静态分析工具和编译器集成到 IDE 中是很自然的。然后，程序员将立即熟悉该工具的整体界面，从而减少学习曲线并增加定期使用该工具的可能性。

静态分析工具生成的消息必须像编译器生成的错误或警告消息一样处理，并由用户以相同的方式管理和查看。鉴于正在使用多个 IDE，每个 IDE 都有自己的消息格式，静态分析工具将需要表示其消息，以便可以轻松地将它们转换为 IDE 期望的任何格式。

消息表示的自然选择是 XML，因为它使用标记的、自描述的方法来捕获消息特征。使用 XML 的一个附带好处是它有助于简化应用程序的国际化过程，从而可以以客户喜欢的自然语言显示消息。

与历史数据库集成

一旦高级静态分析工具与编译器和 IDE 集成，下一个问题就是处理此类工具可能提供的大量消息。因为高级静态分析工具正在寻找可能的运行时逻辑错误和安全漏洞，所以它们必须模拟运行时程序的执行（识别一组潜在的执行状态）并确定在什么条件下可能会达到不期望的状态。不幸的是，这很少是简单的“是”或“否”。有许多灰色阴影，其中脆弱性程度取决于工具可能未知或超出其分析能力的因素。

这个问题有时用健全性与精确性来表述。如果一个搜索有问题结构的工具能够识别出它正在寻找的所有问题（没有误报），那么它就被认为是可靠的。但稳健性通常是以牺牲精度为代价的。该工具可能会生成大量误报，这些误报是用于识别并非真正问题的警告或错误。考虑这个使用类 C 语法的简单示例：

int k， m， n;

... // Complicated code that assigns a positive value to m

... // and that does not assign to n

if （m《0）{

k=n;

...

}

工具可能无法推断 if 语句上的 m《0 条件为假，因此可能会警告 if 语句的主体引用未初始化的变量（n）。实际问题恰恰相反：if 语句的主体是永远不会执行的代码，有时称为死代码或无法访问的代码。

工具开发人员必须决定是选择健全性（确保没有未被检测到的实际违规）还是精度（确保所有报告的违规都是真正的错误）。当一个工具用于安全关键或高安全性系统时，天平就会倾斜。使用此类工具的开发人员必须有信心检测到所有违规行为。但这引发了前面提到的关于如何处理可能产生的大量误报的问题。当该工具应用于遗留软件（在应用静态分析工具之前开发的代码）时，这个问题尤其明显。对于大型应用程序，用户需要查看的消息数量可能令人望而生畏。

将高级静态分析工具与历史数据库集成，可以有效地使用该工具，最大限度地减少误报导致的问题，即使对于在使用该工具之前开发的复杂应用程序也是如此。关键概念是基线的概念以及该工具突出显示相对于此类基线的增量的能力。通过在历史数据库中记录每个工具运行的所有结果，该工具可以识别任何两次运行之间的增量（更改）。

数据变得更有用

为了使分析运行之间的比较有效地进行，消息必须是唯一可识别的，而不涉及特定的行号，可以从源代码的一个版本切换到另一个版本而无需任何重大更改。识别没有行号的消息的一种方法是记录消息的文本（或相应的 XML），以及它出现的函数的名称，如果消息的文本与同一功能中的一些先前消息。

假设消息使用这个与行号无关的唯一标识符作为关键字存储在数据库中，那么该工具可以轻松识别给定消息是新消息还是先前生成的消息。这使历史数据库的整体大小保持可管理。该工具不需要为工具的所有调用重复存储所有消息的文本，而只需要存储给定消息的文本一次，以及该消息出现的工具调用范围的指示（第一次运行生成消息的位置，以及第一次没有出现的运行）。

该历史数据库使用户界面可以直接显示或突出显示自指定基线以来的新消息。这使得该工具即使在具有大量遗留代码的大型应用程序上也能有效使用。应用程序的已知良好版本可以通过分析工具作为基线运行。可以分析应用程序的当前开发版本，并将分析此已知良好版本的结果作为基线。那些在开发版本上工作的人可以专注于与他们自已知良好版本以来所做的更改相关的任何消息，而不必费力地处理与遗留代码相关的消息。最终，可以致力于处理这些积压的消息，

与历史数据库集成的另一个好处是能够从查看分析结果的用户那里收集评论。在某些情况下，可能需要对特定消息进行大量调查以了解可能的影响。捕获这项工作很重要。历史数据库是记录用户学习内容的自然场所。

另外，如果用户确定所识别的代码是安全可靠的，历史数据库可以记录该给定消息应该从后续输出中被抑制，并且可以记录抑制该消息的支持理由。或者，如果需要更改识别的代码，历史数据库可以记录分配给问题的程序故障报告（PTR） ID，从而允许问题跟踪系统和分析工具的历史结果之间的可追溯性。当该工具检测到具有关联 PTR ID 的消息消失时，可以将其配置为直接通知问题跟踪系统可以关闭关联的 PTR 记录。自动化关闭 PTR 的过程可以显着减轻通常负担过重的质量保证团队的负担。

静态分析作为开发过程的关键组成部分

随着应用程序变得越来越大和越来越复杂，高级静态分析工具在现代软件开发中发挥着关键作用，它显着减少了查找可能危及系统可靠性、安全性或安全性的错误和漏洞所需的工作量。但许多组织尚未充分利用这些工具，通常是因为将它们纳入日常软件开发过程（构建、回归测试和其他步骤）可能存在很高的进入障碍。

如前所述，两个重要的步骤可以减少这种进入障碍：工具与编译器技术和历史数据库的集成。这不仅仅是一个理论上的提议。CodePeer 是由 SofCheck 和 AdaC ore 联合开发的高级静态分析工具，作为 Ada 的自动代码审查器。该工具已完全集成到 AdaCore 的 GNAT Pro Ada 开发环境中，并可通过 GNAT Programming Studio IDE 调用。

与编译器的集成在很大程度上消除了将源代码移植到分析工具的挑战。成功编译源代码的同一编译器前端还可以生成高级静态分析引擎进行更深入分析所需的中间表示。此外，相同的命令行开关、源代码结构和 make 文件可用于编译和静态分析代码。编译器前端将自动处理应用程序使用的任何特定于实现的功能。

降低进入壁垒的第二个主要步骤是与历史数据库的集成，这使得在大型系统上工作的开发人员可以专注于他们最近的更改，并将审查以前发布的遗留代码中的问题推迟到更合适的时间。此外，与数据库的集成允许开发人员记录审查工具输出的结果以及决定隐藏消息或将其归档为 PTR 的理由。最后，数据库会自动验证修复并关闭 PTR。通过这两个步骤，静态分析可以成为嵌入式软件开发人员工具箱中重要且高效的工具。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

嵌入式

嵌入式

+关注

关注
5100

文章
19249

浏览量
309452
编译器

编译器

+关注

关注
1

文章
1645

浏览量
49409

Oracle数据库的多功能集成开发环境

无需编码即可在图表上构建可视化查询消除性能瓶颈的查询优化器 数据库管理和灵活的用户管理带有图表和数据透视表的数据分析和报告工具 200多个真实测试

发表于 01-14 13:52 •153次阅读

Oracle<b class='flag-5'>数据库</b>的多功能<b class='flag-5'>集成</b>开发环境

云数据库是哪种数据库类型？

云数据库是一种部署在虚拟计算环境中的数据库，它融合了云计算的弹性和可扩展性，为用户提供高效、灵活的数据库服务。云数据库主要分为两大类：关系型数据库

发表于 01-07 10:22 •184次阅读

Triton编译器的优化技巧

（Instruction Selection） Triton 编译器在指令选择阶段采用了先进的算法来生成针对特定硬件架构优化的指令。这一阶段的目标是将高级中间表示（IR）转换为低级机器代码，同时尽可能地利用硬件

发表于 12-25 09:09 •420次阅读

Triton编译器的优势与劣势分析

Triton编译器作为一种新兴的深度学习编译器，具有一系列显著的优势，同时也存在一些潜在的劣势。以下是对Triton编译器优势与劣势的分析：优势高效性能优化： Triton

发表于 12-25 09:07 •614次阅读

Triton编译器在机器学习中的应用

1. Triton编译器概述 Triton编译器是NVIDIA Triton推理服务平台的一部分，它负责将深度学习模型转换为优化的格式，以便在NVIDIA GPU上高效运行。Triton编译器

发表于 12-24 18:13 •598次阅读

Triton编译器与其他编译器的比较

Triton编译器与其他编译器的比较主要体现在以下几个方面：一、定位与目标 Triton编译器：定位：专注于深度学习中最核心、最耗时的张量运算的优化。目标：提供一个高度抽象、灵活、高效

发表于 12-24 17:25 •594次阅读

Triton编译器功能介绍 Triton编译器使用教程

Triton 是一个开源的编译器前端，它支持多种编程语言，包括 C、C++、Fortran 和 Ada。Triton 旨在提供一个可扩展和可定制的编译器框架，允许开发者添加新的编程语言特性和优化技术

发表于 12-24 17:23 •927次阅读

分享关于编译器的科普

源代码分析工具和IDE集成。GCC被构建成一个单一的静态编译器，这使得它非常难以被作为API并集成到其他工具中。 GCC比Clang支

发表于 12-09 09:49 •235次阅读

云原生和数据库哪个好一些？

云原生和数据库哪个好一些？云原生和数据库各有其独特的优势，适用于不同的场景。云原生强调高效资源利用、快速开发部署和高可伸缩性，适合需要高度灵活性和快速迭代的应用。而数据库则注重数据一致

发表于 11-29 10:07 •252次阅读

多维表格数据库Teable的适用场景？

Teable多维表格数据库是一款功能强大的云端数据库和协作工具,结合了电子表格的灵活性和数据库的强大功能,适用企业内部项目管理数据收集与整理内容管理与创意协作客户关系管理项目跟

发表于 10-31 15:48 •395次阅读

数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

一个运行在存储上的SQLServer数据库，有1000多个文件，大小几十TB。数据库每10天生成一个NDF文件，每个NDF几百GB大小。数据库包含两个LDF文件。存储损坏，数据库不

发表于 10-31 13:21 •384次阅读

应用和数据库部署在不同的物理服务器上有什么优点？

应用服务器和数据库服务器分开部署在不同的物理服务器上，或者至少在不同的虚拟机上，通常是一个推荐的做法。这样做有以下几个优点： 1、安全性：分离可以提高系统的安全性。如果应用服务

发表于 10-08 11:28 •359次阅读

AI编译器技术剖析

随着人工智能技术的飞速发展，AI编译器作为一种新兴的编译技术逐渐进入人们的视野。AI编译器不仅具备传统编译器的功能，如将高级语言编写的源代码

发表于 07-17 18:28 •1920次阅读

恒讯科技分析：sql数据库怎么用？

。 2、安装数据库软件：在您的服务器或本地计算机上安装所选的数据库软件。 3、配置数据库服务器：根据需要配置

发表于 07-15 14:40 •439次阅读

如何将预编译静态库集成到PSoC™ Creator中？

你好我正在使用博世 BME680 EVAL_PASCO2_SENSOR 。我还必须将 Bosch BSEC 库集成到我的项目中，该库对EVAL_PASCO2_SENSOR数据执行后

发表于 03-06 08:07

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

将静态分析与编译器和数据库集成

评论

Oracle数据库的多功能集成开发环境

云数据库是哪种数据库类型？

Triton编译器的优化技巧

Triton编译器的优势与劣势分析

Triton编译器在机器学习中的应用

Triton编译器与其他编译器的比较

Triton编译器功能介绍 Triton编译器使用教程

分享关于编译器的科普

云原生和数据库哪个好一些？

多维表格数据库Teable的适用场景？

数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

应用和数据库部署在不同的物理服务器上有什么优点？

AI编译器技术剖析

恒讯科技分析：sql数据库怎么用？

如何将预编译静态库集成到PSoC™ Creator中？