0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让C++代码更加高效的几个小技巧

Q4MP_gh_c472c21 来源:程序喵大人 作者:程序喵大人 2021-09-23 15:20 次阅读

今天和大家介绍一下能让C++代码更加高效的几个小技巧,话不多说,以下为本文目录:

参数传递方式:值传递还是引用传递

函数返回方式:按值返回还是按引用返回

使用移动语义

避免创建临时对象

了解返回值优化

考虑预分配内存

考虑内联

迭代 vs 递归

选择高效的算法

利用缓存

profiling

other碎碎念

以下为正文:

值传递还是引用传递:

一般情况下使用const的引用参数。对于函数本身会拷贝的参数,最好使用值传递,但只有当参数的类型支持移动语义时才这样。

在某些情况下,值传递并移动实际上是向函数传递参数的最佳方式(注意看后面的tips),例如:

class A { public: A(const std::string &str) { str_ = str; }

private: std::string str_;};

可以考虑改为这种形式:

class A { public: A(std::string str) { str_ = std::move(str); }

private: std::string str_;};

因为无论如何都会对它们进行拷贝。

tips:看有些资料说后者值传递是更好的参数传递方式,貌似有些道理,但是我没找到非常合理的理由,有知道的读者可以在评论区留言。

按值返回还是按引用返回:

可以通过从函数中按引用方式返回对象,以避免对象发生不必要的复制。但有时不可能通过引用返回对象,例如编写重载的operator+和其他类似运算符时。

永远都不要返回指向局部对象的引用或指针,局部对象会在函数退出时被销毁。

但是,按值返回对象通常没啥大问题。因为一般情况下他们会触发返回值优化或移动语义,即不会有多余的拷贝动作。

使用移动语义:

尽量确保对象拥有移动构造函数和移动赋值运算符。对象有了移动语义后,许多操作都会更加高效,特别是与标准库和算法相结合时。

避免创建临时对象:

没有必要的临时对象能避免就避免。一般来说,应该避免迫使编译器构造临时对象的情况。尽管有时这是不可避免的,但是至少应该意识到这项“特性”的存在,这样才不会为实际性能和分析结果而感到惊讶。编译器还会使用移动语义使临时对象的效率更高。这是要在类中添加移动语义的另一个原因。

《More Effective C++》第19条款中介绍过:所谓的临时对象并不是程序员创建的用于存储临时值的对象,而是指编译器层面上的临时对象:这种临时对象不是由程序员创建,而是由编译器为了实现某些功能(例如函数返回,类型转换等)而创建。

比如下面的代码就会有临时对象的产生:

void Func(const std::string& s);char arr[]=“hello”;Func(aar); // here

返回值优化

通过值返回对象的函数可能导致创建一个临时对象。看下面的代码:

Person createPerson(){ Person newP { “Marc”, “Gregoire”, 42 }; return newP;}

假如像这样调用这个函数(假设Person 类已经实现了operator《《运算符):

cout 《《 createPerson();

即便这个调用没有将createPerson()的结果保存在任何地方,也必须将结果保存在某个地方,才能传递给operator《《。为此编译器创建一个临时变量,来保存createPerson()返回的Person 对象。

即使这个函数的结果没有在任何地方使用,编译器也仍然可能会生成创建临时对象的代码:

createPerson();

编译器可能生成代码来创建一个临时对象来保存返回值,即使这个返回值没有使用也是如此。

不过吧,编译器会在大多数情况下优化掉临时变量,以避免复制和移动。

关于返回值优化我之前有篇文章介绍过,感兴趣的可以看看这个:《左值引用、右值引用、移动语义、完美转发,你知道的不知道的都在这里》

预分配内存:

比如标准化容器中的reserve,需要频繁创建内存的地方可以考虑预分配一块内存出来,避免频繁的创建内存。

内联函数:

短函数可以使用内联消除函数开销。

迭代 vs 递归:

这里我更倾向于选择迭代方式,而不是递归。递归占用大量栈内存,且可能会产生很多不必要的临时对象构建。

选择效率更高的算法:

学计算机的估计没有不知道算法的吧,学算法估计没有人不知道如何计算时间复杂度和空间复杂度吧,在平时开发过程中遇到算法问题时我们可尽量选择效率更高的算法,比如O(N)和O(N2)的算法,我们肯定要选择O(N)的呀,这里可以了解下C++的,这里引入了很多高效的算法供我们使用。

尽可能多的使用缓存:

将某些数据保存下来供下次使用,避免再次获取或重新计算它们。如果任务或计算特别慢,应该保证不执行那些没有必要的任务或者重复计算。

网络通信:如果频繁发起相同的网络请求,可考虑将第一次的网络请求结果保存在内存中,或文件中?

磁盘访问:如果频繁访问一个文件,可考虑将这个文件的内容保存在内存中。

数学计算:某些很耗时很复杂的运算,可考虑只执行这种计算一次,然后共享结果。

对象分配:如果需要大量频繁创建和销毁短期对象,可考虑使用对象池。

线程创建:如果需要大量频繁创建和销毁线程,可考虑使用线程池。

做客户端开发的朋友应该都听说多级缓存的概念,就是这个原理。

profiling:

那到底什么样的代码才算是高质量代码呢?

对此我整理了一份脑图:

fd689c40-0fc9-11ec-8fb8-12bb97331649.png

如何能够提升代码质量呢,除了我们自身过硬的编码能力,还需要制定代码检查流程,一般代码检查有以下几种方式:

fda83e86-0fc9-11ec-8fb8-12bb97331649.png

代码检查要检查的问题有:

fdb5be76-0fc9-11ec-8fb8-12bb97331649.png

脑图中有一些代码度量指标,它用于量化代码质量:

如果代码的圈复杂度或认知复杂度过大,可能函数本身实现的过于复杂,或可能因为架构设计过于复杂,导致函数过于复杂。

如果函数嵌套过深,说明函数很可能出错,需要仔细进⾏⼈⼯评审,并且函数可能需要重构。

如果模块的扇入过大,说明模块可能是公共模块,需要⼈⼯评审接⼝是否是稳定的,或模块承担过多职责,可以考虑遵循单⼀职责,分解模块的职责。

如果模块的扇出过大,说明该模块依赖多个模块,可以考虑把被依赖的多个模块合并为⼀个模块,重构依赖的接⼝。

如果类的继承树过深,考虑在继承树的深度上是否有新的变化⽅向,考虑提出新的策略类,或其他设计模式来优化继承树。

如果子类过多,检查⼦类的实现中共同的地⽅,先考虑提出公共的中间⼦类,检查是否可以通过桥接模式、装饰模式、组合模式等结构型模式重构代码。

上面脑图所说的需要检查的各种问题中,代码和需求背离问题与代码是否符合设计问题需要人工评审,成本较高,其它问题可以通过工具来检测

检测工具主要分为静态代码分析工具和动态代码检测工具。

静态代码分析工具主要用于静态代码分析,关于静态代码分析,它能够根据规则帮助检查代码缺陷,然而,对于检查规则能够覆盖的代码,工具能够工作的挺好,但对于规则没有覆盖的代码,它却无能为力,而且可能存在误报问题。

静态代码分析是保证代码质量的重要手段,据说软件开发中大概30%-70%的代码逻辑设计和编码缺陷都可以通过静态代码分析来发现和修复。它会扫描程序代码,找出代码中隐藏的错误,如参数不匹配、有歧义的嵌套语句、错误的递归、非法计算、空指针问题、越界问题、未初始化问题、内存泄漏问题等。

静态代码分析工具的优势有:

自动执行静态代码分析,快速定位代码隐藏错误和缺陷

帮助代码设计人员更专注于分析和解决代码设计缺陷

减少在代码人工检查上花费的时间,提高软件可靠性并节省开发成本

举例如下:

代码规范检查:由于拷贝粘贴造成两个分支的代码完全相同

void func(int in, int &out) { if (in 》 1) out++; else out++; out++;}

代码缺陷检查:没有用的RAII

void func() { std::lock_guard《std::mutex》(lk); // 临时对象,语句结束后执行析构,误用的加锁 。..}

下面是一些常见的静态代码分析工具:

fdc5b54c-0fc9-11ec-8fb8-12bb97331649.png

这里推荐一个常用的代码质量管理平台SonarCube,SonarQube是一个管理代码质量的平台(社区版免费),用于管理代码的质量,它会从多个角度维护检测代码质量,通过插件形式支持多种语言的代码质量管理和检测。它可以安装sonar-cxx插件,内置了一系列C/C++代码检查工具,还可以应用在CI/CD流程中,和Jenkins打通,可以在提交代码后检查代码是否有坏味道,不符合规范的代码就拒绝被合入master。

还有一个很好用的静态代码检测工具是Facebook的infer,它最大的优势是可以静态检测代码内隐藏的内存泄漏问题,而且免费支持Android、C、OC语言

静态代码分析工具可以在运行前帮助我们检测缺陷,只有30%-70%,但不是所有缺陷,很多缺陷需要在运行时才会被发现。

其实我们还可以使用一些动态分析工具,通过动态分析工具可以准确定位问题,而且误报率低,但这与测试用例强绑定,查找缺陷的比例与测试用例的覆盖率有关,覆盖率对于衡量代码质量有很大意义。

代码覆盖率的意义:

● 帮助我们找到未覆盖部分的代码,分析测试用例设计的是否充分,之后视情况决定是否可以补充测试用例。

● 检测出代码的坏味道,提示我们修改代码,理清代码逻辑关系,提升代码质量。

● 代码覆盖率高不能代表代码质量一定好,但代码覆盖率低,代码质量估计不会高到哪去,可以作为我们衡量代码质量的重要手段之一。

● 对于没有覆盖到的错误,动态分析工具也无能为力。在实际工作中,我们可以动静结合,多种检查手段全都用上,可以更有效的提升代码质量。

动态分析工具可以在程序运行时发现代码的缺陷,例如内存问题、数据竞争、未定义行为等。

常用工具有GCC&Clang的Santizer系列:

● Asan-Address Sanitizer:缓存区溢出,内存泄漏

● Tsan-Thread Sanitizer:并发问题

● Msan-Memory Sanitizer:未初始化内存

● Ubsan-Undefined Behavior Sanitizer:未定义行为

● 编译选项添加fsanitize=address/memory/thread/undefined

还有Valgrind工具:

● memchek:内存问题,包括Asan和Msan

● helgrind:线程和并发问题

● cachegrind、callgrind、massif:帮助进行性能优化

使用各种工具与单元测试、功能测试、系统测试结合,提高覆盖率,可以帮助我们发现更多缺陷。

前面的多数都是代码分析工具,下面介绍一些性能分析工具,关于性能分析工具Brendan Gregg大佬的网站介绍的很详细,这里贴出来一张他总结的工具图:

这张图从Linux内核的各个子系统出发,汇总了对各个子系统进行性能分析时可以选择的工具。其实还有一些好用的工具,图里没有提到,这里重点介绍一下:

gprof:gprof是GNU工具之一,编译的时候,它在每个函数的出入口加入了profiling的代码,运行时统计程序在用户态的执行信息,可以得到每个函数的调用次数,执行时间,调用关系等信息,简单易懂。适合于查找用户级程序的性能瓶颈,然而对于很多耗时在内核态执行的程序,gprof不适合。

Oprofile:Oprofile也是一个开源的profiling工具,它使用硬件调试寄存器来统计信息,进行profiling的开销比较小,而且可以对内核进行profiling。它统计的信息非常多,可以得到cache的缺失率,memory的访存信息,分支预测错误率等等,这些信息gprof得不到,但是对于函数调用次数,它无能为力。

简单来说,gprof简单,适合于查找用户级程序的瓶颈,而Oprofile稍微有点复杂,但是得到的信息更多,更适合调试系统软件。

gperftools:Google出品,值得信赖,提供整个程序的热点分布图,找到性能瓶颈,然后可以针对性的进行性能优化,如图:

那使用什么API效率更高呢,可以看下图:

fdf84f66-0fc9-11ec-8fb8-12bb97331649.png

图中的rdtsc使用较繁琐而且不适用于所有平台和编译器,剩下的大家可以按需使用哈。

关于性能分析工具,程序喵整理了一份非常详细的脑图(精华全在脑图里),以性能指标分类,不同指标使用什么工具进行分析,都在图里,目录如下:

other碎碎念:

选择合适的数据结构:

选择合适的STL,想清楚什么时候用栈,什么时候用队列,什么时候用数组,什么时候用链表。

某些if-else可改为switch,效率可能更高(知道为什么吗,不知道的可以留言,人多的话考虑输出一篇文章)。

优先考虑栈内存,而不是堆内存(免得频繁的申请释放内存)。

如何函数不需要返回值,就不要设置返回值。

使用位操作,移位代替乘法除法操作。

构造函数时使用初始化方式,而不是赋值。

A::A() : a_(a) {} // better

A::A() { a_ = a;}

明确使用模板带来的益处:

如果使用模板并没有给你的开发带来任何益处,是不是可以考虑不使用它,因为调试起来真的麻烦。

函数参数的个数不要太多。

擅用emplace,有些情况下会省去一次构造的开销。

最后想说一句:

先完成再完美。不要一开始就想着写最完美的代码,很多bug都是过早过度优化导致的。一般情况下,性能较高的代码可读性都不是特别高。提早优化很可能引发很多bug。很多情况下,我们可以先完成代码,确保功能完成且正确之后,再去考虑完善。完成代码后,可以使用profiling工具,找到瓶颈所在,然后做相应优化。另外产品和测试如果没给你提性能需求,那优化它干嘛!

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • C++
    C++
    +关注

    关注

    22

    文章

    2109

    浏览量

    73682
  • 代码
    +关注

    关注

    30

    文章

    4791

    浏览量

    68666

原文标题:看完这12条,写出高效代码

文章出处:【微信号:gh_c472c2199c88,微信公众号:嵌入式微处理器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AKI跨语言调用库C/C++代码迁移至HarmonyOS NEXT更高效 AKI跨语言调用库神助攻C/C++代码迁移至HarmonyOS NEXT

    Kernel Interacting)的开源三方库应运而生,它通过高效封装跨语言调用接口,帮助开发者将C/C++代码快速迁移至HarmonyOS NEXT。凭借卓越的兼容性,AKI已
    发表于 01-02 17:08

    Flexus X 实例 C#/.Net Core 结合(git 代码管理、docker 自定义镜像)快速发布部署 - 你的项目飞起来~

    与 Docker 容器化部署,实现代码高效管理与无缝迁移。即刻行动,您的 Web 服务更加稳定、高效,领跑数字化转型之路! ���本实验深
    的头像 发表于 12-25 21:15 150次阅读
    Flexus X 实例 <b class='flag-5'>C</b>#/.Net Core 结合(git <b class='flag-5'>代码</b>管理、docker 自定义镜像)快速发布部署 - <b class='flag-5'>让</b>你的项目飞起来~

    单片机代码性能起飞的七大技巧

    单片机的程序比软开少一些,真正想编写出高效代码,还是要积累很多年的。           在做研发工程师的10年里,我经历过几个公司,看过很多工程师写的代码,但真正能让我跪着看完的,
    的头像 发表于 11-16 10:21 590次阅读
    <b class='flag-5'>让</b>单片机<b class='flag-5'>代码</b>性能起飞的七大技巧

    使用OpenVINO GenAI API在C++中构建AI应用程序

    许多桌面应用程序是使用 C++ 开发的,而将生成式AI(GenAI)功能集成到这些应用程序中可能会很具有挑战性,尤其是因为使用像 Hugging Face 这样的 Python 库的复杂性。C++
    的头像 发表于 10-12 09:36 388次阅读
    使用OpenVINO GenAI API在<b class='flag-5'>C++</b>中构建AI应用程序

    技术干货驿站 ▏深入理解C语言:掌握常量,你的代码更加稳固高效

    C语言的世界中,常量是一种不可忽视的元素。无论你是在编写简单的代码,还是构建复杂的系统,常量都能为你的程序带来更高的稳定性和可靠性。在这篇文章中,我们将深入探讨C语言中的常量,从整数常量到字符串
    的头像 发表于 08-29 13:59 2898次阅读
    技术干货驿站 ▏深入理解<b class='flag-5'>C</b>语言:掌握常量,<b class='flag-5'>让</b>你的<b class='flag-5'>代码</b><b class='flag-5'>更加</b>稳固<b class='flag-5'>高效</b>!

    请问一下还有比TLV3501更加高速的比较器吗?

    请问一下还有比TLV3501更加高速的比较器吗,还有,TI有哪些比较高速的比较器推荐
    发表于 08-23 07:01

    ModusToolbox 3.2在c代码中包含c++代码的正确步骤是什么?

    使用 ModusToolbox 3.2 我有一个用纯 C 语言编写的 XMC4700 项目。 我正在尝试添加一些 C++ 函数,并将其合并到我的原始代码中。 我可以构建独立的 .cpp/.hpp
    发表于 07-23 08:21

    OpenCV图像识别C++代码

    的头文件 在您的C++代码中,包含以下必要的头文件: # include # include # include # include # include # include # include 读取图像
    的头像 发表于 07-16 10:42 2056次阅读

    Perforce静态代码分析专家解读MISRA C++:2023®新标准:如何安全、高效地使用基于范围的for循环,防范未定义行

    MISRA C++:2023——MISRA® C++ 标准的下一个版本来了!为了帮助您了解 MISRA C++:2023相比于之前版本的变化,我们将继续为您带来Perforce首席技术支持工程师
    的头像 发表于 06-18 12:57 435次阅读

    基于RFID和AI等先进技术,医疗保健更加高效、准确

    电子发烧友网报道(文/吴子鹏)近年来,随着数字技术的快速发展和用户需求的不断提升,我国数字医疗产业迅速崛起。主要体现在三方面:其一是医院资产的数字化管理,医院运转更加高效;其二是医疗过程的数字化
    的头像 发表于 05-23 00:09 3790次阅读
    基于RFID和AI等先进技术,<b class='flag-5'>让</b>医疗保健<b class='flag-5'>更加高效</b>、准确

    C/C++代码动态测试工具VectorCAST插桩功能演示#代码动态测试 #C++

    C++代码
    北汇信息POLELINK
    发布于 :2024年04月18日 11:57:45

    为什么很少用C++开发单片机

    C语言是面向过程的语言,C++是面向对象的编程语言。结合本文来说,面向过程相比面向对象的编程,生成代码量(bin文件)更小,运行效率更高。
    发表于 03-25 14:26 1000次阅读
    为什么很少用<b class='flag-5'>C++</b>开发单片机

    c语言,c++,java,python区别

    C语言、C++、Java和Python是四种常见的编程语言,各有优点和特点。 C语言: C语言是一种面向过程的编程语言。它具有底层的特性,能够对计算机硬件进行直接操作。
    的头像 发表于 02-05 14:11 2427次阅读

    vb语言和c++语言的区别

    Microsoft开发的一种面向对象的事件驱动编程语言。它的设计目标是简化编程过程,初学者也能快速上手。与之相比,C++语言是一种通用的、面向对象的编程语言,其设计目标是提供高性能的系统级编程。 语法: VB语言的语法较为简单,使用了很多可读性强的关键词,如“
    的头像 发表于 02-01 10:20 2359次阅读

    C++简史:C++是如何开始的

    MISRA C++:2023,MISRA® C++ 标准的下一个版本,来了!为了帮助您做好准备,我们介绍了 Perforce 首席技术支持工程师 Frank van den Beuken 博士撰写
    的头像 发表于 01-11 09:00 613次阅读
    <b class='flag-5'>C++</b>简史:<b class='flag-5'>C++</b>是如何开始的