0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

确保系统更加可靠运行,这七大技巧不可不知

贸泽电子设计圈 来源:互联网 作者:佚名 2017-09-07 15:12 次阅读

就像很遥远年代的人们思想还很保守,固守着自己一方净土独享着一份安逸。总认为天圆地方一直在平淡而充实的生活,又好似红楼梦中的刘姥姥走进大观园看得眼花缭乱。对于75年以前人传统观念还比较浓重,对于那个年代的人来讲所受到教育和现在应该说是不一样的。对于那个时代物资相对比较匮乏,科技相对有些落后没有现在所谓的大数据、云计算、互联网和移动互联网。

从规范完善的开发周期到严格执行和系统检查,开发高可靠性嵌入式系统的技术有许多种。本文介绍了7个易操作且可以长久使用的技巧,它们对于确保系统更加可靠地运行并捕获异常行为大有帮助。

技巧1——用已知值填充ROM


软件开发人员往往都是非常乐观的一群人,只要让他们的代码忠实地长时间地运行就可以了,仅此而已。微控制器跳出应用程序空间并在非预想的代码空间中执行这种情况似乎是相当少有的。然而,这种情况发生的机会并不比缓存溢出或错误指针失去引用少。它确实会发生!发生这种情况后的系统行为将是不确定的,因为默认情况下内存空间都是0xFF,或者由于内存区通常没有写过,其中的值可能只有上帝才知道。

不过有相当完备的linker或IDE技巧可以用来帮助识别这样的事件并从中恢复系统。技巧就是使用FILL命令对未用ROM填充已知的位模式。要填充未使用的内存,有很多不同的可能组合可以使用,但如果是想建立更加可靠的系统,最明显的选择是在这些位置放置ISR fault handler。如果系统出了某些差错,处理器开始执行程序空间以外的代码,就会触发ISR,并在决定校正行动之前提供储存处理器、寄存器和系统状态的机会。

关于如何使用FILL命令以及关于其用途的替代性策略等额外信息可以在“使用FILL命令提高代码完整性”中找到(http://www.beningo.com/improving-code-integrity-using-fill/)。

技巧2——检查应用程序的CRC


嵌入式工程师来说一个很大的好处是,我们的IDE和工具链可以自动产生应用程序或内存空间校验和(Checksum),从而根据这个校验和验证应用程序是否完好。有趣的是,在许多这些案例中,只有在将程序代码加载到设备时,才会用到校验和。

然而,如果CRC或校验和保持在内存中,那么验证应用程序在启动时(或甚至对长时间运行的系统定期验证)是否仍然完好是确保意外之事不会发生的极好途径。现在一个编程过的应用程序发生改变的概率是很小的,但考虑每年交付的数十亿个微控制器以及可能恶劣的工作环境,应用程序崩溃的机会并不是零。更有可能的是,系统中的一个缺陷可能导致某一扇区发生闪存写入或闪存擦除,从而破坏应用程序的完整性。

技巧3——在启动时执行RAM检查


为了建立一个更加可靠和扎实的系统,确保系统硬件正常工作非常重要。毕竟硬件会发生故障。(幸运的是软件永远不会发生故障,软件只会做代码要它做的事,不管是正确的还是错误的)。在启动时验证RAM的内部或外部没有问题,是确保硬件可以如预期般运作的一个好方法。

有许多不同的方法可用于执行RAM检查,但常用的方法是写入一个已知的模式,然后等上一小段时间再回读。结果应该是所读就是所写。真相是,在大多数情况下RAM检查是通过的,这也是我们想要的结果。但也有极小的可能性检查不通过,这时就为系统标示出硬件问题提供了极好的机会。

这里有一个memtest C模块,是Michael Barr在 2000年就写好了的,它可以节省工程师考虑RAM测试所需的时间。可在此处下载该模块(http://www.embedded.com/design/embedded/source-code/4200237/memtest-zip16)。

技巧4——使用堆栈监视器


对许多的嵌入式开发者而言,堆栈似乎是一股相当神秘的力量。当奇怪的事情开始发生,工程师终于被难倒了,他们开始思考,也许堆栈中发生了什么事。结果是盲目地调整堆栈的大小和位置等等。但该错误往往是与堆栈无关的,但怎能如此确定?毕竟,有多少工程师真的实际执行过最坏情况下的堆栈大小分析?

堆栈大小是在编译时就静态分配好的,但堆栈是以动态的方式使用的。随着代码的执行,应用程序需要的变量、返回的地址和其它信息被不断存储在堆栈中。这种机制导致堆栈在其分配的内存中不断增长。然而,这种增长有时会超出编译时确定的容量极限,导致堆栈破坏相邻内存区域的数据。

绝对确保堆栈正常工作的一种方法是实现堆栈监视器,将它作为系统“保健”代码的一部分(有多少工程师会这样做?)。堆栈监视器会在堆栈和“其它”内存区域之间创建一个缓冲区域,并填充已知的位模式。然后监视器会不断的监视图案是否有任何变化。如果该位模式发生了改变,那就意味着堆栈增长得太大了,即将要把系统推向黑暗地狱!此时监视器可以记录事件的发生、系统状态以及任何其它有用的数据,供日后用于问题的诊断。

大多数实时操作系统(RTOS)或实现了内存保护单元(MPU)的微控制器系统中都提供有堆栈监视器。可怕的是,这些功能默认都是关闭状态,或者经常被开发人员有意关闭。在网络上快速搜寻一下可以发现,很多人建议关闭实时操作系统中的堆栈监视器以节省56字节的闪存空间。等等,这可是得不偿失的做法!

技巧5 - 使用MPU


在过去,是很难在一个小而廉价的微控制器中找到内存保护单元(MPU)的,但这种情况已经开始改变。现在从高端到低端的微控制器都已经有MPU,而这些MPU为嵌入式软件开发人员提供了一个可以大幅提高其固件(firmware)鲁棒性(robustness)的机会。

MPU 已逐渐与操作系统耦合,以便建立内存空间,其中的处理都分开,或任务可执行其代码,而不用担心被stomped on。倘若真有事情发生,不受控制的处理会被取消,也会执行其他的保护措施。请留意带有这种组件的微控制器,如果有,请多加利用它的这种特性。

技巧6 - 建立一个强大的看门狗系统


你经常会发现的一种总是最受喜爱的看门狗(watchdog)实现是,在看门狗被启用之处(这是一个很好的开始),但也是可以用周期性定时器将该看门狗清零之处;定时器的启用是完全与程序中出现的任何情况隔离的。使用看门狗的目的是协助确保如果出现错误,看门狗不会被清零,即当工作暂停,系统会被迫去执行硬件重设定(hardware reset),以便恢复。使用与系统活动独立的定时器可以让看门狗保持清零,即使系统已失效。

对应用任务如何整合到看门狗系统中,嵌入式开发人员需要仔细考虑和设计。例如,有种技术可能可以让每个在一定时期内运行的任务标示它们可以成功地完成其任 务。在此事件中,看门狗不被清零,强制被复位。还有一些比较先进的技术,像是使用外部看门狗处理器,它可用来监视主处理器如何表现,反之亦然。

对一个可靠的系统而言,建立一个强大的看门狗系统是很重要的。由于有太多的技术,难以在这几个段落中完全涵盖,但针对此一议题,笔者未来还会发表相关的文章。

技巧7 - 避免易失存储器分配


不习惯在资源有限环境下工作的工程师,可能会试图使用其编程语言的特性,这种语言让他们可以使用易失存储器分配。毕竟,这是一种常在计算器系统中使用的技术,在计算器系统中,只有在有必要时,内存才会被分配。例如,以C开发时,工程师可能倾向于使用malloc来分配在堆(heap)上的空间。有一个操 作会执行,一旦完成,可以使用free将被分配的内存返回,以便堆的使用。

在资源受限的系统,这可 能是一场灾难!使用易失存储器分配的其中一个问题是,错误或不当的技术可能会导致内存泄漏或内存碎片。如果出现这些问题时,大多数的嵌入式系统并没有 资源或知识来监视堆或妥善地处理它。而当它们发生时,如果应用程序提出对空间的要求,但却没有所请求的空间可以使用,会发生什么事呢?

使用易失存储器分配所产生的问题是很复杂的,要妥善处理这些问题,可以说是一个噩梦!一种替代的方法是,直接以静态的方式,简化内存的分配。例如,只要在 程序中简单地建立一个大小为256字节长的缓冲区,而不是经由malloc请求这样大小的内存缓冲区。此一分配的内存可在整个应用程序的生命周期期 间保持,且不会有堆或内存碎片问题方面的顾虑。

结论

这些都只是一些可以让开发人员开始建立更可靠嵌入式系统的方法。另外还有很多其他技术,例如利用良好的编码标准、位翻转的监测、执行数组和指针边界检查,及使用断言等。所有这些技术都是让设计者可以开发出可靠性更高嵌入式系统的秘诀。

关于贸泽电子设计圈

贸泽电子设计圈由贸泽电子(Mouser Electronics)开发和运营,服务全球广大电子设计群体,贸泽电子分销600多家领先品牌,可订购400多万种在线产品,可为设计工程师和采购人员提供一站式采购平台,欢迎关注我们,获取第一手的设计与产业资讯信息!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5102

    文章

    19263

    浏览量

    309816
  • 嵌入式系统
    +关注

    关注

    41

    文章

    3643

    浏览量

    130046
  • 嵌入式工程师

    关注

    1

    文章

    37

    浏览量

    16286

原文标题:Duang!Duang!Duang!7大技巧助你开发高可靠嵌入式系统

文章出处:【微信号:Mouser-Community,微信公众号:贸泽电子设计圈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    最新!智慧灯杆七大应用场景案例独家汇总

    最新!智慧灯杆七大应用场景案例独家汇总
    的头像 发表于 03-07 10:10 75次阅读

    30KPA84A 二极管:确保设备安全运行可靠保障

    30KPA84A 二极管:确保设备安全运行可靠保障
    的头像 发表于 03-05 13:37 52次阅读
    30KPA84A 二极管:<b class='flag-5'>确保</b>设备安全<b class='flag-5'>运行</b>的<b class='flag-5'>可靠</b>保障

    定制PCB线路板,这些注意事项你不可不知

    着电路的连接,还直接影响着设备的性能和可靠性。如果您正计划定制PCB线路板,了解以下几点常见问题将为您的项目成功铺路。 一、什么是PCB线路板? PCB是一种采用绝缘材料基板,表面覆有导电图形(通常为铜箔),用于电子元件之间电气连接的基板。它通过蚀刻或
    的头像 发表于 01-17 09:30 154次阅读

    想用AMC1203做电流采样,用AMC1210做SINC滤波,不知道这样可不可行?

    想用AMC1203做电流采样,用AMC1210做SINC滤波,不知道这样可不可行? 网上有帖子说AMC1210有问题,你们不推荐采用AMC1210做SINC滤波,而是推荐采用CPLD做SINC滤波,不知道是不是真的?
    发表于 01-14 07:22

    揭秘注塑机快速换模的七大步骤,助力智能制造升级

    注塑机快速换模优化提升效率,含前期准备、停机锁定、移除旧模、安装新模、调试校验、试运行及文档记录七大步骤,严格执行可显著提升智能制造企业效益。
    的头像 发表于 12-18 15:57 450次阅读

    工程师不可不知的电源11种拓扑结构

    工程师不可不知的电源11种拓扑结构 基本名词 电源常见的拓扑结构 ■Buck降压 ■Boost升压 ■Buck-Boost降压-升压 ■Flyback反激 ■Forward正激
    的头像 发表于 12-05 10:56 531次阅读
    工程师<b class='flag-5'>不可不知</b>的电源11种拓扑结构

    ADS1220的AVDD接5V, DVDD接3.3V可不可以?

    ADS1220的AVDD接5V, DVDD接3.3V可不可以。手册只写了AVDD 和DVDD的范围,不知道他们的电压不一样会不会有问题
    发表于 12-02 07:49

    负载箱在确保可靠电力分配中的作用

    负载箱是电力系统中的重要设备,它在确保可靠电力分配中起着至关重要的作用。负载箱的主要功能是在电力系统运行过程中,模拟实际的电力负荷,以便对电
    发表于 11-15 15:52

    隔离电源的地可不可以通过电容夸到大地

     在隔离电源的设计中,关于地的处理是一个重要的考虑因素。对于“隔离电源的地可不可以通过电容跨到大地”的问题,通常取决于具体的应用场景和设计需求。
    的头像 发表于 10-01 16:19 939次阅读

    单片机方案开发-分享个常用的外围电路设计

    设计参考应用: 5、运算放大器设计参考应用: 6、MOS管设计参考应用:(控制电源输出通断) 7、输入电源设计参考应用: 外围电路设计是电子产品设计中不可或缺的一环,它直接关系到系统的稳定性、可靠性和性能表现
    发表于 09-24 15:59

    七大嵌入式GUI盘点

    嵌入式图形用户界面(GUI)是一种为嵌入式系统设计的用户界面,它可以让用户通过图形化的方式与设备进行交互。以下是对种嵌入式 GUI 的盘点。 emWin 由德国SEGGER公司开发,可为图形
    发表于 09-02 10:58

    半导体知识百科:不可不知的50大专业名词

    在半导体行业中,掌握专业名词对于从业者来说至关重要。这些名词不仅是行业交流的基础,更是理解和掌握相关技术、工艺及产品的关键。以下是半导体人必须知道的50个专业名词解释。
    的头像 发表于 08-15 11:02 3920次阅读
    半导体知识百科:<b class='flag-5'>不可不知</b>的50大专业名词

    AC/DC电源模块可靠性是确保设备长时间稳定运行的关键因素

    BOSHIDA  AC/DC电源模块可靠性是确保设备长时间稳定运行的关键因素 AC/DC电源模块作为一种常见的电源供应设备,被广泛应用于各种电子设备中。它的主要功能是将交流电转换成直流电,并为设备
    的头像 发表于 06-11 17:31 480次阅读
    AC/DC电源模块<b class='flag-5'>可靠</b>性是<b class='flag-5'>确保</b>设备长时间稳定<b class='flag-5'>运行</b>的关键因素

    污水处理厂水质检测仪如何确保稳定可靠运行

      【JD-LSZ05】山东竞道光电持续更新中....污水处理厂水质检测仪的稳定可靠运行对于保障水质处理效果和环境保护至关重要。要确保其稳定可靠
    的头像 发表于 05-09 16:09 338次阅读

    工业交换机的网络容错机制:确保工业网络稳定运行

    工业交换机的网络容错机制是确保工业网络稳定运行的重要保障,其在应对各种网络故障和保障网络稳定性方面发挥着不可替代的作用。随着工业网络的不断发展和演进,我们相信工业交换机的网络容错机制将会不断创新和完善,为工业生产提供
    的头像 发表于 04-17 11:04 591次阅读