资料介绍
随着嵌入式Linux系统的广泛应用,对系统的可靠性提出了更高的要求,尤其是涉及到生命财产等重要领域,要求系统达到安全完整性等级3级以上[1],故障率(每小时出现危险故障的可能性)为10-7以下,相当于系统的平均故障间隔时间(MTBF)至少要达到1141年以上,因此提高系统可靠性已成为一项艰巨的任务。对某公司在工业领域14 878个控制器系统的应用调查表明,从2004年初到2007年9月底,随着硬软件的不断改进,根据错误报告统计的故障率已降低到2004年的五分之一以下,但查找错误的时间却增加到原来的3倍以上。
这种解决问题所需时间呈上升的趋势固然有软件问题,但缺乏必要的手段以辅助解决问题才是主要的原因。通过对故障的统计跟踪发现,难以解决的软件错误和从发现到解决耗时较长的软件错误都集中在操作系统的核心部分,这其中又有很大比例集中在驱动程序部分[2]。因此,错误跟踪技术被看成是提高系统安全完整性等级的一个重要措施[1],大多数现代操作系统均为发展提供了操作系统内核“崩溃转储”机制,即在软件系统宕机时,将内存内容保存到磁盘[3],或者通过网络发送到故障服务器[3],或者直接启动内核调试器[4]等,以供事后分析改进。
基于Linux操作系统内核的崩溃转储机制近年来有以下几种:
(1) LKCD(Linux Kernel Crash Dump)机制[3];
(2) KDUMP(Linux Kernel Dump)机制[4];
(3) KDB机制[5];
(4) KGDB机制[6]。
综合上述几种机制可以发现,这四种机制之间有以下三个共同点:
(1) 适用于为运算资源丰富、存储空间充足的应用场合;
(2) 发生系统崩溃后恢复时间无严格要求;
(3) 主要针对较通用的硬件平台,如X86平台。
在嵌入式应用场合想要直接使用上列机制中的某一种,却遇到以下三个难点无法解决:
(1) 存储空间不足
嵌入式系统一般采用Flash作为存储器,而Flash容量有限,且可能远远小于嵌入式系统中的内存容量。因此将全部内存内容保存到Flash不可行。
(2) 记录时间要求尽量短
嵌入式系统一般有复位响应时间尽量短的要求,有的嵌入式操作系统复位重启时间不超过2s,而上述几种可用于Linux系统的内核崩溃转储机制耗时均不可能在30s内。写Flash的操作也很耗时间,实验显示,写2MB数据到Flash耗时达到400ms之多。
(3) 要求能够支持特定的硬件平台
嵌入式系统的硬件多种多样,上面提到的四种机制均是针对X86平台提供了较好的支持,而对于其他体系的硬件支持均不成熟。
由于这些难点的存在,要将上述四种内核崩溃转储机制中的一种移植到特定的嵌入式应用平台是十分困难的。因此,针对上述嵌入式系统的三个特点,本文介绍一种基于特定平台的嵌入式Linux内核崩溃信息记录机制LCRT(Linux Crash Record and Trace),为定位嵌入式Linux系统中软件故障和解决软件故障提供辅助手段。
1 Linux内核崩溃的分析
分析Linux内核对于运行期间各种“陷阱”的处理可以得知,Linux内核对于应用程序导致的错误可以予以监控,在应用程序发生除零、内存访问越界、缓冲区溢出等错误时,Linux内核的异常处理例程可以对这些由应用程序引起的异常情况予以处理。当应用程序产生不可恢复的错误时,Linux内核可以仅仅终止产生错误的应用程序,其他应用程序仍然可以正常运行。
如果Linux内核本身或者新开发的Linux内核模块存在bug,产生了“除零”,“内存访问越界”、“缓冲区溢出”等错误,同样会由Linux内核的异常处理例程来处理。Linux内核通过在异常处理程序中判断,如果发现是“严重的不可恢复”的内核异常,则会导致“内核恐慌”(kernel panic),即Linux内核崩溃。图1所示为Linux内核对异常情况的处理流程。
2 LCRT机制的设计与实现
通过对Linux内核代码的分析可知,Linux内核本身提供了一种“内核通知机制”[7-8],并预定义了“内核事件通知链”,使得Linux内核扩展开发人员可以通过这些预定义的内核事件通知链在特定的内核事件发生时执行附加的处理流程。通过对Linux内核源代码的研究发现,对于上文中提到的“严重不可恢复的内核异常”,预定义了一个通知链和通知点,使得在发生Linux内核崩溃之后,可以在Linux内核的panic函数中预定义的一个“内核崩溃通知链”[7]上挂接LCRT机制来获得Linux内核崩溃现场的一些信息并记录到非易失性存储器中,以便分析引起Linux内核崩溃的原因。
这种解决问题所需时间呈上升的趋势固然有软件问题,但缺乏必要的手段以辅助解决问题才是主要的原因。通过对故障的统计跟踪发现,难以解决的软件错误和从发现到解决耗时较长的软件错误都集中在操作系统的核心部分,这其中又有很大比例集中在驱动程序部分[2]。因此,错误跟踪技术被看成是提高系统安全完整性等级的一个重要措施[1],大多数现代操作系统均为发展提供了操作系统内核“崩溃转储”机制,即在软件系统宕机时,将内存内容保存到磁盘[3],或者通过网络发送到故障服务器[3],或者直接启动内核调试器[4]等,以供事后分析改进。
基于Linux操作系统内核的崩溃转储机制近年来有以下几种:
(1) LKCD(Linux Kernel Crash Dump)机制[3];
(2) KDUMP(Linux Kernel Dump)机制[4];
(3) KDB机制[5];
(4) KGDB机制[6]。
综合上述几种机制可以发现,这四种机制之间有以下三个共同点:
(1) 适用于为运算资源丰富、存储空间充足的应用场合;
(2) 发生系统崩溃后恢复时间无严格要求;
(3) 主要针对较通用的硬件平台,如X86平台。
在嵌入式应用场合想要直接使用上列机制中的某一种,却遇到以下三个难点无法解决:
(1) 存储空间不足
嵌入式系统一般采用Flash作为存储器,而Flash容量有限,且可能远远小于嵌入式系统中的内存容量。因此将全部内存内容保存到Flash不可行。
(2) 记录时间要求尽量短
嵌入式系统一般有复位响应时间尽量短的要求,有的嵌入式操作系统复位重启时间不超过2s,而上述几种可用于Linux系统的内核崩溃转储机制耗时均不可能在30s内。写Flash的操作也很耗时间,实验显示,写2MB数据到Flash耗时达到400ms之多。
(3) 要求能够支持特定的硬件平台
嵌入式系统的硬件多种多样,上面提到的四种机制均是针对X86平台提供了较好的支持,而对于其他体系的硬件支持均不成熟。
由于这些难点的存在,要将上述四种内核崩溃转储机制中的一种移植到特定的嵌入式应用平台是十分困难的。因此,针对上述嵌入式系统的三个特点,本文介绍一种基于特定平台的嵌入式Linux内核崩溃信息记录机制LCRT(Linux Crash Record and Trace),为定位嵌入式Linux系统中软件故障和解决软件故障提供辅助手段。
1 Linux内核崩溃的分析
分析Linux内核对于运行期间各种“陷阱”的处理可以得知,Linux内核对于应用程序导致的错误可以予以监控,在应用程序发生除零、内存访问越界、缓冲区溢出等错误时,Linux内核的异常处理例程可以对这些由应用程序引起的异常情况予以处理。当应用程序产生不可恢复的错误时,Linux内核可以仅仅终止产生错误的应用程序,其他应用程序仍然可以正常运行。
如果Linux内核本身或者新开发的Linux内核模块存在bug,产生了“除零”,“内存访问越界”、“缓冲区溢出”等错误,同样会由Linux内核的异常处理例程来处理。Linux内核通过在异常处理程序中判断,如果发现是“严重的不可恢复”的内核异常,则会导致“内核恐慌”(kernel panic),即Linux内核崩溃。图1所示为Linux内核对异常情况的处理流程。
2 LCRT机制的设计与实现
通过对Linux内核代码的分析可知,Linux内核本身提供了一种“内核通知机制”[7-8],并预定义了“内核事件通知链”,使得Linux内核扩展开发人员可以通过这些预定义的内核事件通知链在特定的内核事件发生时执行附加的处理流程。通过对Linux内核源代码的研究发现,对于上文中提到的“严重不可恢复的内核异常”,预定义了一个通知链和通知点,使得在发生Linux内核崩溃之后,可以在Linux内核的panic函数中预定义的一个“内核崩溃通知链”[7]上挂接LCRT机制来获得Linux内核崩溃现场的一些信息并记录到非易失性存储器中,以便分析引起Linux内核崩溃的原因。
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- 【嵌入式】基于ARM的嵌入式Linux开发总结
- 基于ARM与嵌入式Linux的GPRS无线通讯系统
- (网盘)ARM嵌入式Linux系统开发详解
- ARM与嵌入式linux入门的建议(初学者必看)
- ARM11嵌入式系统Linux下液晶显示的实现
- ARM11嵌入式系统Linux下LCD的驱动的设计
- 基于arm11的嵌入式linux中nrf24l01驱动的实现
- 嵌入式Linux应用程序例程
- 基于ARM和Linux的嵌入式远程视频监控系统的设计
- 使用ARM9和Linux设计嵌入式PLC系统的详细资料说明 17次下载
- 如何使用ARM进行嵌入式linux的系统设计
- 嵌入式ARM芯片及linux操作系统 7次下载
- ARM与嵌入式Linux 基础讲义 168次下载
- ARM9嵌入式技术及Linux实验指导
- ARM与嵌入式Linux开发者大会
- 基于嵌入式Linux内核的ARM9运行实现方式介绍 1475次阅读
- 基于ARM的嵌入式操作系统该如何设计 1480次阅读
- 基于Yocto Project的定制嵌入式Linux产品设计浅析 1w次阅读
- 基于32位ARM920T内核的微处理器的嵌入式Linux系统构建详解 1776次阅读
- 基于嵌入式Linux系统下Mini GUI的移植方法与过程详解 3549次阅读
- 从RTOS到嵌入式Linux的应用移植步骤以及相关的关键技术分析 3186次阅读
- 关于嵌入式系统的特点和Linux内核的实时应用分析 1037次阅读
- 怎么才能更好的理解嵌入式操作系统Linux实时化技术? 1174次阅读
- 什么是嵌入式Linux内核调试技术?嵌入式开发又面临着哪些问题? 1134次阅读
- ARM嵌入式系统硬件设计及应用实例详解 1w次阅读
- 基于嵌入式Linux的无线视频监控系统设计 3004次阅读
- 基于嵌入式PIC32单片机的目标检测与跟踪系统 5589次阅读
- 对于嵌入式没有嵌入式软件架构师的详细解析 4055次阅读
- 基于ARM9与linux的嵌入式门禁监控系统设计与分析 1447次阅读
- 基于Linux的嵌入式实时操作系统的研究 2298次阅读
下载排行
本周
- 1感应笔电路图
- 0.06 MB | 7次下载 | 免费
- 2美的电磁炉维修手册大全
- 1.56 MB | 5次下载 | 5 积分
- 3Cortex-M3/M4F指令集技术用户手册
- 2.28MB | 3次下载 | 免费
- 4SMD LED选型手册 贴片灯珠
- 5.47 MB | 3次下载 | 免费
- 5基于PLC的拉丝机张力控制系统研究
- 0.14 MB | 2次下载 | 5 积分
- 6LZC3106G高性能谐振控制器中文手册
- 1.29 MB | 1次下载 | 1 积分
- 7JL2233B集成电平转换功能的LDO中文手册
- 0.50 MB | 1次下载 | 免费
- 8加密芯片的一种破解方法和对应加密方案改进设计
- 0.29 MB | 1次下载 | 免费
本月
- 1使用单片机实现七人表决器的程序和仿真资料免费下载
- 2.96 MB | 44次下载 | 免费
- 2UC3842/3/4/5电源管理芯片中文手册
- 1.75 MB | 19次下载 | 免费
- 3华瑞昇CR216芯片数字万用表规格书附原理图及校正流程方法
- 0.74 MB | 14次下载 | 3 积分
- 4DMT0660数字万用表产品说明书
- 0.70 MB | 13次下载 | 免费
- 53314A函数发生器维修手册
- 16.30 MB | 13次下载 | 免费
- 6TPS54202H降压转换器评估模块用户指南
- 1.02MB | 8次下载 | 免费
- 7STM32F101x8/STM32F101xB手册
- 1.69 MB | 8次下载 | 1 积分
- 8感应笔电路图
- 0.06 MB | 7次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935119次下载 | 10 积分
- 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
- 1.48MB | 420062次下载 | 10 积分
- 3Altium DXP2002下载入口
- 未知 | 233084次下载 | 10 积分
- 4电路仿真软件multisim 10.0免费下载
- 340992 | 191367次下载 | 10 积分
- 5十天学会AVR单片机与C语言视频教程 下载
- 158M | 183335次下载 | 10 积分
- 6labview8.5下载
- 未知 | 81581次下载 | 10 积分
- 7Keil工具MDK-Arm免费下载
- 0.02 MB | 73807次下载 | 10 积分
- 8LabVIEW 8.6下载
- 未知 | 65987次下载 | 10 积分
评论
查看更多