0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

合宙基于移芯平台的模块死机问题详解

青山老竹农 来源:jf_82863998 作者:jf_82863998 2024-08-20 11:35 次阅读

我们在分析模块死机原因的时候主要会用到两个工具:luatools和EPAT

相关关联文档和下载地址如下:

Ramdump里分析内存泄漏问题

无法抓底层log的情况下如何导出死机dump

Luatools下载调试工具

EPAT抓取底层日志

Flashtools_v4.1.9下载

luatools和EPAT这2个工具,具体使用方法要了解,本文不做深入讲解,EPAT抓取底层日志文档内有详细使用说明

luatools用于捕获从USB口的用户log,即luat_debug_print输出的log,仅用于csdk和luatos。AT版本没有用户log和用户串口通道,需要使用EPAT工具抓取。

EPAT用于捕获USB口,UART0(DBG_UART串口) 的底层log,在luatools没有开启的时候,EPAT同样捕获用户log的大部分内容,这个时候用户log会从底层log输出,标识为luatos,等级为error,所以不要把用户log当做error!

luatools捕获用户log时,自动识别GB2312还是UTF8编码,也能正确打印64bit数据和浮点数据

EPAT只能识别GB2312编码,不能正确打印64bit和浮点数据,在用UART0捕获数据时会丢失部分log,尤其是优先级低的,所以用户log的等级是error,优先级高

双方都是USB口对接的情况下,USB虚拟串口没有波特率限制,任意选择,实际传输速率都是一样的

为啥要区分用户log通道和底层log通道,因为移芯不开放底层log解析方法

csdk固件默认死机后存储死机信息到flash后重启,luatos固件死机后会存储死机信息到flash,然后等EPAT或者luatools抓取死机信息,等待大约40秒左右会重启。

一、出现死机问题分析

A 怎么抓LOG

A1 认识USB虚拟串口

由于电脑识别出来串口名字都是一样的,因此需要从串口属性上来区分对应功能,具体看下面截图红框

A1.1 用户log通道

wKgZomaaFwWASNeYAACrVioBmcQ761.png

A1.2 底层log通道

wKgZomaaFw2AFVo4AACqCeVAnSI621.png


A1.3 用户串口通道

wKgaomaaFxWAbyycAACpqmi_dsg684.png


A2 抓log

如果使用EPAT工具抓取日志,说明请看 EPAT抓取底层日志文档

A2.1 USB可用

建议方案1,只用luatools勾选USB打印模式即可,没有配置上的要求,luatools会自动识别log通道,需底层log的,工具配置--》log--》勾选ap log,luatools会自动识别log通道,底层log保存在log/4gdiag。luatools版本必须在2.2.1及以上

建议方案2,直接用EPAT,按照EPAT手册操作即可,如果luatools开着,工具配置--》log--》不要勾选ap log

A2.2 USB不可用

只能用EPAT通过DBG_UART抓LOG了,需要6M波特率抓取(USB转TTL工具也要支持6M波特率),如果是AT版本还需要通过发送以下指令配置

AT+ECPCFG=logCtrl,2             // 输出全部日志
AT+ECPCFG=logPortSel,1          // 只从DBG_UART串口输出日志
AT+ECPCFG=logBaudrate,6000000   // 设置波特率为6M

B 遇到死机怎么办

设置死机不重启方法

AT固件:发送 AT+ECPCFG="faultAction",0 或者 AT*EXASSERT=1 指令开启死机不重启。

LuatOS开发:调用 mcu.hardfault(0) 接口开启死机不重启。

CSDK开发:在task中执行 luat_debug_set_fault_mode(LUAT_DEBUG_FAULT_HANG); 开启死机不重启。

B1 EPAT抓底层log,固件设置成死机不重启

EPAT会自动抓,并且自动弹出ramdump处理界面,按照手册操作即可。

B2 luatools抓底层log,固件设置成死机不重启

luatools也会自动抓ramdump,但是只能保存成文件,仍然需要用EPAT来手动进入处理ramdump界面,后续处理见B1

B3 固件设置成死机重启,或者没有工具抓底层log

帮助文档:无法抓底层log的情况下如何导出死机dump

C 死机重启原因常见情况分析

死机需要底层log和ramdump处理结果综合判断,luatos固件还要看用户log,这里讨论如何定位出错代码位置或者出错原因

C1 luavm抛出的异常

这个看用户log就行,如果开启了errdump,还能在iot平台上看到

C2 断言死机

看底层log就可以,搜索EcAssert字样,可以看到断言的位置

如果没有底层log,ramdump里需要看list source的代码上下是不是调用了ec_assert_regs,然后在stackframe with local里看看调用顺序,大概率能看到断言的位置。

断言死机如果是malloc失败,那么就是ram不足了。

C3 内存不足

这是最常见的死机原因,而且9成9可以判断是内存泄露,剩下也有可能malloc时的参数不对,申请了不可能申请到的空间大小。内存不足直接表现,C2中已有部分描述,如果有底层log,还可以从死机时打印的信息来判断

wKgaomaaFyGAE7sjAAMkNBsNIV0748.png

这里表示动态分配ram时,最大的block只有712字节了,这是非常典型的内存不足引起的死机,正常来说,至少要有个70KB左右的空间来满足LTE协议栈的需求

如果ramdump信息完整,则可以从ramdump里找到查找方向从Ramdump里分析内存泄露问题

C4 看门狗死机

在底层log和ramdump里都能看到,

wKgZomaaFymAQeTOAAC0ATfKQoM742.png

ramdump里能看到最后停在NMI Handler里。

看门狗死机,要么死循环,要么操作时间太长,消除死循环,或者主动喂一下狗。压力测试和RSA运算时特别注意一下。

C5 疑难杂症

真正遇到hardfault时,需要先从底层日志里看死机的直接原因,也就是arm内核遇到的致命错误,当然多种多样,常见的地址错误(常见data access)有数据存取时的总线错误(常见precise data access,imprecise data access等等),指令错误(常见switch to an invalid state (e.g., ARM))等等。

以下个人经验:

先要排除一下栈溢出的可能,一旦栈溢出,什么奇怪的现象都有可能发生,运气好的,触发断言,运气不好的,就什么错误都可能发生,任务链表都可能被破坏,导致ramdump里的信息都会缺失。

1.ramdump信息完整

如果ramdump信息完整,则可以从ramdump大致分析出有没有栈溢出现象从Ramdump里看栈溢出

如果ramdump的信息看起来完整,stackframe with local里调用顺序也比较合理,那么就能定位发生问题的函数和语句,后续就看代码调试吧,这是比较理想的情况。

地址错误的,大概率是读写了一个不可读写的地址,但是注意,有时候非ram和flash地址,直接读取并不一定会出错。

总线错误,大概率是数据对齐的问题,比如uint32_t *指针,去读取一个uint8_t *指针指向的内容,一旦uint8_t *指针存放的地址不是32位对齐的,编译器又没有对应优化处理,死机是很正常的

指令错误,这种常见的函数指针用出问题,导致函数退出时,PC指针已经不能指向正确的代码指令,从而执行了非arm的指令

2.ramdump的信息不完整

如果ramdump的信息都不完整,底层log也丢完,或者压根没法抓,建议通过删减代码,加打印语句等方法来定位出错的语句,多次尝试缩小范围,直到成功,有经验,对源码了解的,能加快这一进度。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2666

    浏览量

    47328
  • 死机
    +关注

    关注

    0

    文章

    17

    浏览量

    8591
收藏 人收藏

    评论

    相关推荐

    4G模组如何轻松上云?IoT_CLOUD之中OneNET

    ​** 有新朋友问:可以多讲些云平台的操作吗?** 当然可以!文末留言你想要了解的云平台,优先安排~ 接下来,本文将以Air780E+LuatOS作为示例,教你使用IoT_CLOU
    的头像 发表于 10-07 20:41 295次阅读
    4G模组如何轻松上云?<b class='flag-5'>合</b><b class='flag-5'>宙</b>IoT_CLOUD之中<b class='flag-5'>移</b>OneNET

    如何使用的DTU+业务云平台,做一个温湿度传感器数据采集项目?

    使用的DTU+业务云平台,做一个温湿度传感器数据采集项目,超详细教程。
    的头像 发表于 09-18 11:11 354次阅读
    如何使用<b class='flag-5'>合</b><b class='flag-5'>宙</b>的DTU+业务云<b class='flag-5'>平台</b>,做一个温湿度传感器数据采集项目?

    4G模组Air780EX——产品规格书

    Air780EX是通信推出的LTECat.1bis通信模块;Air780EX采用EC618平台
    的头像 发表于 09-06 17:31 358次阅读
    <b class='flag-5'>合</b><b class='flag-5'>宙</b>4G模组Air780EX——产品规格书

    面向全体用户的一封求助信

    现面向所有的用户正式求助!!!希望有意愿帮助的用户,提出您的宝贵意见!
    的头像 发表于 09-05 16:11 297次阅读
    <b class='flag-5'>合</b><b class='flag-5'>宙</b>面向全体用户的一封求助信

    Air700EAQ硬件设计手册——应用接口2

    Air700EAQ硬件设计的详细介绍
    的头像 发表于 08-27 14:23 366次阅读
    <b class='flag-5'>合</b><b class='flag-5'>宙</b>Air700EAQ硬件设计手册——应用接口2

    Air700ECQ硬件设计手册——应用接口1

    Air700ECQ硬件设计手册——应用接口1
    的头像 发表于 08-21 18:46 324次阅读
    <b class='flag-5'>合</b><b class='flag-5'>宙</b>Air700ECQ硬件设计手册——应用接口1

    Air780EP模块开发常见问题——异常断链篇

    在用Air780EP模块开发的时候,有时候会遇到收不到网络数据的问题。 这里把遇到的问题和排查方法记录下来,希望能够帮助到大家!
    的头像 发表于 08-09 17:47 2808次阅读
    <b class='flag-5'>合</b><b class='flag-5'>宙</b>Air780EP<b class='flag-5'>模块</b>开发常见问题——异常断链篇

    Air780EP模块Lua开发阿里云应用指南

    Air780EP模块Lua开发阿里云超详细教学!看完包学会!
    的头像 发表于 08-08 09:00 860次阅读
    <b class='flag-5'>合</b><b class='flag-5'>宙</b>Air780EP<b class='flag-5'>模块</b>Lua开发阿里云应用指南

    Air780E/Air780EP/Air780EQ/Air201模块遇到死机问题如何分析

    Air780E/Air780EP/Air780EQ/Air201模块遇到死机问题如何分析简介本文档适用于Air780E、Air780EP、Air780EQ、Air201关联文档和使
    的头像 发表于 08-01 17:27 686次阅读
    <b class='flag-5'>合</b><b class='flag-5'>宙</b> Air780E/Air780EP/Air780EQ/Air201<b class='flag-5'>模块</b>遇到<b class='flag-5'>死机</b>问题如何分析

    Air780E/Air780EP/Air780EQ/Air201模块遇到内存死机如何分析

    Air780E/Air780EP/Air780EQ/Air201模块遇到内存死机如何分析简介本文档适用于Air780E、Air780EP、Air780EQ、Air201关联文档和使
    的头像 发表于 07-19 16:07 474次阅读
    Air780E/Air780EP/Air780EQ/Air201<b class='flag-5'>模块</b>遇到内存<b class='flag-5'>死机</b>如何分析

    Air780E/Air780EP/Air780EQ/Air201模块遇到死机问题如何分析

    Air780E/Air780EP/Air780EQ/Air201模块遇到死机问题如何分析简介本文档适用于Air780E、Air780EP、Air780EQ、Air201关联文档和使
    的头像 发表于 07-19 15:37 569次阅读
    Air780E/Air780EP/Air780EQ/Air201<b class='flag-5'>模块</b>遇到<b class='flag-5'>死机</b>问题如何分析

    “花生米”4G模组——Air700EL Air700EY全新上市

    、Air700EY。Air700EL/Air700EY新品简介Air700EL/Air700EY——基于
    的头像 发表于 12-26 08:04 2072次阅读
    <b class='flag-5'>合</b><b class='flag-5'>宙</b>“花生米”4G模组——Air700EL Air700EY全新上市

    全球最小?“花生米”4G模组——Air700EL&amp;Air700EY全新上市

    、Air700EY。   Air700EL/Air700EY新品简介 Air700EL/Air700EY ——基于
    的头像 发表于 12-25 12:20 2678次阅读
    全球最小?<b class='flag-5'>合</b><b class='flag-5'>宙</b>“花生米”4G模组——Air700EL&amp;Air700EY全新上市

    | Air780EP首版LuatOS固件发布,新品模组内测抢先体验

    07日,Air780EP首版LuatOS固件发布。 软件支持已就绪,开发板还会远吗? Air780EP首版LuatOS固件发布 Air780EP——
    的头像 发表于 12-11 12:20 2684次阅读
    <b class='flag-5'>合</b><b class='flag-5'>宙</b> | Air780EP首版LuatOS固件发布,新品模组内测抢先体验

    基于Air001的迷你RGB灯环

    点亮夜空的是什么?是工程师不羁的灵魂,点燃满怀希望与热爱的璀璨星河,又或是少年勇敢萌动的心……今天特别分享@Link-who大佬的开源佳作——基于Air001的恋爱日记系列迷你RGB灯环。那么
    的头像 发表于 11-25 08:04 1241次阅读
    基于<b class='flag-5'>合</b><b class='flag-5'>宙</b>Air001的迷你RGB灯环