0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Linux内核睡眠的三种状态讲解

B4Pb_gh_6fde77c 来源:Linux内核远航者 作者:Linux内核远航者 2021-08-16 15:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1开场白

环境:

处理器架构:arm64

内核源码:linux-5.10.50

ubuntu版本:20.04.1

代码阅读工具:vim+ctags+cscope

无论是任务处于用户态还是内核态,经常会因为等待某些事件而睡眠(可能是等待IO读写完成,也可能等待其他内核路径释放一把锁等)。本文来探讨一下,任务处于睡眠中有哪些状态?睡眠对于任务来说究竟意味着什么?内核是如何管理睡眠的任务的?我们会结合内核源代码来分析任务的睡眠,力求全方位角度来剖析。

注:由于篇幅问题,文章分为上下两篇,且这里不区分进程和任务,统一使用任务来表示进程。

主要讲解以下内容:

睡眠的三种状态

睡眠的内核原理

用户态睡眠

内核态睡眠

总结

2. 睡眠的三种状态

任务睡眠有三种状态:

浅度睡眠

中度睡眠

深度睡眠

2.1 浅度睡眠

进程描述符的state使用TASK_INTERRUPTIBLE表示这种状态。

为可中断的睡眠状态,这里可中断是可以被信号所打断(唤醒)。

这里给出被信号打断/唤醒的代码路径:

kernel/signal.c

SYSCALL_DEFINE2(kill, pid_t, pid, int, sig)

->kill_something_info

->__kill_pgrp_info

->group_send_sig_info

->do_send_sig_info

->send_signal

->__send_signal

->complete_signal

->signal_wake_up

-> signal_wake_up_state(t, resume ? TASK_WAKEKILL : 0)

->wake_up_state(t, state | TASK_INTERRUPTIBLE)

->try_to_wake_up

可以看到在信号传递的时候,会通过signal_wake_up唤醒从处于可中断睡眠状态的任务。

2.2 中度睡眠

进程描述符的state使用TASK_KILLABLE表示这种状态。

可以被致命信号所打断。

这里给出被致命信号打断/唤醒的代码路径:

include/linux/sched.h

#define TASK_KILLABLE (TASK_WAKEKILL | TASK_UNINTERRUPTIBLE)

kernel/signal.c

SYSCALL_DEFINE2(kill, pid_t, pid, int, sig)

->kill_something_info

->__kill_pgrp_info

->group_send_sig_info

->do_send_sig_info

->send_signal

->__send_signal

->complete_signal

->

if (sig_fatal(p, sig) &&

¦ !(signal->flags & SIGNAL_GROUP_EXIT) &&

¦ !sigismember(&t->real_blocked, sig) &&

¦ (sig == SIGKILL || !p->ptrace)) { //致命信号

...

signal_wake_up(t, 1);

-> signal_wake_up_state(t, resume ? TASK_WAKEKILL : 0) // resume == 1

-> wake_up_state(t, state | TASK_INTERRUPTIBLE)

->try_to_wake_up

...

}

2.3 深度睡眠

进程描述符的state使用TASK_UNINTERRUPTIBLE表示这种状态。

为不可中断的睡眠状态,不能被任何信号所唤醒(特定条件没有满足发生信号唤醒可能导致数据不一致等问题,这种场景使用这种睡眠状态,如等待IO读写完成)。

3. 睡眠的内核原理

睡眠都是主动发生调度,即主动调用主调度器。

睡眠的主要步骤如下:

1)设置任务状态为睡眠状态

2)记录睡眠的任务

3)发起主动调度

下面我们来详细解读下这几个步骤:

3.1 设置任务状态为睡眠状态

这一步很有必要,一来标识进入了睡眠状态,二来是主调度器会根据睡眠标志将任务从运行队列删除。

注:睡眠状态描述见上一小节!

3.2 记录睡眠的任务

这一步也非常有必要,内核会将即将睡眠的任务记录下来,要么加入到链表中管理,要么使用数据结构记录。

如延迟睡眠场景,内核将即将睡眠的任务记录在定时器相关的数据结构中;可睡眠的信号量场景中,内核将即将睡眠的任务加入到信号量的相关链表中。

记录的目的在于:当唤醒条件满足时,唤醒函数能够找到想要唤醒的任务。

3.3 发起主动调度

这一步是真正进行睡眠的操作,主要是调用主调度器来发起主动调度让出处理器。

下面我们来看下主调度器为任务睡眠所作的处理:

kernel/sched/core.c

__schedule

->

prev_state = prev->state; //获得前一个任务状态

if (!preempt && prev_state) { //如果是主动调度 且任务状态不为0

if (signal_pending_state(prev_state, prev)) { //有挂起的信号

prev->state = TASK_RUNNING; //设置状态为可运行

} else {

deactivate_task(rq, prev, DEQUEUE_SLEEP | DEQUEUE_NOCLOCK); //cpu运行队列中删除任务

}

}

next = pick_next_task(rq, prev, &rf); //选择下一个任务

context_switch //进行上下文切换

来看下deactivate_task对于睡眠任务做的主要工作:

deactivate_task

->deactivate_task(rq, prev, DEQUEUE_SLEEP | DEQUEUE_NOCLOCK)

->p->on_rq = (flags & DEQUEUE_SLEEP) ? 0 : TASK_ON_RQ_MIGRATING; //设置任务的on_rq 为0 标识是睡眠

dequeue_task(rq, p, flags);

->p->sched_class->dequeue_task(rq, p, flags)

->dequeue_task_fair

->dequeue_entity

...

if (se != cfs_rq->curr) //不是cpu当前 任务

__dequeue_entity(cfs_rq, se); //cfs运行队列删除

->se->on_rq = 0; //标识调度实体不在运行队列!!!

->if (!(flags & DEQUEUE_SLEEP))

se->vruntime -= cfs_rq->min_vruntime; //调度实体的虚拟运行时间 减去 cfs运行队列的最小虚拟运行时间

deactivate_task会设置任务的on_rq 为0来 标识是睡眠 ,然后 调用到调度类的dequeue_task方法,在cfs中设置se->on_rq = 0标识调度实体不在cfs队列。

可以看到,发起主动调度的时候,在主调度器中会做判断:如果是主动调度且任务状态不为0 (即为不是可运行的TASK_RUNNING)时,如果没有挂起的信号,就会将任务从cpu的运行队列中“删除”,然后选择下一个任务,进行上下文切换。

将即将睡眠的任务从cpu的运行队列中“删除”意义重大:主调度器再次选择下一个任务的时候不会在选择睡眠的任务(因为主调度器总是在运行队列中选择任务运行,除非任务被唤醒,重新加入运行队列)。

注意:1.这里的删除指的是设置对应标志如p->on_rq=0,se->on_rq = 0,当选择下一个任务的时候不会在加入运行队列中。2.即将睡眠的任务是cpu上的当前任务(curr指向)。3.调用主调度器后,即将睡眠的任务不会再次加入cpu运行队列,除非被唤醒。

再来看下选择下一个任务的时候会做哪些事情和睡眠有关(暂不考虑组调度情况):

pick_next_task

->class->pick_next_task

->pick_next_task_fair //kernel/sched/fair.c

->if (prev)

put_prev_task(rq, prev); //对前一个任务处理

se = pick_next_entity(cfs_rq, NULL); //选择下一个任务

set_next_entity(cfs_rq, se);

主要看下put_prev_task:

put_prev_task

->prev->sched_class->put_prev_task(rq, prev)

->put_prev_task_fair

->put_prev_entity

-> if (prev->on_rq) { //前一个任务的调度实体on_rq不为0?

update_stats_wait_start(cfs_rq, prev);

/* Put ‘current’ back into the tree. */

__enqueue_entity(cfs_rq, prev); //重新加入cfs运行队列

/* in !on_rq case, update occurred at dequeue */

update_load_avg(cfs_rq, prev, 0);

}

cfs_rq->curr = NULL; //设置cfs运行队列的curr为NULL

put_prev_task所做的主要工作就是将前一个任务从cfs运行队列中删除,在这里就是通过调用__enqueue_entity将对应的调度实体重新加入cfs队列的红黑树,但是对于即将睡眠的任务之前在主调度器中通过deactivate_task将prev->on_rq设置为0了,所以对于即将睡眠的任务来说,它对应的调度实体不会在重新加入cfs运行队列的红黑树。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 内核
    +关注

    关注

    4

    文章

    1476

    浏览量

    43089
  • Linux
    +关注

    关注

    88

    文章

    11817

    浏览量

    219535

原文标题:深入理解Linux内核之进程睡眠(上)

文章出处:【微信号:gh_6fde77c41971,微信公众号:FPGA干货】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何理解Linux内核中的PCIe驱动

    我们习惯了用 Verilog 去死磕 PCIe 的底层协议状态机。但一旦越过硬件边界来到操作系统层面,Linux 内核是如何接管并驱动这些 PCI/PCIe 设备的呢?由于不同的 CPU 架构实现了
    的头像 发表于 04-11 17:22 1256次阅读

    AP6301 低功耗模式对比:待机 / 关断 / 睡眠(功耗实测)

    AP6301 三种低功耗模式,满足不同产品待机需求: 充电完成待机 :≈85μA 关断模式 (PROG 悬空) :≈25μA 睡眠 (VCC 掉电) :电池反向漏电流 <1μA 实测案例 : TWS 充电仓,5V 输入,充满后自动进入待机, 月自耗电<1% ,完全满足长续
    发表于 04-11 11:02

    Linux内核大核心模块深度解析:调度、内存与I/O

    Linux内核作为操作系统的核心,其进程调度、内存管理和文件I/O大模块共同决定了系统的性能与稳定性。无论是多核服务器的高并发处理,还是嵌入式设备的资源受限场景,深入理解这些底层机制都是进行性能调
    的头像 发表于 03-12 09:00 232次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b><b class='flag-5'>三</b>大核心模块深度解析:调度、内存与I/O

    深度解析ES8389/ES8390/音频芯片Linux驱动(Linux6.1内核

    基于 Linux6.1 内核,从驱动架构、寄存器配置、核心函数、数据流走向四个维度,完整拆解 ES8389 的 Linux 驱动实现,帮你吃透这款芯片的驱动逻辑。     注意:在讲解
    的头像 发表于 02-02 11:37 2387次阅读
    深度解析ES8389/ES8390/音频芯片<b class='flag-5'>Linux</b>驱动(<b class='flag-5'>Linux</b>6.1<b class='flag-5'>内核</b>)

    Linux系统内核参数调优实战指南

    Linux 内核参数调优是系统性能优化的核心环节。随着云原生架构的普及和硬件性能的飞速提升,默认的内核参数配置往往无法充分发挥系统潜力。在高并发 Web 服务、大数据处理、容器化部署等场景下,合理的
    的头像 发表于 01-28 14:27 695次阅读

    【「Linux 设备驱动开发(第 2 版)」阅读体验】+读深入理解Linux内核内存分配

    每个内存地址是虚拟的,不是直接指向RAM中的任何地址。当用户访问内存中的存储单元时,都会进行地址转换以匹配相应的物理内存。书籍的第10章讨论了五个主题,对Linux内核内存分配进行详细讲解。 接着
    发表于 01-16 20:05

    【「Linux 设备驱动开发(第 2 版)」阅读体验】Linux内核开发基础

    队列中的元素就是正在睡眠且等待被唤醒的进程 内核中的简单睡眠 简单睡眠也被称为被动睡眠,任务会在等待时进入
    发表于 01-12 22:45

    【「Linux 设备驱动开发(第 2 版)」阅读体验】+读内核处理的核心辅助函数

    、一些需要等待资源状态的改变情况而设定的。为用户更好得利用条件变量,Linux内核提供了等待队列、完成队列两机制。 关于锁方面,书籍中介绍相当全面。①.自旋锁,自旋锁应用中存在的弊端
    发表于 01-10 22:08

    请问CW32芯片的三种工作模式是什么?

    CW32芯片的三种工作模式是什么?
    发表于 12-26 06:48

    基于 DR1M90 的 Linux-RT 内核开发:从编译配置到 GPIO / 按键应用实现(1)

    本手册由创龙科技研发,针对 DR1M90,详述 Linux-RT 实时内核开发:含实时性测试(LinuxLinux-RT 对比、CPU 空载 / 满负荷 / 隔离
    的头像 发表于 12-02 10:38 1311次阅读
    基于 DR1M90 的 <b class='flag-5'>Linux</b>-RT <b class='flag-5'>内核</b>开发:从编译配置到 GPIO / 按键应用实现(1)

    如何将 GPIO PWM 和 GPIO Capture 驱动程序导入 Linux 内核,实现 PWM 输出并检测引脚的变化状态

    如何将 GPIO PWM 和 GPIO Capture 驱动程序导入 Linux 内核,实现 PWM 输出并检测引脚的变化状态
    发表于 08-20 08:20

    睡眠障碍调控系列之经颅振荡直流电刺激(toDCS)

    1.睡眠障碍的类型与表征睡眠障碍其类型超80,其中最常见的三种类型及其表征如下:类型核心表征具体描述慢性失眠症长期入睡困难或睡眠维持障碍持
    的头像 发表于 08-13 19:16 1193次阅读
    <b class='flag-5'>睡眠</b>障碍调控系列之经颅振荡直流电刺激(toDCS)

    MEMS中的三种测温方式

    在集成MEMS芯片的环境温度测量领域,热阻、热电堆和PN结原理是三种主流技术。热阻是利用热敏电阻,如金属铂或注入硅的温度电阻系数恒定,即电阻随温度线性变化的特性测温,电阻变化直接对应绝对温度,需恒流源供电。
    的头像 发表于 07-16 13:58 1891次阅读
    MEMS中的<b class='flag-5'>三种</b>测温方式

    如何配置和验证Linux内核参数

    Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要。合理的参数调整可以显著提升网络性能、系统稳定性及资源利用率。然而,仅仅修改参数是不够的,如何验证这些参数是否生效同样关键。
    的头像 发表于 05-29 17:40 1369次阅读

    介绍三种常见的MySQL高可用方案

    在生产环境中,为了确保数据库系统的连续可用性、降低故障恢复时间以及实现业务的无缝切换,高可用(High Availability, HA)方案至关重要。本文将详细介绍三种常见的 MySQL 高可用
    的头像 发表于 05-28 17:16 1437次阅读