0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Linux内核维护者的真相与误解

Linux爱好者 来源:Linux News搬运工 作者:Linux News搬运工 2021-03-03 15:28 次阅读

自 2020 年 1 月发布 5.5 内核之后,到现在已经有近 87,000 个 patch,来自于近 4600 名开发者,都被合并到 mainline 仓库中了。review 所有这些 patch 的工作,对于愿意花时间的内核开发者来说也都是一项艰巨的任务,所以是否要接受合并 patch,这个决定权就被委托给了各个子系统的维护者(maintainer)来代理决定,他们每个人都对内核中这一部分的改动具有部分或者完整的决定权。

这些维护者们就被记录在一个叫 MAINTAINERS 的文件中(当然是这个名字)。但是,MAINTAINERS 文件也需要维护,它能很好地反映现实情况吗?MAINTAINERS 文件的存在目的,并不仅仅是为了让大家给维护者点赞。开发者们需要用它来确定该把 patch 发到哪里。

get_maintainer.pl 脚本通过查看这个 patch 修改了的文件,就可以生成一系列邮件地址来发送 patch,从而让这一过程变得更加自动化。如果这个文件中有错误信息的话,就可能会让 patch 发送到错误的地方去,所以我们需要这个文件能保持更新。

最近,编者收到 Jakub Kicinski 的建议,他认为可以比较 一下 MAINTAINERS 中的各个条目和现实世界中的工作的吻合程度,应该能得到一些线索。于是折腾了一会儿 Python 之后,我们就得到了一个新的分析脚本。

Digging into MAINTAINERS

统计下来,MAINTAINERS 文件中已经列出了 2280 个 "subsystems (子系统)"。每一个子系统都包括一个它所涵盖的文件和目录列表。我们可以查看这些文件的 commit 信息来这个子系统中都有谁在进行工作。

撰写 patch 显然属于工作内容之一,但其他活动也得算,比如处理 patch (可以从 Signed-off-by tag 来得到这个信息) 或 review patch (根据 Reviewed-by 或 Acked-by)。

我们牺牲了一些 CPU 挖矿的时间,得到了一个大概统计值,也就是各个子系统中明确列出的维护者最后一次在该子系统中实际做了有效工作的时间是什么时候。

对于那些想看细节的人来说,可以直接看这个完整结果(https://lwn.net/Articles/842419/)。

不过,我们可以缩小数据范围,在这个文件中挑选出一些我们更感兴趣的内容。例如,有 367 个子系统在整个 Git 历史中都没有维护者,或维护者从未出现过(没有包括那些没有文件的 "子系统"–见下文)。

在这些子系统中,很多已经过了它本身的黄金时期,比如现在 3c59x 网卡维护者根本没有多少工作可做。网络开发人员也不会收到很多 ATM 的 patch 了,Palm Treo 也不需要有多少支持工作了,苹果最近也很少发布基于 M68k 的系统了,Arm 软驱(floppy drive)也没有多少人还在使用了,S3 Savage 显卡也不再是以前人们所必备的设备了。

这几百项中,很多可能都代表着可以完全删除的代码。类似的结论也可以从另一个列表中得到 (https://lwn.net/Articles/842424/),那个列表中都是没有列出维护者的子系统。当然,其中一些子系统本身也不太对头,有一个子系统简单地命名为 "ABI/API",指向了 linux-api 邮件列表。实际上有一个文件是与这个 "子系统 " 相关的,kernel/sys_ni.c,这个文件会对那些未实现的系统调用进行处理。因此,这个条目的存在价值,是为了让开发者在添加新的系统调用时会抄送 linux-api 邮件列表。

"Arm subarchitectures " 条目也是类似情况。一些无维护者的子系统,比如 framebuffer 层,可能后续会有人愿意接手从而复活。

reiserfs 文件系统缺乏维护者,但似乎仍有一些用户。其他的子系统,比如 DECnet 或 Matrox framebuffer,可能最好的处理就是不去管它了(或干脆删除掉)。

MAINTAINERS 文件中列出的一些 "子系统" 没有任何文件需要修改。

一个有趣的例子是 "embedded Linux",据说由 Paul Gortmaker、Matt Mackall 和 David Woodhouse 维护。鉴于嵌入式 Linux 的成功,我们都认为他们的工作非常出色。"device number registry" 声称是有维护的,但这里只包含一个链接,指向一个不存在的网页。

"disk geometry and partition handling" 这一条中的 URL 仍然有效,但这些网页似乎已经有十多年没有更新了,可以看出最近 Zip 驱动器的 geometry 并没有什么进展。

man page 这些手册页面倒是有积极维护的,但它们不在内核代码树中。

Help needed

从目前的结果可以得出几个结论。一个是很多内核子系统现在并不是真的需要有人来维护,相反,其中一些可能需要被删除掉。另一个结论是,也许 MAINTAINERS 文件本身需要清理一下。但还有一个有价值的问题,那就是从这些数据是否可以看出是否有一些子系统从新的维护者中获益匪浅的呢?

为了回答这个问题,我们又花费了一些本来可以用来挖矿的 CPU 时间,来寻找符合这些标准的子系统。

没有列出维护者,或者所谓的维护者已经在该子系统中至少 6 个月没有活动了。

自 2020 年 1 月发布 5.5 内核以来,至少有 50 个提交跟这个子系统有关。

这个搜索的目的是找出那些仍在进行某种活跃开发,但没有活跃的、明确指定的子系统。

搜索结果可以分为几类。有些 MAINTAINERS 的条目中包含了大量的文件,使得 commit 数量看起来比真实情况要多了不少。

例如,名为 "ASYNCHRONOUS TRANSFERS/TRANSFORMS (IOAT) API "的子系统跟 drivers/dma 下的所有文件都有关,"DMA GENERIC OFFLOAD ENGINE SUBSYSTEM" 也包含这些文件。

该子系统则由 Vinod Koul 积极维护。有两个子系统属于这一类,在下面的表格中,"Activity" 列表示维护者最后一次我们看到他的活动时间(如果有的话),而 "Commits" 则显示了自 5.5 以来影响到这个子系统的 commit 次数。

Subsystem Activity Commits
ASYNCHRONOUS TRANSFERS/TRANSFORMS (IOAT) API —— 536
HISILICON NETWORK SUBSYSTEM DRIVER 2019-11-16 258

这些子系统或者不是一个单独的实体(entity),或者应该减少其覆盖的文件清单,要以符合现实情况。

还有一些子系统的维护者使用的是公司电子邮件别名。比如 "DIALOG SEMICONDUCTOR DRIVERS" 的维护者是 support.opensource@diasemi.com,这个地址显然不会出现在任何实际的 patch commit 中。不过在该子系统内看进去的话,可以看到许多来自 diasemi.com 邮件地址的许多 review,所以该子系统不能说是真的没人维护。

这个类别包含:

Subsystem Activity Commits
DIALOG SEMICONDUCTOR DRIVERS —— 120
QUALCOMM ATHEROS ATH9K WIRELESS DRIVER —— 65
WOLFSON MICROELECTRONICS DRIVERS —— 146

与之相关的是有些子系统的维护者信息是过时的,指定的维护者并不活跃,但往往是来自同一公司的其他人接替了他的工作,并承担事实上的维护工作。

这些包括:

Subsystem Activity Commits
HISILICON NETWORK SUBSYSTEM 3 DRIVER (HNS3) 2019-11-16 234
HISILICON SECURITY ENGINE V2 DRIVER (SEC2) 2020-06-18 55
LINUX FOR POWER MACINTOSH 2018-10-19 71
MELLANOX ETHERNET INNOVA DRIVERS —— 93
MELLANOX MLX4 IB driver —— 70
OMAP HWMOD DATA 2016-06-10 102
QCOM AUDIO (ASoC) DRIVERS 2018-05-21 125
TEGRA I2C DRIVER 2018-05-30 56

最后,还有一些子系统似乎真的缺少维护者,它们通常的 commit 是由其他的子系统维护者来合并,或者是通过少数几个终极维护者来最终合入的。

它们是:

Subsystem Activity Commits
ARM/UNIPHIER ARCHITECTURE —— 73
DRBD DRIVER 2018-12-20 51
FRAMEBUFFER LAYER —— 402
HMM - Heterogeneous Memory Management 2020-05-19 54
I2C SUBSYSTEM HOST DRIVERS —— 434
MARVELL MVNETA ETHERNET DRIVER 2018-11-23 65
MEDIA DRIVERS FOR RENESAS - VIN 2019-10-10 56
MUSB MULTIPOINT HIGH SPEED DUAL-ROLE CONTROLLER 2020-06-24 54
NFC SUBSYSTEM —— 72
PROC FILESYSTEM —— 171
PROC SYSCTL 2020-06-08 51
QLOGIC QLGE 10Gb ETHERNET DRIVER 2019-10-04 77
STAGING - REALTEK RTL8188EU DRIVERS 2020-07-15 121
STMMAC ETHERNET DRIVER 2020-05-01 174
UNIVERSAL FLASH STORAGE HOST CONTROLLER DRIVER —— 277
USB NETWORKING DRIVERS —— 119
X86 PLATFORM DRIVERS - ARCH —— 119

对于一直关注相关领域的人来说,上面的列表并不出乎预料。frameebuffer 子系统是一个已知有问题的领域,由于缺乏维护,"soft scrollback" 功能最近就被从 framebuffer 驱动中移除了。

不少人仍然需要使用这段代码,但它越来越难以与内核的图形驱动集成起来使用,很少有人有兴趣去深入研究它。事实上,I2C host driver 确实有一个事实上的维护者,它就是 Wolfram Sang,他也维护着 core I2C 子系统。他一直希望有人能帮助他维护这些驱动程序,但似乎没有人愿意帮助他,所以他在有时间的时候就也负责维护这些驱动程序。

/proc 是一个有趣的例子,每个人都依赖它,但没有人负责维护它。HMM 也很有趣,创建者当初花了很多精力来把 HMM 功能合入 mainline,但现在似乎转向去忙其他事情了。

以上这些地方,看起来都是有抱负的内核开发者可以参与进来提供帮助的地方。那么那些在 MAINTAINERS 文件中没有记录的子系统呢?如果我们用快速脚本来查找一下内核树中所有的未被 MAINTAINERS 文件包含的文件,我们得到的文件列表包含超过 2800 个文件。其中自然包括 MAINTAINERS 文件本身。其余的绝大多数都是 include/下的头文件,其中大部分可能都有维护者,应该添加到 MAINTAINER 文件中相应的条目下。

不过令人沮丧的是,在 kernel/目录下有 72 个文件没有列出维护者。这当然不是现实情况。SYSV IPC 代码是没有维护者的,这反映了它普遍不受欢迎。

其余大部分未维护的文件都在 tools/ 或 samples/ 目录下。比较难找出来的是 MAINTAINERS 中号称会包含的文件中,其实有一些并不是由指定的人维护的。这种情况经常出现在那些指定包含整个目录树的条目中。例如,编者被列为需要处理 Documentation/目录,但肯定不能说我真的是在 "维护" 这么多文件。类似的情况在内核树中很多地方都有。

如果有人希望从这些数据中得出一些整体性的结论,那么可能会是这些:MAINTAINERS 文件肯定有一些黑暗的角落,这些角落本身也可能需要一些维护(其中一些已经在做了)。内核中一些缺乏维护者的部分,仍然是可以使用的,而另一些则已经过于古老都不需要维护了。不过,大多数情况下,内核中的子系统都有指定的维护者,而且他们中的大多数人至少都在努力维护他们负责的代码。The situation could be a lot worse。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    11204

    浏览量

    208702
  • 自动化
    +关注

    关注

    29

    文章

    5482

    浏览量

    78988
  • python
    +关注

    关注

    55

    文章

    4766

    浏览量

    84369

原文标题:Linux 内核维护者的真相与误解

文章出处:【微信号:LinuxHub,微信公众号:Linux爱好者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    deepin社区亮相第19届中国Linux内核开发大会

    中国 Linux 内核开发大会,作为中国 Linux 内核领域最具影响力的峰会之一,一直以来都备受瞩目。
    的头像 发表于 10-29 16:35 309次阅读

    linux驱动程序如何加载进内核

    Linux系统中,驱动程序是内核与硬件设备之间的桥梁。它们允许内核与硬件设备进行通信,从而实现对硬件设备的控制和管理。 驱动程序的编写 驱动程序的编写是Linux驱动开发的基础。在编
    的头像 发表于 08-30 15:02 339次阅读

    Linux内核测试技术

    Linux 内核Linux操作系统的核心部分,负责管理硬件资源和提供系统调用接口。随着 Linux 内核的不断发展和更新,其复杂性和代码规
    的头像 发表于 08-13 13:42 404次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>测试技术

    Linux内核中的页面分配机制

    Linux内核中是如何分配出页面的,如果我们站在CPU的角度去看这个问题,CPU能分配出来的页面是以物理页面为单位的。也就是我们计算机中常讲的分页机制。本文就看下Linux内核是如何管
    的头像 发表于 08-07 15:51 213次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>中的页面分配机制

    欢创播报 华为宣布鸿蒙内核已超越Linux内核

    1 华为宣布鸿蒙内核已超越Linux内核   6月21日,在华为开发大会上, HarmonyOS NEXT(鸿蒙NEXT)——真正独立于安卓和iOS的鸿蒙操作系统,正式登场。这是Ha
    的头像 发表于 06-27 11:30 753次阅读

    算能全系列RISC-V处理器进入PLCT实验室6.6内核维护工程

    Linux内核6.6LTS分支的升级并进行长期维护;与此同时,继续推动算能RISC-V相关补丁进入Linux内核上游(upstream)。
    的头像 发表于 05-22 08:33 829次阅读
    算能全系列RISC-V处理器进入PLCT实验室6.6<b class='flag-5'>内核</b><b class='flag-5'>维护</b>工程

    使用 PREEMPT_RT 在 Ubuntu 中构建实时 Linux 内核

    盟通技术干货构建实时Linux内核简介盟通技术干货Motrotech如果需要在Linux中实现实时计算性能,进而有效地将Linux转变为RTOS,那么大多数发行版都可以打上名为PREE
    的头像 发表于 04-12 08:36 2086次阅读
    使用 PREEMPT_RT 在 Ubuntu 中构建实时 <b class='flag-5'>Linux</b> <b class='flag-5'>内核</b>

    Ubuntu 24.04 LTS选用Linux 6.8为默认内核

    关于Ubuntu 24.04 LTS使用何种内核版本,一直备受关注。Canonical工程师Andrea Righi昨日宣布,Ubuntu 24.04将默认搭载Linux 6.8内核
    的头像 发表于 01-29 11:27 969次阅读

    rk3399移植Linux内核

    RK3399是一款由中国厂商瑞芯微推出的高性能处理器芯片,被广泛用于嵌入式系统开发。在进行应用程序开发之前,我们需要将Linux内核移植到RK3399上,以支持硬件的驱动和功能。本文将详细介绍如何将
    的头像 发表于 01-08 09:56 984次阅读

    开源项目维护者分论坛圆满举办

    开源维护者——一个被严重误解的群体,在一个开源项目中,开源维护者 往往拥有很高的权限,比如合并其他人的代码,又或者是无须经过他人review就可以提交,当这些人的心态炸裂,就会发生诸如删库跑路、恶意
    的头像 发表于 12-22 18:20 546次阅读
    开源项目<b class='flag-5'>维护者</b>分论坛圆满举办

    诚邀报名|来开源项目维护者论坛,为项目可持续发展贡献您的声音

    2023开放原子开发大会 . OPENATOM DEVELOPERS CONFERENCE 开源项目维护者论坛 2023.12.17 开源维护者是一个被严重误解的群体。在开源项目中,
    的头像 发表于 12-14 16:05 312次阅读

    获取Linux内核源码的方法

    (ELF1/ELF1S开发板及显示屏)Linux内核是操作系统中最核心的部分,它负责管理计算机硬件资源,并提供对应用程序和其他系统组件的访问接口,控制着计算机的内存、处理器、设备驱动程序和文件系统等
    的头像 发表于 12-13 09:49 605次阅读
    获取<b class='flag-5'>Linux</b><b class='flag-5'>内核</b>源码的方法

    Linux内核自解压过程分析

    uboot完成系统引导以后,执行环境变量bootm中的命令;即,将Linux内核调入内存中并调用do_bootm函数启动内核,跳转至kernel的起始位置。
    的头像 发表于 12-08 14:00 827次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>自解压过程分析

    Linux内核UDP收包为什么效率低

    现在很多人都在诟病Linux内核协议栈收包效率低,不管他们是真的懂还是一点都不懂只是听别人说的,反正就是在一味地怼Linux内核协议栈,他们的武器貌似只有DPDK。 但是,即便
    的头像 发表于 11-13 10:38 429次阅读
    <b class='flag-5'>Linux</b><b class='flag-5'>内核</b>UDP收包为什么效率低

    如何优化Linux内核UDP收包效率低

    很多人都在诟病Linux内核协议栈收包效率低,不管他们是真的懂还是一点都不懂只是听别人说的,反正就是在一味地怼Linux内核协议栈,他们的武器貌似只有DPDK。 但是,
    的头像 发表于 11-10 10:51 535次阅读
    如何优化<b class='flag-5'>Linux</b><b class='flag-5'>内核</b>UDP收包效率低