工作中遇到的多核 ARM CPU 越来越多,总结分享一些多核启动的知识,希望能帮助更多小伙伴。
在 ARM64 架构下如果想要启动多核,有 spin-table 和 psci 两种方式,下面针对这两种启动流程进行分析。
代码版本
- boot-wrapper-aarch64 version : 28932c41e14d730b8b9a7310071384178611fb32
- linux v5.14
多核 CPU 的启动方式
嵌入式系统的启动的基本流程是先运行 bootloader
,然后由 bootloader
引导启动 kernel,这里无论启动的是 rt-thread 或者是 linux 原理都是一样的。
上电后所有的 CPU
都会从 bootrom
里面开始执行代码,为了防止并发造成的一些问题,需要将除了 primary cpu
以外的 cpu
拦截下来,这样才能保证启动的顺序是可控的。
spin-table 启动方法
在启动的过程中,bootloader
中有一道栅栏,它拦住了除了 cpu0
外的其他 cpu
。cpu0
直接往下运行,进行设备初始化以及运行 Kernel
。其他 cpu0
则在栅栏外进入睡眠状态。
cpu0
在初始化 smp
的时候,会在 cpu-release-addr
里面填入一个地址并唤醒其他 cpu
。这时睡眠的 cpu
接收到信号,醒来的时候会先检查 cpu-release-addr
这个地址里面的数据是不是有效。如果该地址是有效的(非 0 ),意味着自己需要真正开始启动了,接下来他会跳转到。
下面我们看看 arm64
里面的实现,在 arch/arm64/boot/dts/xxx.dts
中有如下描述:
1cpu@0 {
2 device_type = "cpu";
3 compatible = "arm,armv8";
4 reg = < 0x0 0x0="" >;
5 enable-method = "spin-table"; /* 选择使用 spin-table 方式启动 */
6 cpu-release-addr = < 0x0 0x8000fff8="" >;
7};
在 arch/arm64/kernel/smp_spin_table.c
中处理了向其他 cpu 发送信号的方法:
1、先是获取 release_addr 的虚拟地址
2、向该地址写入从 cpu 的入口地址
3、通过 sev() 指令唤醒其他 cpu
1static int smp_spin_table_cpu_prepare(unsigned int cpu)
2{
3 __le64 __iomem *release_addr;
4 phys_addr_t pa_holding_pen = __pa_symbol(function_nocfi(secondary_holding_pen));
5
6 if (!cpu_release_addr[cpu])
7 return -ENODEV;
8
9 /*
10 * The cpu-release-addr may or may not be inside the linear mapping.
11 * As ioremap_cache will either give us a new mapping or reuse the
12 * existing linear mapping, we can use it to cover both cases. In
13 * either case the memory will be MT_NORMAL.
14 */
15 release_addr = ioremap_cache(cpu_release_addr[cpu],
16 sizeof(*release_addr));
17 if (!release_addr)
18 return -ENOMEM;
19
20 /*
21 * We write the release address as LE regardless of the native
22 * endianness of the kernel. Therefore, any boot-loaders that
23 * read this address need to convert this address to the
24 * boot-loader's endianness before jumping. This is mandated by
25 * the boot protocol.
26 */
27 writeq_relaxed(pa_holding_pen, release_addr);
28 dcache_clean_inval_poc((__force unsigned long)release_addr,
29 (__force unsigned long)release_addr +
30 sizeof(*release_addr));
31
32 /*
33 * Send an event to wake up the secondary CPU.
34 */
35 sev();
36
37 iounmap(release_addr);
38
39 return 0;
40}
Bootloader
部分以 boot-wrapper-aarch64
中的代码做示例,非主 CPU 会轮询检查 mbox(其地址等同cpu-release-addr)中的值,当其值为 0 的时候继续睡眠,否则就跳转到内核执行,代码如下所示:
1/**
2 * Wait for an address to appear in mbox, and jump to it.
3 *
4 * @mbox: location to watch
5 * @invalid: value of an invalid address, 0 or -1 depending on the boot method
6 * @is_entry: when true, pass boot parameters to the kernel, instead of 0
7 */
8void __noreturn spin(unsigned long *mbox, unsigned long invalid, int is_entry)
9{
10 unsigned long addr = invalid;
11
12 while (addr == invalid) {
13 wfe();
14 addr = *mbox;
15 }
16
17 if (is_entry)
18#ifdef KERNEL_32
19 jump_kernel(addr, 0, ~0, (unsigned long)&dtb, 0);
20#else
21 jump_kernel(addr, (unsigned long)&dtb, 0, 0, 0);
22#endif
23
24 jump_kernel(addr, 0, 0, 0, 0);
25
26 unreachable();
27}
28
29/**
30 * Primary CPU finishes platform initialisation and jumps to the kernel.
31 * Secondaries are parked, waiting for their mbox to contain a valid address.
32 *
33 * @cpu: logical CPU number
34 * @mbox: location to watch
35 * @invalid: value of an invalid address, 0 or -1 depending on the boot method
36 */
37void __noreturn first_spin(unsigned int cpu, unsigned long *mbox,
38 unsigned long invalid)
39{
40 if (cpu == 0) {
41 init_platform();
42
43 *mbox = (unsigned long)&entrypoint;
44 sevl();
45 spin(mbox, invalid, 1);
46 } else {
47 *mbox = invalid;
48 spin(mbox, invalid, 0);
49 }
50
51 unreachable();
52}