ARM64的多核启动流程分析~

嵌入式资讯精选 2022-02-11 11:35

工作中遇到的多核 ARM CPU 越来越多,总结分享一些多核启动的知识,希望能帮助更多小伙伴。

在 ARM64 架构下如果想要启动多核,有 spin-table 和 psci 两种方式,下面针对这两种启动流程进行分析。

代码版本

  • boot-wrapper-aarch64 version : 28932c41e14d730b8b9a7310071384178611fb32

  • linux v5.14

多核 CPU 的启动方式

嵌入式系统的启动的基本流程是先运行 bootloader ,然后由 bootloader 引导启动 kernel,这里无论启动的是 rt-thread 或者是 linux 原理都是一样的。

上电后所有的 CPU 都会从 bootrom 里面开始执行代码,为了防止并发造成的一些问题,需要将除了 primary cpu 以外的 cpu 拦截下来,这样才能保证启动的顺序是可控的。

spin-table 启动方法

在启动的过程中,bootloader 中有一道栅栏,它拦住了除了 cpu0 外的其他 cpucpu0 直接往下运行,进行设备初始化以及运行 Kernel。其他 cpu0 则在栅栏外进入睡眠状态。

cpu0 在初始化 smp 的时候,会在 cpu-release-addr 里面填入一个地址并唤醒其他 cpu。这时睡眠的 cpu 接受到信号,醒来的时候会先检查 cpu-release-addr 这个地址里面的数据是不是有效。如果该地址是有效的(非 0 ),意味着自己需要真正开始启动了,接下来他会跳转到。

下面我们看看 arm64 里面的实现,在 arch/arm64/boot/dts/xxx.dts 中有如下描述:

1cpu@0 {
2    device_type = "cpu";
3    compatible = "arm,armv8";
4    reg = <0x0 0x0="">;
5    enable-method = "spin-table"/* 选择使用 spin-table 方式启动  */
6    cpu-release-addr = <0x0 0x8000fff8="">;
7};


在 arch/arm64/kernel/smp_spin_table.c 中处理了向其他 cpu 发送信号的方法:

1、先是获取 release_addr 的虚拟地址

2、向该地址写入从 cpu 的入口地址

3、通过 sev() 指令唤醒其他 cpu


 1static int smp_spin_table_cpu_prepare(unsigned int cpu)
2
{
3    __le64 __iomem *release_addr;
4    phys_addr_t pa_holding_pen = __pa_symbol(function_nocfi(secondary_holding_pen));
5
6    if (!cpu_release_addr[cpu])
7        return -ENODEV;
8
9    /*
10     * The cpu-release-addr may or may not be inside the linear mapping.
11     * As ioremap_cache will either give us a new mapping or reuse the
12     * existing linear mapping, we can use it to cover both cases. In
13     * either case the memory will be MT_NORMAL.
14     */

15    release_addr = ioremap_cache(cpu_release_addr[cpu],
16                     sizeof(*release_addr));
17    if (!release_addr)
18        return -ENOMEM;
19
20    /*
21     * We write the release address as LE regardless of the native
22     * endianness of the kernel. Therefore, any boot-loaders that
23     * read this address need to convert this address to the
24     * boot-loader's endianness before jumping. This is mandated by
25     * the boot protocol.
26     */

27    writeq_relaxed(pa_holding_pen, release_addr);
28    dcache_clean_inval_poc((__force unsigned long)release_addr,
29                (__force unsigned long)release_addr +
30                    sizeof(*release_addr));
31
32    /*
33     * Send an event to wake up the secondary CPU.
34     */

35    sev();
36
37    iounmap(release_addr);
38
39    return 0;
40}


Bootloader 部分以 boot-wrapper-aarch64 中的代码做示例,非主 CPU 会轮询检查 mbox(其地址等同cpu-release-addr)中的值,当其值为 0 的时候继续睡眠,否则就跳转到内核执行,代码如下所示:

 1/**
2 * Wait for an address to appear in mbox, and jump to it.
3 *
4 * @mbox: location to watch
5 * @invalid: value of an invalid address, 0 or -1 depending on the boot method
6 * @is_entry: when true, pass boot parameters to the kernel, instead of 0
7 */

8void __noreturn spin(unsigned long *mbox, unsigned long invalid, int is_entry)
9
{
10    unsigned long addr = invalid;
11
12    while (addr == invalid) {
13        wfe();
14        addr = *mbox;
15    }
16
17    if (is_entry)
18#ifdef KERNEL_32
19        jump_kernel(addr, 0, ~0, (unsigned long)&dtb, 0);
20#else
21        jump_kernel(addr, (unsigned long)&dtb, 000);
22#endif
23
24    jump_kernel(addr, 0000);
25
26    unreachable();
27}
28
29/**
30 * Primary CPU finishes platform initialisation and jumps to the kernel.
31 * Secondaries are parked, waiting for their mbox to contain a valid address.
32 *
33 * @cpu: logical CPU number
34 * @mbox: location to watch
35 * @invalid: value of an invalid address, 0 or -1 depending on the boot method
36 */

37void __noreturn first_spin(unsigned int cpu, unsigned long *mbox,
38               unsigned long invalid)

39
{
40    if (cpu == 0) {
41        init_platform();
42
43        *mbox = (unsigned long)&entrypoint;
44        sevl();
45        spin(mbox, invalid, 1);
46    } else {
47        *mbox = invalid;
48        spin(mbox, invalid, 0);
49    }
50
51    unreachable();
52}

PSCI 启动方法

另外一种 enable-method 就是 PSCI,依旧先从 kernel 开始分析。先看 arch/arm64/boot/dts/mediatek/mt8173.dtsi 文件,里面 cpu 节点选择了PSCI 的方法:

1cpu0: cpu@0 {
2    compatible = "arm,cortex-a53";
3    device_type = "cpu";
4    enable-method = "psci";    /* 启动方式选择 PSCI */
5    operating-points-v2 = <&cpu_opp_table>;
6    reg = <0x0>;
7    cpu-idle-states = <&CPU_SLEEP_0>;
8};


并且有一个 PSCI 的节点:

1psci {
2    compatible = "arm,psci-1.0""arm,psci-0.2""arm,psci";
3    method = "smc";
4    cpu_suspend   = <0x84000001>;
5    cpu_off          = <0x84000002>;
6    cpu_on          = <0x84000003>;
7};


在 PSCI 中的节点详细说明请参考文档:kernel/Documentation/devicetree/bindings/arm/psci.txt。在此仅说一下 method 字段。该字段有两个可选值:smc 和 hvc。表示调用 PSCI 功能使用什么指令。smc、hvc、svc 这些指令都是由低运行级别向更高级别请求服务的指令。

和系统调用一样。调用了该指令,cpu 会进入异常切入更高的权限。异常处理程序根据下面传上来的参数决定给予什么服务,smc 陷入 EL3,hvc 陷入 EL2,svc 陷入EL1。在 ARMv8 里面,EL3 总是是 secure 状态,EL2 是虚拟机管态,EL1 是普通的系统态。

接下来可以看看 arch/arm64/kernel/psci.c 里面的代码,psci_ops.cpu_on 最终调用 smc call:

 1static int cpu_psci_cpu_boot(unsigned int cpu)
2
{
3    phys_addr_t pa_secondary_entry = __pa_symbol(function_nocfi(secondary_entry));
4    int err = psci_ops.cpu_on(cpu_logical_map(cpu), pa_secondary_entry);
5    if (err)
6        pr_err("failed to boot CPU%d (%d)\n", cpu, err);
7
8    return err;
9}
10
11static unsigned long __invoke_psci_fn_smc(unsigned long function_id,
12            unsigned long arg0, unsigned long arg1,
13            unsigned long arg2)
14{
15    struct arm_smccc_res res;
16
17    arm_smccc_smc(function_id, arg0, arg1, arg2, 0000, &res);
18    return res.a0;
19}


Bootloader 以 boot-wrapper-aarch64 作分析,看 psci.c 里的 psci_call 实现函数,通过 fid 与 PSCI_CPU_OFF 和 PSCI_CPU_ON 相比,找出需要执行的动作:

 1long psci_call(unsigned long fid, unsigned long arg1, unsigned long arg2)
2
{
3    switch (fid) {
4    case PSCI_CPU_OFF:
5        return psci_cpu_off();
6
7    case PSCI_CPU_ON_64:
8        return psci_cpu_on(arg1, arg2);
9
10    default:
11        return PSCI_RET_NOT_SUPPORTED;
12    }
13}


当然 boot-wrapper-aarch64 里也需要同样的定义:

1#define PSCI_CPU_OFF        0x84000002
2#define PSCI_CPU_ON_32      0x84000003
3#define PSCI_CPU_ON_64      0xc4000003


boot-wrapper-aarch64 按照和 kernel 约定的好参数列表,为目标 cpu 设置好跳转地址,然后返回到 kernel  执行,下面给出关键代码说明:

 1static int psci_cpu_on(unsigned long target_mpidr, unsigned long address)
2
{
3    int ret;
4    unsigned int cpu = find_logical_id(target_mpidr);
5    unsigned int this_cpu = this_cpu_logical_id();
6
7    if (cpu == MPIDR_INVALID)
8        return PSCI_RET_INVALID_PARAMETERS;
9
10    bakery_lock(branch_table_lock, this_cpu);
11    ret = psci_store_address(cpu, address);   /* 写入启动地址  */
12    bakery_unlock(branch_table_lock, this_cpu);
13
14    return ret;
15}

总结

目前比较主流的多核启动方式是 PSCI,一般正式的产品都有 ATF,通过 PSCI 可以实现 CPU 的开启关闭以及挂起等操作。在实际的移植工作过程中,如果有带有 ATF 的 bootloader 那多核移植就相对容易很多,如果没有的话,也可以采用 spin_table 的方式来启动多核。


1.有哪些芯片不容易被国产化?

2.用IAR EWARM如何开发航顺HK32F030M微处理器?

3.用这种高效实现数学函数的方式,单片机能运行如飞!

4.嵌入式系统从编程智力迈入学习智力,要关注深度学习!

5.10分钟教你在MDK中部署LVGL

6.STM32L4系列MCU的五种振荡器和使用说明

免责声明:本文系网络转载,版权归原作者所有。如涉及作品版权问题,请与我们联系,我们将根据您提供的版权证明材料确认版权并支付稿酬或者删除内容。


嵌入式资讯精选 掌握最鲜资讯,尽领行业新风
评论
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 100浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 33浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 82浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 80浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 37浏览
  • 1月7日-10日,2025年国际消费电子产品展览会(CES 2025)盛大举行,广和通发布Fibocom AI Stack,赋智千行百业端侧应用。Fibocom AI Stack提供集高性能模组、AI工具链、高性能推理引擎、海量模型、支持与服务一体化的端侧AI解决方案,帮助智能设备快速实现AI能力商用。为适应不同端侧场景的应用,AI Stack具备海量端侧AI模型及行业端侧模型,基于不同等级算力的芯片平台或模组,Fibocom AI Stack可将TensorFlow、PyTorch、ONNX、
    物吾悟小通 2025-01-08 18:17 38浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 150浏览
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 51浏览
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 51浏览
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 39浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 94浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦