启动是 OS 最复杂的路径之一——从固件初始化硬件,到 bootloader 加载内核,到内核初始化子系统,到 PID 1 接管用户空间。
一、先看图
flowchart TD
POWER[加电 / Reset] --> FW[固件<br/>BIOS / UEFI]
FW --> BL[Bootloader<br/>GRUB / systemd-boot]
BL --> DECOMP[内核解压<br/>startup_64]
DECOMP --> START[start_kernel<br/>初始化子系统]
START --> REST[rest_init<br/>创建 PID 1 和 PID 2]
REST --> INIT[PID 1<br/>systemd / init]
classDef fw fill:#f0883e22,stroke:#f0883e,color:#adbac7;
classDef kern fill:#388bfd22,stroke:#388bfd,color:#adbac7;
classDef user fill:#3fb95022,stroke:#3fb950,color:#adbac7;
class POWER,FW,BL fw
class DECOMP,START,REST kern
class INIT user
二、固件阶段
2.1 BIOS(传统)
POST → 硬件初始化 → 从 MBR 加载 bootloader(512 字节)→ 实模式。
2.2 UEFI(现代)
初始化硬件 → 读 ESP(EFI System Partition)→ 加载 EFI 应用(bootloader 或直接加载内核 EFI stub)。
UEFI 优势:
- GPT 分区支持
- Secure Boot(验证签名)
- 64 位
- 网络启动
三、Bootloader
3.1 GRUB 2
menuentry "Linux" {
linux /vmlinuz root=/dev/sda2
initrd /initramfs.img
}
加载内核映像 + initramfs → 传递命令行参数 → 跳转到内核入口。
3.2 systemd-boot
轻量级 UEFI bootloader → 直接从 ESP 加载。
3.3 EFI stub
内核自带 EFI stub → UEFI 可以直接加载 vmlinuz 作为 EFI 应用 → 无需 GRUB。
四、内核早期
4.1 解压
内核映像(bzImage)自解压 → 进入
startup_64(x86)。
4.2 start_kernel
// init/main.c
asmlinkage __visible void __init start_kernel(void)
{
// 初始化顺序(简化):
setup_arch(); // 架构相关
mm_init(); // 内存管理
sched_init(); // 调度器
init_IRQ(); // 中断
time_init(); // 时钟
console_init(); // 控制台
// ... 更多子系统
rest_init(); // 创建 PID 1
}4.3 early printk
earlyprintk=serial →
在正式控制台初始化前就能看到输出 → 调试启动问题。
五、rest_init → PID 1
static noinline void __ref rest_init(void)
{
pid = kernel_thread(kernel_init, NULL, CLONE_FS); // PID 1
pid = kernel_thread(kthreadd, NULL, CLONE_FS); // PID 2
// PID 0 变成 idle 线程
cpu_startup_entry(CPUHP_ONLINE);
}kernel_init() 最终 exec 用户态的
/sbin/init(或 systemd)。
六、Measured Boot
UEFI + TPM:
- 固件度量每个启动组件 → hash 写入 TPM PCR
- bootloader 度量内核和 initramfs
- 内核度量模块
IMA(Integrity Measurement Architecture)在内核继续度量。
七、ARM 启动
flowchart LR
BL1[BL1<br/>ROM code] --> BL2[BL2<br/>Trusted firmware]
BL2 --> BL31[BL31<br/>EL3 runtime]
BL31 --> BL33[BL33<br/>U-Boot / UEFI]
BL33 --> KERNEL[Linux kernel<br/>Image]
ARM Trusted Firmware (ATF) → U-Boot → Linux。
设备树(DTB)描述硬件 → bootloader 传给内核。
八、启动时间优化
| 手段 | 效果 |
|---|---|
| EFI stub 直接启动 | 省 GRUB 加载时间 |
| 压缩算法选择 | LZ4 比 gzip 解压快 |
| 裁剪 initramfs | 减少加载和解包时间 |
| systemd 并行启动 | 减少 PID 1 后的时间 |
quiet 参数 |
减少控制台输出 |
九、观察
# 启动时间分析
systemd-analyze
systemd-analyze blame
systemd-analyze critical-chain
# 内核启动日志
dmesg | head -50
# UEFI 启动项
efibootmgr -v十、小结
- 启动:固件 → bootloader → 内核解压 → start_kernel → PID 1
- UEFI + Secure Boot 是现代标准
- EFI stub 可跳过 GRUB
- Measured Boot + TPM 提供启动完整性
- ARM 用 ATF + U-Boot 启动
参考文献
init/main.c(start_kernel)arch/x86/boot/(x86 启动代码)Documentation/admin-guide/efi-stub.rst- Kroah-Hartman, “The Linux kernel boot process.”
工具
systemd-analyzeefibootmgrdmesgbootchart
同主题继续阅读
把当前热点继续串成多页阅读,而不是停在单篇消费。
【操作系统百科】内存回收
Linux 内存回收是 VM 最复杂的子系统之一。本文讲 active/inactive LRU、kswapd 与 direct reclaim、watermark 三线、swappiness 的真实含义、MGLRU 改造、memcg 回收与 PSI。
【操作系统百科】交换
swap 还值得开吗?本文讲 swap area 基础、swap cache、zram 压缩内存、zswap 前端压缩池、swappiness 的真实含义、容器里的 swap 策略,以及为什么现代 Android 全靠 zram 不靠磁盘。
【操作系统百科】Slab/SLUB 分配器
buddy 只管页粒度(4K+),内核大多数对象只有几十到几百字节。slab/SLUB 在 buddy 之上做对象级缓存。本文讲 slab 历史、SLUB 接手、SLOB 退场、kmem_cache、per-CPU cache、KASAN 集成。
【操作系统百科】用户态分配器
glibc malloc、tcmalloc、jemalloc、mimalloc 各有哲学。本文讲 arena、thread cache、size class、madvise 返还策略、碎片与 RSS 膨胀、如何根据负载选分配器。