内核不可能编译进所有存储驱动——NVMe、RAID 控制器、LUKS 加密、LVM 的驱动从哪来?答案是 initramfs:一个临时的根文件系统,提供启动必需的模块和工具。
一、先看图
flowchart LR
BL[Bootloader] -->|加载| KERNEL[vmlinuz]
BL -->|加载| INITRD[initramfs.img<br/>cpio 归档]
KERNEL --> UNPACK[解包 initramfs<br/>到 rootfs]
UNPACK --> INIT_E[/init 脚本<br/>加载驱动/解密]
INIT_E --> MOUNT[mount 真正 rootfs]
MOUNT --> SWITCH[switch_root<br/>切换到真 root]
SWITCH --> PID1[PID 1<br/>systemd]
classDef early fill:#f0883e22,stroke:#f0883e,color:#adbac7;
classDef final fill:#3fb95022,stroke:#3fb950,color:#adbac7;
class BL,KERNEL,INITRD early
class UNPACK,INIT_E,MOUNT,SWITCH early
class PID1 final
二、为什么需要 initramfs
内核 vmlinuz 不能包含所有驱动 → root 文件系统可能在:
- NVMe(需要 nvme 驱动)
- RAID(需要 md 驱动)
- LUKS 加密(需要 dm-crypt + 密码输入)
- LVM(需要 device-mapper)
- 网络(iSCSI / NFS root)
initramfs 提供这些模块 + 必要的用户态工具。
三、格式
initramfs 是 cpio 归档(可能 gzip/xz/zstd 压缩):
# 查看内容
lsinitramfs /boot/initramfs-$(uname -r).img
# 手动解包
mkdir /tmp/initrd && cd /tmp/initrd
zcat /boot/initramfs-$(uname -r).img | cpio -idmv四、/init 脚本
initramfs 中的 /init(或 systemd):
- 加载必要的内核模块
- 检测并激活 RAID/LVM
- 解密 LUKS
- mount 真正的 root 文件系统
switch_root切换
五、dracut
Fedora/RHEL/SUSE 使用 dracut 生成 initramfs:
dracut --force /boot/initramfs-$(uname -r).img $(uname -r)5.1 模块化
dracut --list-modules
# base, bash, dm, lvm, luks, network, nfs, ...每个 dracut 模块提供特定功能的脚本和工具。
5.2 配置
# /etc/dracut.conf.d/custom.conf
add_dracutmodules+=" lvm dm "
compress="zstd"六、mkinitramfs / mkinitcpio
Debian 用 mkinitramfs,Arch 用
mkinitcpio——功能类似,生态不同。
七、Unified Kernel Image(UKI)
UKI = UEFI stub + 内核 + initramfs + 命令行 + 签名
一个文件 → UEFI 直接启动 → Secure Boot 签名覆盖全部。
# systemd-ukify 构建
ukify build \
--linux /boot/vmlinuz \
--initrd /boot/initrd.img \
--cmdline "root=/dev/sda2" \
--output /boot/efi/EFI/Linux/linux.efi八、switch_root
// util-linux: switch_root
mount(new_root, "/", NULL, MS_MOVE, NULL);
chroot(".");
chdir("/");
// exec real init
execv("/sbin/init", argv);关键:switch_root 删除 initramfs 中的所有文件 → 释放内存 → exec PID 1。
九、观察
# 当前 initramfs
ls -lh /boot/initramfs-$(uname -r).img
# 内容
lsinitramfs /boot/initramfs-$(uname -r).img | head -20
# 启动日志中的 initramfs 阶段
dmesg | grep -i "initramfs\|switch_root\|Trying to unpack"
# dracut 重新生成
dracut --force --verbose十、小结
- initramfs 是临时根文件系统 → 提供启动必需的驱动和工具
- cpio 归档格式 + 压缩
- dracut/mkinitramfs 生成
- switch_root 切换到真正 rootfs
- UKI 把内核+initramfs 打包为单个签名 EFI 应用
参考文献
Documentation/filesystems/ramfs-rootfs-initramfs.rstusr/gen_init_cpio.c(内核内置 initramfs 工具)- dracut documentation
- systemd-ukify(1)
工具
dracut/mkinitramfs/mkinitcpiolsinitramfs/lsinitrdukify
同主题继续阅读
把当前热点继续串成多页阅读,而不是停在单篇消费。
【操作系统百科】内存回收
Linux 内存回收是 VM 最复杂的子系统之一。本文讲 active/inactive LRU、kswapd 与 direct reclaim、watermark 三线、swappiness 的真实含义、MGLRU 改造、memcg 回收与 PSI。
【操作系统百科】交换
swap 还值得开吗?本文讲 swap area 基础、swap cache、zram 压缩内存、zswap 前端压缩池、swappiness 的真实含义、容器里的 swap 策略,以及为什么现代 Android 全靠 zram 不靠磁盘。
【操作系统百科】Slab/SLUB 分配器
buddy 只管页粒度(4K+),内核大多数对象只有几十到几百字节。slab/SLUB 在 buddy 之上做对象级缓存。本文讲 slab 历史、SLUB 接手、SLOB 退场、kmem_cache、per-CPU cache、KASAN 集成。
【操作系统百科】用户态分配器
glibc malloc、tcmalloc、jemalloc、mimalloc 各有哲学。本文讲 arena、thread cache、size class、madvise 返还策略、碎片与 RSS 膨胀、如何根据负载选分配器。