Windows NT 内核和 Linux 内核解决同样的问题,但做了非常不同的设计选择。
一、先看图
flowchart TD
NT[NT 内核] --> EXEC[Executive<br/>对象管理/IO/内存]
NT --> KRNL[Kernel<br/>调度/中断/同步]
NT --> HAL[HAL<br/>硬件抽象]
LINUX_K[Linux 内核] --> SUBSYS[子系统<br/>VFS/MM/sched/net]
LINUX_K --> ARCH[arch/<br/>架构相关]
classDef nt fill:#388bfd22,stroke:#388bfd,color:#adbac7;
classDef linux fill:#3fb95022,stroke:#3fb950,color:#adbac7;
class NT,EXEC,KRNL,HAL nt
class LINUX_K,SUBSYS,ARCH linux
二、架构对比
| 方面 | Windows NT | Linux |
|---|---|---|
| 设计 | 混合内核(微内核风格) | 宏内核 |
| 对象模型 | 统一 Object Manager | 无 |
| I/O 模型 | IRP(I/O Request Packet) | VFS + file_operations |
| 进程模型 | 进程 + 线程分离 | task_struct 统一 |
| 注册表 | Registry(集中配置) | 文件 + sysctl |
| 驱动框架 | WDM/WDF | 各子系统独立 |
三、Object Manager
Windows 内核中一切皆对象:
- 进程、线程、文件、事件、互斥体、注册表键
- 每个对象有引用计数、安全描述符、名称
- 统一的 handle 机制
Linux:fd 是文件抽象 → 但进程、信号等不是 fd。
四、I/O 模型(IRP)
应用 → I/O Manager → 构造 IRP → 驱动栈 → 硬件
↑
过滤驱动(filter driver)
IRP 是异步的 → 天然支持异步 I/O。
Linux:同步 read/write → 异步需要 aio/io_uring。
五、IOCP(I/O Completion Port)
HANDLE iocp = CreateIoCompletionPort(INVALID_HANDLE_VALUE, NULL, 0, 0);
// 关联文件句柄
CreateIoCompletionPort(file_handle, iocp, key, 0);
// 异步操作完成 → 通知 IOCP
GetQueuedCompletionStatus(iocp, &bytes, &key, &overlapped, INFINITE);- 一个 IOCP → 多个线程 → 自动负载均衡
- Linux 的 epoll 是就绪通知 → IOCP 是完成通知
| 方面 | IOCP | epoll | io_uring |
|---|---|---|---|
| 模型 | 完成通知 | 就绪通知 | 完成通知 |
| 线程模型 | 内置线程池 | 用户管理 | 用户管理 |
六、Job Object vs cgroup
HANDLE job = CreateJobObject(NULL, "MyJob");
// 设置资源限制
SetInformationJobObject(job, JobObjectBasicLimitInformation, &limits, ...);
// 关联进程
AssignProcessToJobObject(job, process);Job Object ≈ cgroup → 但 cgroup 功能更丰富。
七、Registry vs 文件配置
Windows:集中的层次化数据库 → 原子更新 → 但容易损坏。
Linux:文本文件 → 简单 → 但分散。
八、WSL2 的选择
微软选择在 Hyper-V 虚拟机中运行真正的 Linux 内核:
Windows → Hyper-V → 轻量级 VM → Linux 内核 → Linux 用户态
WSL1 尝试在 NT 上翻译 Linux syscall → 兼容性问题太多 → WSL2 改用真 Linux 内核。
九、安全模型
| 方面 | Windows | Linux |
|---|---|---|
| 访问控制 | ACL(精细) | 权限位 + ACL(可选) |
| 强制完整性 | MIC(Low/Medium/High) | SELinux/AppArmor |
| 沙箱 | AppContainer | seccomp + namespace |
| 代码签名 | 驱动签名强制 | 模块签名(可选) |
十、小结
- NT 用 Object Manager 统一管理内核对象
- IRP + IOCP 天然异步 → Linux 靠 io_uring 追赶
- Job Object 类似 cgroup
- Registry 集中配置 → Linux 用文件
- WSL2 证明了 Linux 内核的不可替代性
参考文献
- Russinovich et al., “Windows Internals.” 7th edition
- Yosifovich et al., “Windows Kernel Programming.” 2019
- Microsoft, “WSL2 Architecture.” docs.microsoft.com
工具
- Process Monitor / Process Explorer
- WinDbg
- Performance Monitor
上一篇:FreeBSD/OpenBSD 下一篇:实时 OS 巡礼
同主题继续阅读
把当前热点继续串成多页阅读,而不是停在单篇消费。
【操作系统百科】POSIX 与 Linux/BSD/Windows 的偏离
POSIX 标准定义了 \"一个像 Unix 的 OS 应该长什么样\",但没有哪个真实 OS 完全等于它。本文对照 POSIX 基准,列出 Linux、FreeBSD、macOS、Windows 的扩展与偏离:Linux-only 的接口(epoll、io_uring、eventfd、prctl)、BSD-only(kqueue、pf)、NT 的异步模型、符号链接/路径语义差异、signal 语义的方言、fork 的地位演变。
【操作系统百科】内存回收
Linux 内存回收是 VM 最复杂的子系统之一。本文讲 active/inactive LRU、kswapd 与 direct reclaim、watermark 三线、swappiness 的真实含义、MGLRU 改造、memcg 回收与 PSI。
【操作系统百科】交换
swap 还值得开吗?本文讲 swap area 基础、swap cache、zram 压缩内存、zswap 前端压缩池、swappiness 的真实含义、容器里的 swap 策略,以及为什么现代 Android 全靠 zram 不靠磁盘。
【操作系统百科】Slab/SLUB 分配器
buddy 只管页粒度(4K+),内核大多数对象只有几十到几百字节。slab/SLUB 在 buddy 之上做对象级缓存。本文讲 slab 历史、SLUB 接手、SLOB 退场、kmem_cache、per-CPU cache、KASAN 集成。