巅峰对决：io_uring vs epoll 性能与架构对比

在 Linux 高性能网络编程领域，epoll 统治了近 20 年。然而，io_uring 的横空出世打破了这一局面。本文将从原理、性能和适用场景三个维度，深度对比这两代 I/O 神器。

1. 架构模型对比

特性	epoll	io_uring
模型	Reactor (就绪通知)	Proactor (异步完成)
工作流	1. 等待 fd 就绪 2. 发起 read/write 系统调用	1. 提交 read/write 请求 2. 等待完成通知
系统调用	频繁 (`epoll_wait`, `read`, `write`)	极少 (批处理 `io_uring_enter` 或 0 syscall)
数据拷贝	需要 (内核 -> 用户 buffer)	零拷贝 (支持 `IORING_OP_SPLICE` 等)
磁盘 I/O	不支持 (普通文件总是就绪)	完美支持 (真正的异步磁盘 I/O)

这是 epoll 最大的痛点。在高并发场景下，每秒百万级的请求意味着百万级的 read/write 系统调用。每次系统调用都涉及上下文切换（Context Switch）和 CPU 模式切换，开销不容小觑。

io_uring 通过 SQ/CQ 环形队列 和 批处理 解决了这个问题。在 SQPOLL 模式下，用户态甚至可以做到 0 系统调用 发送 I/O 请求。

epoll 模式下，数据通常需要从网卡 -> 内核 socket buffer -> 用户 buffer。 io_uring 支持注册缓冲区 (IORING_REGISTER_BUFFERS)，允许内核直接锁定用户态内存，减少内核内部的映射开销。

现代 CPU 为了修复推测执行漏洞，增加了系统调用的开销。这对依赖频繁系统调用的 epoll 打击比 io_uring 更大。

epoll 是一把锋利的瑞士军刀，轻便、通用，足以应付绝大多数场景。 io_uring 则是一台工业级挖掘机，为了吞吐量和效率而生，虽然驾驶它需要更高的技巧（更复杂的内存管理和异步逻辑），但在处理大规模 I/O 时，它的威力是碾压级的。