土法炼钢兴趣小组的算法知识备份

【操作系统百科】OS 的下一个十年

文章导航

分类入口
os
标签入口
#os-future#ai-workload#cxl#kernel-bypass#sched-ext

目录

110 篇走完——最后一个问题:OS 接下来要解决什么?

一、先看图

flowchart TD
    TREND[趋势] --> AI[AI workload<br/>GPU/TPU/NPU]
    TREND --> HETERO[异构计算<br/>CPU+GPU+FPGA+DPU]
    TREND --> MEM[内存革命<br/>CXL/PMem]
    TREND --> BYPASS[内核旁路<br/>DPDK/SPDK/io_uring]
    TREND --> SAFE[安全<br/>机密计算/Rust]

    classDef trend fill:#a371f722,stroke:#a371f7,color:#adbac7;
    class TREND,AI,HETERO,MEM,BYPASS,SAFE trend

二、AI workload 对 OS 的冲击

2.1 调度

传统调度器为 CPU 密集型设计。AI 训练:

2.2 内存

大模型参数 → 数百 GB → 需要 CXL 内存池、GPU 内存管理。

2.3 I/O

训练数据加载 → io_uring + 直接 I/O → 减少 OS 开销。

三、异构计算

CPU + GPU + DPU + FPGA + NPU

每种加速器有自己的调度、内存管理、I/O 栈。

OS 的角色:

四、内核旁路的未来

技术 旁路什么
DPDK 网络栈
SPDK 存储栈
io_uring 系统调用开销
GPU direct CPU 参与
RDMA 内核网络栈

趋势:OS 从数据路径退出 → 只管控制路径。

五、sched_ext + ML

SEC("struct_ops/enqueue")
void BPF_PROG(ml_enqueue, struct task_struct *p, u64 enq_flags)
{
    // 用 ML 模型预测最佳 CPU
    int target_cpu = ml_predict(p);
    scx_bpf_dispatch(p, target_cpu, SCX_SLICE_DFL, enq_flags);
}

BPF 可编程调度器 → 可以接入 ML 模型 → 数据驱动的调度决策。

六、OS 与 Runtime 的重新分工

传统:    App → libc → syscall → 内核
未来:    App → Runtime(Wasm/eBPF/GPU) → 少量 syscall → 内核

OS 退化为”硬件抽象 + 安全隔离 + 资源分配”的最小层。

七、安全的长期演化

方向 说明
Rust 内核 编译时消除内存安全 bug
机密计算 不信任 hypervisor
形式化验证 seL4 风格的证明
微内核回归 减小 TCB

八、CXL 内存革命

本地 DRAM → CXL 近端 → CXL 池化 → 持久内存

OS 需要:

九、给读者的下一步

方向 推荐阅读
内核源码 kernel.org + LWN.net
学术前沿 OSDI / SOSP / EuroSys / ASPLOS
实践 写一个内核模块 / BPF 程序
系统设计 本博客存储/分布式/网络百科
Rust 写一个 Rust 内核驱动

十、小结

这是【操作系统百科】系列的最后一篇。110 篇文章覆盖了从进程到调度、从内存到文件系统、从中断到安全、从内核到前沿。希望这个系列能帮助你建立系统化的 OS 工程视角。


参考文献

工具


上一篇可拆分 OS


【操作系统百科】系列完结。感谢阅读。

同主题继续阅读

把当前热点继续串成多页阅读,而不是停在单篇消费。

2026-07-09 · os

【操作系统百科】可拆分 OS

CXL/RDMA 会把 OS 拆成什么形状?LegoOS 分离式内核、CXL 2.0/3.0 内存池、Far Memory、远程页面错误、failover 语义——本文讲硬件解耦对 OS 的冲击。

2026-04-30 · os

【操作系统百科】NUMA 内存

多路服务器里内存不再平等——本地访问和远程访问延迟差 2-3 倍。本文讲 NUMA 拓扑、mempolicy、AutoNUMA、NUMA balancing、CXL 带来的分级内存层次,以及 NUMA 感知的生产调优。

2026-04-27 · os

【操作系统百科】内存回收

Linux 内存回收是 VM 最复杂的子系统之一。本文讲 active/inactive LRU、kswapd 与 direct reclaim、watermark 三线、swappiness 的真实含义、MGLRU 改造、memcg 回收与 PSI。

2026-04-28 · os

【操作系统百科】交换

swap 还值得开吗?本文讲 swap area 基础、swap cache、zram 压缩内存、zswap 前端压缩池、swappiness 的真实含义、容器里的 swap 策略,以及为什么现代 Android 全靠 zram 不靠磁盘。


By .