土法炼钢兴趣小组的算法知识备份

【操作系统百科】用户态分配器

文章导航

分类入口
os
标签入口
#malloc#tcmalloc#jemalloc#mimalloc#arena

目录

内核提供 mmap/brk,用户态分配器在上面管理堆:切小块、复用释放块、还页给内核。glibc ptmalloc2、Google tcmalloc、Facebook jemalloc、Microsoft mimalloc 四家各有侧重。

一、先看图

flowchart TD
    APP[malloc 请求] --> ALLOC[分配器<br/>thread cache]
    ALLOC -->|小块 < 256K| TCACHE[thread-local cache<br/>→ arena → sbrk/mmap]
    ALLOC -->|大块 ≥ 256K| MMAP[直接 mmap]
    FREE[free 释放] --> BACK[归还 thread cache]
    BACK -->|积累够了| MADV[madvise DONTNEED/FREE<br/>返还 OS]
    classDef fast fill:#3fb95022,stroke:#3fb950,color:#adbac7;
    classDef slow fill:#f0883e22,stroke:#f0883e,color:#adbac7;
    class TCACHE,BACK fast
    class MMAP,MADV slow

二、glibc ptmalloc2

2.1 核心概念

2.2 大小分界

2.3 弱点

2.4 调参

mallopt(M_ARENA_MAX, 4);           // 限制 arena 数
mallopt(M_MMAP_THRESHOLD, 65536);  // 降 mmap 阈值
malloc_trim(0);                     // 手动缩 heap

三、tcmalloc(Google)

3.1 哲学

per-thread cache 消除锁争抢。三层:

  1. thread cache:每线程按 size class 的空闲链表
  2. central cache:全局按 size class 的 span 管理
  3. page heap:按页管理底层

3.2 size class

把所有大小归为 ~88 个 class(8, 16, 32, 48, 64, … 262144)。减少碎片。

3.3 优势

3.4 使用

LD_PRELOAD=/usr/lib/libtcmalloc.so ./app
# 或 链接时 -ltcmalloc

环境变量调优:TCMALLOC_MAX_TOTAL_THREAD_CACHE_BYTES

四、jemalloc(Facebook/FreeBSD)

4.1 哲学

多 arena + 细粒度 size class + 积极返还。FreeBSD 默认分配器。

4.2 结构

4.3 碎片治理

4.4 使用

LD_PRELOAD=/usr/lib/libjemalloc.so ./app

# mallctl 接口
export MALLOC_CONF="background_thread:true,dirty_decay_ms:1000"

Redis、Rust(默认分配器)都用 jemalloc。

五、mimalloc(Microsoft)

5.1 哲学

简单 + 极致性能。per-thread 的 page 管理(不是 arena)。

5.2 特点

5.3 性能

在多线程小对象工作负载下经常比 tcmalloc/jemalloc 快 5-15%。

六、MADV_FREE vs MADV_DONTNEED

分配器返还内存给 OS 的两种方式:

jemalloc 默认用 MADV_FREE(lazy 返还,减少 fault)。tcmalloc 也支持。

glibc 的 malloc_trim 用 MADV_DONTNEED。

七、碎片与 RSS 膨胀

7.1 症状

进程 RSS 远大于”活跃堆大小”。free 了但 RSS 不降。

7.2 原因

7.3 诊断

# jemalloc
MALLOC_CONF="stats_print:true" ./app

# tcmalloc
# pprof 或 MallocExtension::GetStats

# 通用
pmap -x $PID | tail -1   # total RSS
cat /proc/$PID/smaps_rollup

7.4 缓解

八、选择指南

场景 推荐
通用 Linux 服务 jemalloc(碎片控制 + 返还)
Google 生态 / Go runtime tcmalloc
高频小对象 mimalloc
嵌入式 / 最小依赖 glibc ptmalloc
Rust 默认 jemalloc(可换)
Redis jemalloc(官方推荐)
PostgreSQL glibc(内部有自己的 MemoryContext)

九、观察

# 当前使用哪个分配器
ldd ./app | grep -E 'malloc|jemalloc|tcmalloc'

# glibc malloc stats
MALLOC_STATS=1 ./app

# jemalloc 实时统计
MALLOC_CONF="stats_print:true"

# tcmalloc 页级统计
pprof --text ./app heap.prof

十、小结


至此子系列 E(内核内存分配器)完结,共 6 篇(41-46)。下一子系列 F:文件系统与 VFS(8 篇,47-54)将讲 VFS 四层抽象、路径解析、ext4 深入、btrfs/XFS、overlayfs、IO_uring 文件操作。


参考文献

工具


延伸阅读


上一篇内核内存调试 下一篇VFS 四层抽象

同主题继续阅读

把当前热点继续串成多页阅读,而不是停在单篇消费。

2026-04-06 · algorithms

内存分配器对决:jemalloc vs tcmalloc vs mimalloc

你的服务在线上跑了三天,RSS 从 2GB 涨到了 6GB,free 显示内存快爆了,但业务量没变。你重启'修好了',然后下周又涨回去。问题不在你的代码里——问题在 malloc 里。

2026-04-27 · os

【操作系统百科】内存回收

Linux 内存回收是 VM 最复杂的子系统之一。本文讲 active/inactive LRU、kswapd 与 direct reclaim、watermark 三线、swappiness 的真实含义、MGLRU 改造、memcg 回收与 PSI。

2026-04-28 · os

【操作系统百科】交换

swap 还值得开吗?本文讲 swap area 基础、swap cache、zram 压缩内存、zswap 前端压缩池、swappiness 的真实含义、容器里的 swap 策略,以及为什么现代 Android 全靠 zram 不靠磁盘。


By .