occupancy 标签归档 | 土法炼钢兴趣小组的算法知识备份

occupancy 标签归档

共 2 篇文章 · 返回首页

【GPU 算子工程】GPU 执行模型：SM、warp、线程层次与 occupancy

2026-06-27 | gpu · architecture | #cuda #gpu #sm #warp #simt #occupancy #thread-hierarchy #divergence

讲清 grid/block/warp 如何映射到 SM，SIMT 执行与 32 线程 warp 的本质，分支发散为何昂贵（实测 1.7 倍），以及 occupancy 的含义。建立一切 GPU 性能优化的硬件直觉。

【GPU 算子工程】Occupancy 与延迟隐藏：寄存器、shared memory 的取舍

2026-06-28 | gpu · architecture | #cuda #occupancy #latency-hiding #registers #shared-memory #register-spilling #launch-bounds

occupancy 是 SM 驻留 warp 与上限之比，由寄存器、shared memory、block 限制决定。实测访存密集 kernel 在约 33% occupancy 就饱和带宽，更高 occupancy 无益，并解释寄存器溢出为何让高 occupancy 反而变慢。