【GPU 算子工程】调试与数值正确性:compute-sanitizer 与对齐测试
GPU kernel 的 bug 分两类:内存/竞态错误和数值错误。讲 compute-sanitizer 查越界与 race、对参考实现做容差对齐(实测 FlashAttention 误差 4e-7)、浮点非结合性带来的不可复现,以及常见同步陷阱。
发布来自土法炼钢兴趣小组的知识、笔记、进展和应用。主题包括数据结构和算法、编程语言、网络安全、密码学等。
共 1 篇文章 · 返回首页
GPU kernel 的 bug 分两类:内存/竞态错误和数值错误。讲 compute-sanitizer 查越界与 race、对参考实现做容差对齐(实测 FlashAttention 误差 4e-7)、浮点非结合性带来的不可复现,以及常见同步陷阱。