【量化交易】数据陷阱:幸存者偏差、复权、前视、未来函数
系统拆解量化回测里最常见的几类数据陷阱:幸存者偏差、前视偏差、未来函数、数据窥视、复权陷阱、停牌与流动性陷阱、时区与日历对齐。给出 Point-In-Time 财报库的最小可运行实现,演示前视回测与 PIT 回测之间的真实差距,并整理一份回测前自检清单。
发布来自土法炼钢兴趣小组的知识、笔记、进展和应用。主题包括数据结构和算法、编程语言、网络安全、密码学等。
共 3 篇文章 · 返回首页
系统拆解量化回测里最常见的几类数据陷阱:幸存者偏差、前视偏差、未来函数、数据窥视、复权陷阱、停牌与流动性陷阱、时区与日历对齐。给出 Point-In-Time 财报库的最小可运行实现,演示前视回测与 PIT 回测之间的真实差距,并整理一份回测前自检清单。
回测引擎只能保证「语法对」,但真正杀死策略的是「逻辑错、数据脏、推断不严」三件事。本文系统拆解前视偏差(lookahead bias)、过拟合(overfitting)、数据窥视(data snooping)三大陷阱,介绍 Bonferroni、BH-FDR、Family-Wise Error 的多重检验修正,给出 Deflated Sharpe 与概率 Sharpe(PSR)的可运行 Python 实现,配一份 30 条上线前自检清单。
从经典 Speculative Decoding 到 Medusa、EAGLE、Lookahead、MTP 与自推测——系统梳理让大模型"一次多吐几 token"的工程方法与引擎支持