量化交易是用数据、模型与工程把”投资判断”变成可重复执行系统的过程。这个系列面向策略研究员与工程师,从信号设计到订单成交的整条链路,讲清楚工程上的真实挑战与解决方案。
这个领域最值得关注的 5 个问题
这些问题能区分真正理解量化交易的人和只会背术语的人。本系列的目的就是回答它们:
为什么 99% 的量化策略都死在回测与实盘之间? → 不是逻辑问题,是数据、成本、过拟合的工程问题。详见第二部分(数据)、第五部分(回测)、第六部分(成本)。
成本(交易成本 + 延迟 + 冲击)的真实规模是多少,它如何支配你的策略选择? → 多数人只看 Sharpe,忘了总 PnL = alpha - cost。总成本永远是已知的损失。详见第四部分(成本)、第六部分(执行)。
如何区分”历史回测中的好”和”未来能跑的好”? → K-fold 在时序数据上为什么失效?Walk-Forward 怎么设?什么时候该用 Purged K-Fold?详见第五部分(回测)。
高频和低频策略在工程上的本质区别是什么,不只是延迟? → 低频关心”这个月赚没赚”,高频关心”100 微秒内能不能发完 100 笔单”。监控粒度、风控形式、运维体系完全不同。详见第六部分(执行)、第七部分(高频)。
为什么稳定性(不被打穿的概率)比 alpha(绝对收益)更难? → 黑天鹅随时来,系统设计、风控规则、应急响应、团队文化决定了你能活多久。详见第七部分(运维)。
核心视角
- 因子与信号:从经典因子(价值、动量、质量)到机器学习选股,再到深度学习时间序列的陷阱。
- 数据正确性:幸存者偏差、前视偏差、未来函数的工程防守;PIT 库、特征版本化、对账机制。
- 回测科学性:向量化与事件驱动的权衡;Purged K-Fold、Walk-Forward、数据窥视检验。
- 成本意识:交易成本模型、滑点、冲击,每一分都算。
- 执行工程:TWAP/VWAP/POV/IS 算法、智能订单路由、做市策略的库存管理。
- 生产可靠性:四套环境(研究、回测、模拟、实盘)的一致性;熔断、监控、合规报送。
适合谁看
- 量化研究员:要建立因子体系、回测流程、避免过拟合。
- 量化工程师:要搭建数据、回测、交易执行系统。
- 产品经理:想理解”为什么这个策略在回测中神,到了实盘就拉胯”。
- 对冲基金、自营团队:在多资产(A 股、美股、期货、加密)中快速迭代。
篇目依赖关系与阅读建议
地基(必读)
- 01 是全景,建立心智模型
- 02-04 是市场机制基础,后续执行、做市都要用
不同角色的推荐路径
完全入门(无基础,了解全貌)
01 → 02 → 03 → 05 → 09 → 19 → 22 → 27
因子策略研究(关心 alpha 有效性)
09 → 10 → 12 → 15 → 20 → 21
前置:05/06/07(数据正确性)
系统工程与基建(关心系统搭建)
05 → 07 → 19 → 23 → 27 → 28
配合:09(因子示例)、18(成本模型)
高频与做市(关心低延迟执行)
02 → 03 → 23 → 25 → 26
配合:18(成本模型)、27-28(风控体系)
加密与多资产
02 → 14 → 24 → 25
前置:18(成本模型)
目录
第一部分:导论与市场结构
- 量化交易全景:从信号到订单的工程链路
- 建立心智模型,理解为什么「能跑的系统」和「赚钱的系统」是两个东西
- 市场结构:交易所、做市商、暗池、ECN
- 你的订单真的去了交易所吗,还是被中介吃掉了
- 市场微结构:订单簿、价差、流动性、冲击
- 执行质量取决于对订单簿形状的理解深度
- 订单类型与执行语义:限价、市价、IOC、FOK、冰山
- IOC/FOK/Post-Only 不只是交易所选项,是执行策略的基础
第二部分:数据底盘
- 行情与基本面数据管线:tick、bar、因子库
- 数据质量不行,再好的 alpha 也是纸上谈兵
- 数据陷阱:幸存者偏差、复权、前视、未来函数
- 多数 backtest 失败,不是逻辑问题,是数据问题
- 特征存储与时间对齐:point-in-time
正确性
- Point-in-Time 正确性是机器学习 alpha 的基础
- 另类数据:新闻、舆情、链上数据、卫星图
- 新闻、链上数据有 alpha,但清洁成本很高
第三部分:因子与策略研究
- 因子动物园:价值、动量、质量、低波、规模
- 这些经典因子为什么还活着,背后是什么机制
- 统计套利:协整、配对交易、PCA
残差
- 协整不是看数据线条像不像,是看残差的 mean-reversion 强度
- 事件驱动策略:财报、并购、指数调整
- 财报发布瞬间的价格波动,是策略,不是运气
- 机器学习选股:标签构造、防过拟合、SHAP
归因
- 黑盒模型的 alpha 是真的,但能复现吗
- 时间序列深度学习:TCN、Transformer
在量化的实践与陷阱
- Transformer 在 NLP 牛,在时序预测上呢?不怎么样
- 加密资产策略:资金费率套利、跨所搬砖、DeFi
收益
- 24/7 交易、高波动、衍生品发达,策略机会但也风险
第四部分:组合与风险
- 组合构建:均值方差、风险平价、Black-Litterman
- 单个因子 IC 再高,组合后也可能被相关性打爆
- 风险模型:Barra
多因子、风险归因、压力测试
- 你的 VaR 模型没见过这个市场情况,所以会崩
- 头寸管理:Kelly、波动率目标、风险预算
- Kelly 公式好听,但用错了就是最快的赔钱方式
- 交易成本模型:冲击成本、滑点、TCA
- 你的回测用的滑点假设,可能比实际成本低 10 倍
第五部分:回测与评估
- 回测引擎设计:事件驱动与向量化
- 事件驱动 vs 向量化,选错一个,回测会比实盘慢 100 倍
- 回测陷阱:前视偏差、过拟合、数据窥视
- 能发现的 bug 多数是回测没做对;发现不了的也往往是回测问题
- Walk-forward
与 Purged CV:时间序列正确切分
- K-fold 在时序数据上等于作弊,必须用 Purged K-Fold 或 Walk-Forward
- 绩效指标:Sharpe、Sortino、最大回撤、信息比率
- Sharpe 不是王,Calmar 也不是;看对数据,选对指标
第六部分:执行与做市
- 执行算法:TWAP、VWAP、POV、IS
- TWAP vs VWAP 选错了,你的成本会多 5 个基点
- 智能订单路由(SOR)与暗池策略
- 流动性分散在不同场所,选错路由,成本会多吃
- 做市策略:Avellaneda-Stoikov
与库存管理
- 库存越来越大,是赚钱,还是在打赌价格会回
- 高频交易架构:低延迟、内核旁路、FPGA
概览
- 低延迟是软件工程,也是硬件设计
第七部分:生产工程与合规
- 量化交易系统架构:研究、回测、模拟、实盘四套环境
- 四套环境每套都要能快速验证彼此的一致性
- 运维与合规:监控、熔断、监管报送、复盘
- 再好的策略,一次没预料到的故障就能打穿账户
与其他系列的关系
本系列与已有的 fintech 系列互补:
- Fintech 系列 讲清算、撮合引擎、支付通路、风控合规的金融基础设施视角。
- 本系列 讲买方(基金、自营、量化私募)的策略侧与交易执行系统工程。
需要了解交易所撮合机制、行情数据结构时,可引用 fintech/16-matching-engine 和 fintech/17-market-data。
注意事项
- 本系列为工程参考,不构成投资建议。任何策略的实际表现取决于市场环境、执行能力、风控体系、运气等多因素。
- 数据与代码:所有 Python 代码示例使用 numpy/pandas/polars/scikit-learn/PyTorch 等开源库,仅为演示算法逻辑,不代表生产级实现。
- 风险披露:量化交易本质上是高风险活动。黑天鹅事件(如 3AC、FTX、市场熔断)随时可能发生。
- 合规:不同市场、不同管辖区有不同的监管要求。中国大陆居民参与加密交易、A 股程序化交易均涉及法律边界,请自行评估。
更新日期:2026-05-01
作者:ltl
系列相关:分布式系统百科 | 金融科技工程
同主题继续阅读
把当前热点继续串成多页阅读,而不是停在单篇消费。
【量化交易】量化交易全景:从信号到订单的工程链路
量化交易不是策略写得好就能赚钱,更难的是把数据、特征、因子、信号、组合、执行、风控、复盘这八段链路在工程上连成一条不漏数据、不串时间、不丢订单的流水线。本文是【量化交易】系列的总目录与读图,给出八段链路的输入输出、失败模式、不变量清单,并用研究流程图把从一个想法到一笔实盘订单之间所有该过的卡点串起来。
【量化交易】因子动物园:价值、动量、质量、低波、规模
从 Fama-French 三因子到当代 400+ 个发表因子,把价值、动量、质量、低波、规模五个最经得起检验的因子拆开、对照 A 股与美股的实证差异,给出可直接复用的 Python 因子构造、中性化、IC 评估与 Fama-MacBeth 回归流水线。
【量化交易】机器学习选股:标签构造、防过拟合、SHAP 归因
把机器学习选股从「跑一个 LightGBM 看 AUC」还原为标签构造、特征中性化、训练协议、模型解释、上线监控五个独立工程问题。重点讨论 Triple-Barrier 标签、Purged K-Fold 与 Embargo、SHAP 归因,给出可直接套用的 Python 代码骨架。
【量化交易】加密资产策略:资金费率套利、跨所搬砖、DeFi 收益
把加密资产量化策略拆成资金费率套利、跨所搬砖、三角与跨链套利、DeFi 收益、MEV、稳定币结算六个独立工程问题,给出 ccxt 与 web3.py 可运行骨架,覆盖 funding-basis 数学、AMM 滑点、Impermanent Loss 与黑天鹅失败模式。