土法炼钢兴趣小组的算法知识备份

量化交易

文章导航

分类入口
quant
标签入口
#quantitative-trading#factor#backtest#execution#alpha#risk-management#hft#defi

目录

量化交易是用数据、模型与工程把”投资判断”变成可重复执行系统的过程。这个系列面向策略研究员与工程师,从信号设计到订单成交的整条链路,讲清楚工程上的真实挑战与解决方案。

这个领域最值得关注的 5 个问题

这些问题能区分真正理解量化交易的人和只会背术语的人。本系列的目的就是回答它们:

  1. 为什么 99% 的量化策略都死在回测与实盘之间? → 不是逻辑问题,是数据、成本、过拟合的工程问题。详见第二部分(数据)、第五部分(回测)、第六部分(成本)。

  2. 成本(交易成本 + 延迟 + 冲击)的真实规模是多少,它如何支配你的策略选择? → 多数人只看 Sharpe,忘了总 PnL = alpha - cost。总成本永远是已知的损失。详见第四部分(成本)、第六部分(执行)。

  3. 如何区分”历史回测中的好”和”未来能跑的好”? → K-fold 在时序数据上为什么失效?Walk-Forward 怎么设?什么时候该用 Purged K-Fold?详见第五部分(回测)。

  4. 高频和低频策略在工程上的本质区别是什么,不只是延迟? → 低频关心”这个月赚没赚”,高频关心”100 微秒内能不能发完 100 笔单”。监控粒度、风控形式、运维体系完全不同。详见第六部分(执行)、第七部分(高频)。

  5. 为什么稳定性(不被打穿的概率)比 alpha(绝对收益)更难? → 黑天鹅随时来,系统设计、风控规则、应急响应、团队文化决定了你能活多久。详见第七部分(运维)。

核心视角

适合谁看

篇目依赖关系与阅读建议

地基(必读)

不同角色的推荐路径

完全入门(无基础,了解全貌)
01 → 02 → 03 → 05 → 09 → 19 → 22 → 27

因子策略研究(关心 alpha 有效性)
09 → 10 → 12 → 15 → 20 → 21
前置:05/06/07(数据正确性)

系统工程与基建(关心系统搭建)
05 → 07 → 19 → 23 → 27 → 28
配合:09(因子示例)、18(成本模型)

高频与做市(关心低延迟执行)
02 → 03 → 23 → 25 → 26
配合:18(成本模型)、27-28(风控体系)

加密与多资产
02 → 14 → 24 → 25
前置:18(成本模型)

目录

第一部分:导论与市场结构

  1. 量化交易全景:从信号到订单的工程链路
    • 建立心智模型,理解为什么「能跑的系统」和「赚钱的系统」是两个东西
  2. 市场结构:交易所、做市商、暗池、ECN
    • 你的订单真的去了交易所吗,还是被中介吃掉了
  3. 市场微结构:订单簿、价差、流动性、冲击
    • 执行质量取决于对订单簿形状的理解深度
  4. 订单类型与执行语义:限价、市价、IOC、FOK、冰山
    • IOC/FOK/Post-Only 不只是交易所选项,是执行策略的基础

第二部分:数据底盘

  1. 行情与基本面数据管线:tick、bar、因子库
    • 数据质量不行,再好的 alpha 也是纸上谈兵
  2. 数据陷阱:幸存者偏差、复权、前视、未来函数
    • 多数 backtest 失败,不是逻辑问题,是数据问题
  3. 特征存储与时间对齐:point-in-time 正确性
    • Point-in-Time 正确性是机器学习 alpha 的基础
  4. 另类数据:新闻、舆情、链上数据、卫星图
    • 新闻、链上数据有 alpha,但清洁成本很高

第三部分:因子与策略研究

  1. 因子动物园:价值、动量、质量、低波、规模
    • 这些经典因子为什么还活着,背后是什么机制
  2. 统计套利:协整、配对交易、PCA 残差
    • 协整不是看数据线条像不像,是看残差的 mean-reversion 强度
  3. 事件驱动策略:财报、并购、指数调整
    • 财报发布瞬间的价格波动,是策略,不是运气
  4. 机器学习选股:标签构造、防过拟合、SHAP 归因
    • 黑盒模型的 alpha 是真的,但能复现吗
  5. 时间序列深度学习:TCN、Transformer 在量化的实践与陷阱
    • Transformer 在 NLP 牛,在时序预测上呢?不怎么样
  6. 加密资产策略:资金费率套利、跨所搬砖、DeFi 收益
    • 24/7 交易、高波动、衍生品发达,策略机会但也风险

第四部分:组合与风险

  1. 组合构建:均值方差、风险平价、Black-Litterman
    • 单个因子 IC 再高,组合后也可能被相关性打爆
  2. 风险模型:Barra 多因子、风险归因、压力测试
    • 你的 VaR 模型没见过这个市场情况,所以会崩
  3. 头寸管理:Kelly、波动率目标、风险预算
    • Kelly 公式好听,但用错了就是最快的赔钱方式
  4. 交易成本模型:冲击成本、滑点、TCA
    • 你的回测用的滑点假设,可能比实际成本低 10 倍

第五部分:回测与评估

  1. 回测引擎设计:事件驱动与向量化
    • 事件驱动 vs 向量化,选错一个,回测会比实盘慢 100 倍
  2. 回测陷阱:前视偏差、过拟合、数据窥视
    • 能发现的 bug 多数是回测没做对;发现不了的也往往是回测问题
  3. Walk-forward 与 Purged CV:时间序列正确切分
    • K-fold 在时序数据上等于作弊,必须用 Purged K-Fold 或 Walk-Forward
  4. 绩效指标:Sharpe、Sortino、最大回撤、信息比率
    • Sharpe 不是王,Calmar 也不是;看对数据,选对指标

第六部分:执行与做市

  1. 执行算法:TWAP、VWAP、POV、IS
    • TWAP vs VWAP 选错了,你的成本会多 5 个基点
  2. 智能订单路由(SOR)与暗池策略
    • 流动性分散在不同场所,选错路由,成本会多吃
  3. 做市策略:Avellaneda-Stoikov 与库存管理
    • 库存越来越大,是赚钱,还是在打赌价格会回
  4. 高频交易架构:低延迟、内核旁路、FPGA 概览
    • 低延迟是软件工程,也是硬件设计

第七部分:生产工程与合规

  1. 量化交易系统架构:研究、回测、模拟、实盘四套环境
    • 四套环境每套都要能快速验证彼此的一致性
  2. 运维与合规:监控、熔断、监管报送、复盘
    • 再好的策略,一次没预料到的故障就能打穿账户

与其他系列的关系

本系列与已有的 fintech 系列互补:

需要了解交易所撮合机制、行情数据结构时,可引用 fintech/16-matching-enginefintech/17-market-data

注意事项

  1. 本系列为工程参考,不构成投资建议。任何策略的实际表现取决于市场环境、执行能力、风控体系、运气等多因素。
  2. 数据与代码:所有 Python 代码示例使用 numpy/pandas/polars/scikit-learn/PyTorch 等开源库,仅为演示算法逻辑,不代表生产级实现。
  3. 风险披露:量化交易本质上是高风险活动。黑天鹅事件(如 3AC、FTX、市场熔断)随时可能发生。
  4. 合规:不同市场、不同管辖区有不同的监管要求。中国大陆居民参与加密交易、A 股程序化交易均涉及法律边界,请自行评估。

更新日期:2026-05-01
作者:ltl
系列相关:分布式系统百科 | 金融科技工程

同主题继续阅读

把当前热点继续串成多页阅读,而不是停在单篇消费。

2026-05-01 · quant

【量化交易】量化交易全景:从信号到订单的工程链路

量化交易不是策略写得好就能赚钱,更难的是把数据、特征、因子、信号、组合、执行、风控、复盘这八段链路在工程上连成一条不漏数据、不串时间、不丢订单的流水线。本文是【量化交易】系列的总目录与读图,给出八段链路的输入输出、失败模式、不变量清单,并用研究流程图把从一个想法到一笔实盘订单之间所有该过的卡点串起来。


By .