排序算法
先看排序专题,再决定从哪篇切入
把 TimSort、pdqsort、radix sort、external sort、parallel sort 串成一条工程化阅读路径。
发布来自土法炼钢兴趣小组的知识、笔记、进展和应用。主题包括数据结构和算法、编程语言、网络安全、密码学等。
第一次访问时先按主题切入,比直接沿着时间线翻文章更快。
排序算法
把 TimSort、pdqsort、radix sort、external sort、parallel sort 串成一条工程化阅读路径。
密码学
先理解量子威胁,再顺着 FHE、迁移工程与 TLS 实践继续往下读。
io_uring
适合想快速理解 io_uring 为什么重要、什么场景值得上、怎么开始写代码的读者。
Libevent
如果你关心 Reactor、协议栈集成和生产级事件驱动代码,这条线更适合长期阅读。
把已经形成系列阅读闭环的主题集中在首页,减少在 400 多篇文章里盲找的成本。
按最近更新时间排序;如果你想系统性阅读一个主题,优先回到上面的专题入口。
量化交易不是策略写得好就能赚钱,更难的是把数据、特征、因子、信号、组合、执行、风控、复盘这八段链路在工程上连成一条不漏数据、不串时间、不丢订单的流水线。本文是【量化交易】系列的总目录与读图,给出八段链路的输入输出、失败模式、不变量清单,并用研究流程图把从一个想法到一笔实盘订单之间所有该过的卡点串起来。
系统梳理全球市场结构(Market Structure)的工程图景:从证券交易所、衍生品交易所、加密交易所,到做市商、暗池、ECN/ATS,再到 Maker-Taker 收费、PFOF、Reg NMS 与 MiFID II 的监管影响;给出量化策略选择交易场所的判断框架与基于 ccxt 的多交易所行情聚合代码。
系统讲解市场微结构的核心概念与可计算工具:限价订单簿的数据模型、报价/有效/已实现价差、Roll 模型、四维流动性度量、Kyle's lambda、订单流不平衡(OFI)、Almgren-Chriss 框架下的临时与永久冲击、PIN 与 VPIN、Hawkes 过程,并给出基于 polars 的 L2 增量处理与系数估计代码。
把 Limit、Market、IOC、FOK、Iceberg、Stop、MOO/MOC 这些常被混为一谈的订单类型还原为价格、数量、时效、可见性、触发五个独立维度,并对照 A 股、港股、美股、CME、Binance 五个市场的实际语义差异,给出量化系统中的订单工厂、状态机与风控前置校验的工程实现。
把量化系统里最容易藏雷的数据层从 tick 写到因子库走一遍:行情源接入与质量评估、tick 到 dollar bar 的 de Prado 式重采样、Parquet/Arrow/DuckDB/ClickHouse 列存选型、增量回填与断点续传、公司行动与前后复权、PIT 因子库与版本化查询、缺失监控与漂移检测;附 polars + pyarrow + duckdb 的可运行实现。
系统拆解量化回测里最常见的几类数据陷阱:幸存者偏差、前视偏差、未来函数、数据窥视、复权陷阱、停牌与流动性陷阱、时区与日历对齐。给出 Point-In-Time 财报库的最小可运行实现,演示前视回测与 PIT 回测之间的真实差距,并整理一份回测前自检清单。
把"特征仓库"从一般 ML Feature Store 的语义中拉回到量化的语境:所有问题最终归到一个时间正确性约束。本文给出 bitemporal 的特征模型、Polars / DuckDB 上的 as_of_join 实现、版本化与血缘策略、以及离线和在线一致性的工程做法,并附一份从研究落到生产的检查表。
系统拆解量化研究里"另类数据"这条战线:从新闻文本、社交舆情、卫星与物联网信号,到链上交易和支付流水。每一类都讲清数据来源、采购或采集方式、合规边界、可落地的工程化处理流程,并给出基于 transformers 的中文新闻情感打分与基于 web3.py 的链上指标抓取代码。
从 Fama-French 三因子到当代 400+ 个发表因子,把价值、动量、质量、低波、规模五个最经得起检验的因子拆开、对照 A 股与美股的实证差异,给出可直接复用的 Python 因子构造、中性化、IC 评估与 Fama-MacBeth 回归流水线。
从均值回归的统计学根源出发,把配对交易、协整与误差修正模型、Ornstein-Uhlenbeck 过程、Avellaneda-Lee 的 PCA 残差套利、加密资产中的跨所与基差套利串成一个完整的工程链路,并给出协整检验、OU 参数估计、残差套利回测的可运行代码与协整破裂、LTCM 类失败模式的复盘。
把事件驱动(event-driven)从一个含糊的「炒题材」标签,还原为带有明确触发条件、可交易窗口与统计可检验性的策略族。本文把财报后漂移(PEAD)、并购套利(merger arbitrage)、指数调整(index rebalance)、回购、解禁、宏观日历等事件,按信息传播链统一拆成「事件触发—信息扩散—价格反应—套利窗口—收敛」五个阶段,给出 SUE 计算、事件研究 AAR/CAR 的 Python 实现,以及用 vectorbt 模拟 PEAD 多空组合的端到端流水线。
把机器学习选股从「跑一个 LightGBM 看 AUC」还原为标签构造、特征中性化、训练协议、模型解释、上线监控五个独立工程问题。重点讨论 Triple-Barrier 标签、Purged K-Fold 与 Embargo、SHAP 归因,给出可直接套用的 Python 代码骨架。
把时序深度学习放回量化系统里讨论:TCN 的因果卷积/扩张/残差三件套、Transformer 在金融上的位置编码与稀疏注意力改造、IC loss 与分位数损失、训练-推理偏移与多种子集成、与传统因子的残差融合、ONNX/TorchScript 部署与延迟监控。给出可直接套用的 PyTorch 代码与 vectorbt 评估骨架。
把加密资产量化策略拆成资金费率套利、跨所搬砖、三角与跨链套利、DeFi 收益、MEV、稳定币结算六个独立工程问题,给出 ccxt 与 web3.py 可运行骨架,覆盖 funding-basis 数学、AMM 滑点、Impermanent Loss 与黑天鹅失败模式。
把信号变成头寸,是组合构建(portfolio construction)的核心工程。本文从 Markowitz 的均值方差出发,串到 Ledoit-Wolf 收缩、风险平价、HRP、Black-Litterman、Kelly 与凸优化求解,给出 cvxpy 可运行实现,并讨论稳健性、上线漂移与风险预算。