系统架构设计
中文互联网上最系统、最深入的系统架构设计技术博客系列。不做面试八股文搬运,不做最佳实践清单——每一篇文章都回答真实的工程问题、呈现关键的 trade-off、拆解生产环境中的真实案例。
发布来自土法炼钢兴趣小组的知识、笔记、进展和应用。主题包括数据结构和算法、编程语言、网络安全、密码学等。
共 8 篇文章 · 返回首页
中文互联网上最系统、最深入的系统架构设计技术博客系列。不做面试八股文搬运,不做最佳实践清单——每一篇文章都回答真实的工程问题、呈现关键的 trade-off、拆解生产环境中的真实案例。
Transformer 的成功没有消除它的结构性代价。本文区分工程瓶颈和架构瓶颈,解释 O(n²) attention、KV Cache 线性增长、自回归串行性、长上下文与长期记忆的差异、位置外推和数据效率问题,并说明为什么 Mamba、RWKV、RetNet、线性注意力等路线都在试图绕开同一组限制。
后 Transformer 时代不太可能是某个新架构一夜之间消灭 Transformer,更可能是 attention、SSM、MoE、检索、外部记忆、工具调用和多模态模块逐渐混合。本文回顾本系列主线,解释为什么 Transformer 很难突然消失,也为什么它不可能原样解决所有问题。
把 Transformer encoder 从“左半边”这个模糊概念拆成可操作的结构:单层里 self-attention、FFN、残差、LayerNorm 各做什么;6 层堆叠为什么不是重复劳动;encoder 输出为什么适合理解任务而不直接擅长生成;以及它和 decoder-only、encoder-decoder 两条路线到底差在哪。
把 18 篇文章里讲过的所有零件——QKV、多头注意力、causal mask、位置编码、FFN、残差、归一化——拼成一张完整的 Transformer 图。跟随一个 token 走完从输入到输出的全部旅程,建立对架构的「身体记忆」。
量化策略从一个 notebook 想法走到生产,必须穿过研究、回测、模拟、实盘四套环境。如果四套环境各写一份代码,几乎一定在上线第一周就因为「回测里有但实盘里没有的字段」或「模拟里能成交但实盘里被拒绝」翻车。本文给出一套以接口驱动的统一架构:DataSource、FeaturePipeline、SignalGenerator、PortfolioConstructor、OrderRouter、RiskManager 六层抽象;同一份 Strategy 代码在四个环境里通过依赖注入切换实现;研究环境绑定 MLflow 与 PIT 数据访问层;回测环境对接前一篇引擎;模拟交易跑生产路径但不真实成交;实盘加上订单状态机、对账、灰度发布。文末给出可直接运行的 Python 参考实现。
从延迟、吞吐、开发效率、生态成熟度四个维度对比 REST、gRPC、GraphQL、WebSocket,给出微服务内部与面向客户端的选型决策树,讨论混合架构模式与迁移路径。
服务架构演化实践:从单体到微服务,系统扩展性设计与优化历程