schema-evolution 标签归档

共 4 篇文章 · 返回首页

【系统架构设计】数据迁移与版本化：在线不停机的数据演进

2026-04-13 | architecture | #data-migration #expand-contract #gh-ost #online-DDL #schema-evolution

如何在不停机的前提下完成数据库 schema 迁移、数据格式升级、存储引擎更换？本文深入 Expand-Contract 模式、双写双读的一致性保证，复盘 GitHub 的 gh-ost 和 Stripe 的在线迁移实践。

【系统架构设计】契约测试与 Schema 演进：服务间的信任协议

2026-04-13 | architecture | #contract-testing #Pact #Protobuf #Avro #schema-evolution #Schema-Registry

微服务拆分之后，服务间的接口兼容性成为系统稳定性的最大隐患。Pact 的消费者驱动契约、Protobuf 和 Avro 各自不同的 Schema 演进规则、Confluent Schema Registry 的兼容性策略——这些机制共同构成了服务间的信任协议。本文从一个真实的 Breaking Change 事故出发，拆解契约测试与 Schema 演进的工程实践，给出可落地的 CI/CD 集成方案。

【存储工程】数据湖存储格式：Delta Lake、Iceberg 与 Hudi

2025-09-18 | storage | #data-lake #delta-lake #iceberg #hudi #acid #time-travel #schema-evolution

数据湖（Data Lake）的核心思想是把海量异构数据以开放格式存储在廉价的对象存储（Object Storage）上，用计算引擎按需查询。Apache Parquet 解决了列式编码（Columnar Encoding）问题，让分析查询的 I/O 效率提升了一个数量级。但 Parquet 只是一个文件格式，它不管事务…

序列化格式的真正代价：protobuf vs flatbuffers vs capnproto

2025-02-03 | system-design | #serialization #protobuf #flatbuffers #capnproto #zero-copy #schema-evolution #benchmark

不只测速度。schema evolution 的兼容性、zero-copy 的真实收益、生成代码的可维护性——这些才是选型时真正要看的东西。