leader-election 标签归档

共 6 篇文章 · 返回首页

【分布式系统百科】Raft 深度重写：从论文的 18 页到 etcd 的 15000 行

2026-04-13 | distributed | #raft #consensus #etcd #tikv #paxos #distributed-systems #leader-election #log-replication #prevote #multi-raft

Raft 论文 18 页就能读完，但 etcd/raft 用了 15000 行 Go 才把它变成能在生产环境跑的代码。这篇文章从论文的每一个核心机制出发，逐一拆解工程实现中论文没说的东西：PreVote、ReadIndex、LeaderTransfer、ConfChange V2、流水线复制、Async Apply，以及 TiKV 的 Multi-Raft 实践。最后做一次精确的 Paxos 对比，并坦诚讨论 Raft 的已知缺陷。

Raft：让共识算法不再是黑魔法

2026-04-01 | distributed | #raft #consensus #distributed-systems #leader-election #log-replication #paxos

Paxos 被引用了几千次，能正确实现它的人不超过几十个。Raft 用可理解性换工程落地，它的 Leader Election、Log Replication 和 Safety 三板斧，撑起了 etcd、TiKV 和大半个云原生基础设施。

【分布式系统百科】大鹅也能看懂的 Raft 算法解读：选举 · 日志 · 不变量 · 研究前沿

2026-07-14 | distributed | #raft #consensus #leader-election #log-replication #safety #flexible-paxos #multi-raft #distributed-systems

用故障场景与多图讲清 Raft 选举、日志复制与安全不变量；含 Figure 8 手填日志表、柔性 quorum 交集推演，以及对照 raft.github.io 的五步练习。研究章覆盖 Flexible Paxos、FlexiRaft、Multi-Raft；工程细节链到 raft-deep。

【分布式系统百科】ZooKeeper 内核：从 ZAB 协议到分布式协调实践

2026-04-13 | distributed | #zookeeper #zab #distributed-coordination #consensus #watch #distributed-lock #leader-election #service-discovery #distributed-systems

深入拆解 ZooKeeper 的核心机制：ZAB 协议的三阶段流程、ZNode 数据模型、Watch 一次性通知、会话管理，以及分布式锁、Leader 选举、配置管理等典型用法。分析惊群效应等已知问题，并梳理 ZooKeeper 在 Kafka、HBase、Hadoop 生态中的角色。

【分布式系统百科】05 · 分布式系统的复杂性度量：消息复杂度、轮次复杂度与空间下界

2026-04-13 | distributed | #complexity #message-complexity #round-complexity #lower-bound #consensus #leader-election #distributed-systems

顺序算法用时间复杂度和空间复杂度就能衡量好坏。分布式算法多了消息复杂度、轮次复杂度和容错数量三个维度，三者之间存在不可调和的 trade-off。本文从选主、共识、广播三个典型问题出发，梳理这些度量指标的定义、下界和工程影响。

【分布式系统实战】Raft 实现拆解：etcd 的共识算法到底长什么样

2025-01-24 | distributed | #raft #etcd #consensus #distributed-systems #leader-election #log-replication

Raft 论文 18 页，etcd raft 库 ~15000 行 Go。中间的差距不是代码量，是论文没提的工程 edge case：PreVote、流水线复制、ReadIndex、joint consensus。