完整引擎 + Rust 重写对比
组装完整 LSM-Tree 存储引擎:DB 接口(Open/Put/Get/Delete/Iterator/Snapshot)、单写多读并发控制、启动恢复,然后用 Rust 重写核心模块,记录 5 个编译器不让我过的故事,最后三方 benchmark 对比。从零写一个 LSM-Tree 存储引擎系列第 5 篇。
发布来自土法炼钢兴趣小组的知识、笔记、进展和应用。主题包括数据结构和算法、编程语言、网络安全、密码学等。
组装完整 LSM-Tree 存储引擎:DB 接口(Open/Put/Get/Delete/Iterator/Snapshot)、单写多读并发控制、启动恢复,然后用 Rust 重写核心模块,记录 5 个编译器不让我过的故事,最后三方 benchmark 对比。从零写一个 LSM-Tree 存储引擎系列第 5 篇。
从零实现 LSM-Tree Compaction:最小堆多路归并迭代器、Level 分层与 Compaction 打分、Tombstone 下推、Version/VersionEdit/MANIFEST 版本管理,以及 Leveled/Size-Tiered/Universal 三种策略的量化对比。从零写一个 LSM-Tree 存储引擎系列第 4 篇。
从零实现 SSTable 和 Bloom Filter:Data Block 前缀压缩与 restart 二分查找、Bloom Filter 双重哈希把误判率压到约 1%、SSTable Builder 和 Reader 的完整 C 代码。从零写一个 LSM-Tree 存储引擎系列第 3 篇。
从卢德运动到数控机床到编程史,技术革命中手艺人的命运不是被替代,而是被降级——从工匠变成操作员。AI 时代的程序员正在重复同样的剧本。
从零实现 WAL 和 MemTable:WAL 的 record 格式与 32KB Block 对齐、跳表的 O(log n) 插入与查找、InternalKey 编码、崩溃恢复的正确性证明。从零写一个 LSM-Tree 存储引擎系列第 2 篇。
AI 降低了成年人跨界的入场门槛,却没有降低判断门槛。用密码学、io_uring 和数据分析三个场景,拆解 AI 辅助跨界真正危险的地方。
sendfile/splice/io_uring 的 zero-copy 路径深度解析与实测。揭示小数据包场景下传统 copy 因 cache locality 反而更快的反直觉真相。
密码学最危险的不是算法被破解,而是正确的算法被错误地使用。本文梳理 7 个真实 CVE 中的密码学工程错误,附代码与修复方案。
从量子比特和量子门的基础概念出发,通过 Deutsch 问题实例,手把手教你构建第一个完整的量子算法,理解叠加、纠缠和干涉如何协同工作实现量子优势。
深入浅出介绍量子计算的三大核心支柱:量子比特、叠加态和纠缠态,探讨量子计算机如何利用这些奇特性质解决特定问题,以及 Grover 算法如何实现量子搜索加速。
从零理解 LSM-Tree 存储引擎的设计哲学:B-Tree 与 LSM-Tree 的本质差异,写放大/读放大/空间放大的三角权衡,以及 WAL、MemTable、SSTable、Compaction、Bloom Filter 各组件的角色与协作关系。从零写一个 LSM-Tree 存储引擎系列第 1 篇。
深度剖析 SLA "几个9"背后的统计陷阱:独立性假设、级联故障、关联故障如何让你的可用性数字沦为一厢情愿的幻觉
从零开始实现一个基于有限状态机(FSM)的 JSON 解析器。不依赖第三方库,深入理解词法分析与语法分析的核心思想。
深入探讨正则表达式的回溯机制导致的性能问题,详解 ReDOS 攻击原理与防御策略,并分享生产环境中的真实排查案例。
全面介绍 JSON 数据格式的历史演进、优缺点与竞争者对比(XML、YAML、Protobuf、MessagePack、TOML、BSON),深入展示 json-gen-c 代码生成工具在 C 语言中的实战应用。