deduplication 标签归档

共 2 篇文章 · 返回首页

【系统架构设计】幂等性设计:分布式环境下的安全重试

2022 年某电商平台在"双十一"大促期间,因网关超时重试机制配置不当,导致支付服务在 3 分钟内对同一笔订单执行了两次扣款。受影响用户超过 1.2 万人,平台不得不在 48 小时内完成逐笔退款与补偿,直接经济损失超过 800 万元。事后复盘发现,根本原因并非网络故障本身,而是支付接口缺乏幂等性(Idempotency…

【Transformer 与注意力机制】35|数据工程:为什么数据质量常常比数据量更重要

大模型训练里最贵的不只是算力,还是高质量数据。本文把数据工程拆开讲:语料从哪里来,为什么去重、过滤、混配、污染控制都属于“模型能力工程”,C4、The Pile、RefinedWeb、Dolma 这些语料路线各自代表什么,以及为什么 scaling laws 最终会把问题推回到数据质量上。