2026-04-22 | architecture · opensource | #ai #training-data #copyright #fair-use #tdm #books3 #common-crawl #laion #rag #dataset-license #generative-ai
一篇话讲清楚:网络爬取训练语料、书籍/代码/图片数据集、合成数据与 RAG 私域数据在著作权法上的真实边界。覆盖美国 fair use、欧盟 TDM 例外、日本 30-4 条、中国合理使用与生成式 AI 司法态度;逐个拆解 Books3、Common Crawl、LAION-5B、The Pile、StarCoder、Stack Exchange 等高频数据集的许可现状;给出工程团队在预训练、微调、RAG 三个场景下的可执行检查清单。
2026-04-10 | ai-philosophy | #ai #strategy #management #career #organization
如果一个组织只是把 AI 用来缩短写 PPT 和周报的时间,那么它正在步入一条缓慢死亡的轨道。从大小公司、部门到个体,我们该如何跨越 AI 的局部红利,实现真正的战略跃迁?
2025-02-23 | ai-philosophy | #cognitive-psychology #system1-system2 #ai #programmer #expertise #chunking
AI 正在重新定义程序员的工作边界。理解人类认知的双过程模型——快速模式匹配和慢速符号推理——有助于分析这个变化,但这个模型本身也有局限。AI 的能力天花板仍在快速上移。
2025-11-30 | game_math | #math #ai #navigation #boids
AI 如何寻路?详解 A* 算法原理(启发函数、二叉堆优化、JPS)与 Boids 群体模拟(分离、对齐、内聚、空间哈希加速、力优先级截断)。
2025-11-30 | garbage-collection | #gc #zgc #shenandoah #ai #performance
探索垃圾回收技术的最新进展,包括 ZGC 的染色指针、读屏障技术以及 AI 驱动的参数调优。
2025-02-15 | doc | #technical-writing #ai #blog #knowledge #learning
当 ChatGPT 能在 30 秒内解释任何技术概念时,花三天写一篇深度文章还有意义吗?有。但理由和你想的不一样。
2026-03-22 | programming | #ai #automation #history #programming #labor #craft #philosophy #luddite #deskilling
从卢德运动到数控机床到编程史,技术革命中手艺人的命运不是被替代,而是被降级——从工匠变成操作员。AI 时代的程序员正在重复同样的剧本。