agent 标签归档 | 土法炼钢兴趣小组的算法知识备份

【系统架构设计】AI 原生架构：LLM 时代的系统设计

2026-07-29 | architecture | #ai-native #llm #agent #timeout #cost-governance #schema-validation #orchestration #observability #rag #architecture

当 LLM 从离线批处理变成在线运行时组件，超时预算、按 token 计费、非确定性输出与多轮 Agent 编排必须进入架构的一等公民。本文从依赖语义差异出发，衔接弹性与过载保护，讨论网关成本治理、结构化输出与人审闸门、checkpoint 恢复与隐私友好的可观测，并划定与 RAG、向量引擎及训练基础设施的分工边界。

大模型基础设施工程

2026-04-22 | architecture · ai-infra | #llm #infra #training #inference #rag #agent #vllm #sglang #deepseek #llmops

面向中国工程团队的大模型基础设施系列。从 GPU/CUDA/互联、训练框架与 3D 并行、vLLM/SGLang 推理引擎、量化与推测解码、RAG/Agent 到服务化、网关、可观测性与安全合规，覆盖 LLMOps 全链路。

【数据库研究前沿】Text-to-SQL 与 Agentic Query：DIN-SQL、C3、DAIL-SQL 工程复盘

2026-04-27 | database | #text-to-sql #din-sql #c3 #dail-sql #spider #bird #agent #schema-linking

Spider / BIRD 评测、DIN-SQL / C3 / DAIL-SQL 的核心机制、schema linking 与 self-consistency，以及一个离线可跑的最小 Text-to-SQL 闭环 demo

【大模型基础设施工程】01：大模型基础设施全景 —— 训练、推理、RAG、Agent、观测

2026-04-22 | architecture · ai-infra | #llm #infra #overview #training #inference #rag #agent #deepseek #openai

面向工程师的大模型基础设施开篇地图，覆盖 2022 到 2026 的工程分水岭、五层工程栈、训练与推理的工程差异、中国与全球行业版图以及成本曲线。

【大模型基础设施工程】19：Agent 框架工程

2026-04-22 | architecture · ai-infra | #llm #infra #agent #langgraph #autogen #crewai #mcp #a2a #coze #browser-use #memgpt #react

从 ReAct 到 LangGraph、AutoGen、CrewAI、Coze，再到 MCP 与 A2A 协议，系统梳理 LLM Agent 框架的工程栈与选型

【大模型基础设施工程·特别篇】27：DeepSeek-V4 的极致性价比从哪来

2026-05-27 | architecture · ai-infra | #llm #infra #deepseek #moe #long-context #kv-cache #fp4 #muon #agent

从 MoE 激活比、CSA/HCA 混合注意力、mHC、Muon，到磁盘级 KV cache、FP4 QAT 和专家蒸馏，系统拆解 DeepSeek-V4 为什么能把 1M 上下文和强 Agent 能力做得又强又便宜。

【Agent 身份与安全】Agent 身份谱系：从 API Key 到委托 Token

2026-06-18 | architecture · security | #agent #oauth #token-exchange #rfc8693 #delegation #jwt #iam #service-account

四代 Agent 身份模型：API Key、OAuth 用户 token、Service Account、RFC 8693 Token Exchange 委托链。拆解 subject_token、actor_token、act claim，以及与 JWT/JWKS 系列的交叉引用。

【Agent 身份与安全】细粒度 Scope 与 UMA 2.0 启示

2026-06-18 | architecture · security | #agent #uma #oauth #scope #consent #authorization #rfc8693

从 coarse scope 到 resource-specific consent：UMA 2.0 Permission Ticket 模型、Google incremental auth 对照，以及 Agent 场景下的动态授权边界。

【Agent 身份与安全】Function Calling 的授权模型

2026-06-18 | architecture · security | #agent #function-calling #opa #cedar #authorization #sql-agent #tool-schema

Tool schema 暴露面、允许列表 vs OPA/Cedar 策略引擎、SQL Agent 的 statement class 与 RLS 边界，以及 Host 层 tool 调用拦截架构。

【Agent 身份与安全】人机协同授权：Human-in-the-Loop

2026-06-18 | architecture · security | #agent #human-in-the-loop #step-up-auth #approval #adaptive-auth #pam

高风险 Agent 操作的 step-up 认证、同步确认 vs 异步审批队列、超时与 Agent 状态机，以及与自适应认证和 PAM JIT 的衔接。

【Agent 身份与安全】MCP 架构与安全基线

2026-06-18 | architecture · security | #mcp #model-context-protocol #oauth #agent #tool-calling #stdio #sse #security

Model Context Protocol 的 Host/Client/Server 三角、stdio 与 Streamable HTTP Transport 安全差异、OAuth 2.1 for MCP 草案边界，以及多 Server secret 隔离与 tool 攻击面。

【Agent 身份与安全】MCP Server 隔离与供应链

2026-06-18 | architecture · security | #mcp #supply-chain #secret-isolation #prompt-injection #slsa #agent

多 MCP Server 并存时的 secret 隔离、恶意 tool description 注入、SBOM 与签名验证，以及与零信任软件供应链的联动。

【Agent 身份与安全】Agent 会话的持续验证与撤销

2026-06-18 | architecture · security | #agent #caep #sse #token-revocation #continuous-verification #session

OpenID CAEP/SSE 草案、短有效期 token 与推送撤销、Agent 缓存 PII 风险，以及与 IAM 会话吊销和零信任持续验证的对照。

【Agent 身份与安全】Agent 审计日志与归因

2026-06-18 | architecture · security | #agent #audit #attribution #opentelemetry #pii #compliance

Agent 最小审计字段集、OpenTelemetry span 建模 tool 调用、PII 清洗点，以及与 PAM/IGA 审计和零信任可观测性的衔接。

【Agent 身份与安全】落地架构与案例框架

2026-06-18 | architecture · security | #agent #architecture #keycloak #opa #envoy #gateway #migration

IdP + Policy Engine + Agent Gateway + MCP Host 参考架构，Keycloak/OPA/Envoy 能力边界，以及从用户 token 直连到 Gateway 代签的迁移路径。

【Agent 身份与安全】AI Agent 的身份、委托与审计

2026-06-18 | architecture · security | #agent #iam #oauth #token-exchange #mcp #function-calling #zero-trust #audit #delegation

IAM 系列（人）与零信任系列（边界）的自然延伸：当 LLM Agent 代表用户调用 API、执行 SQL、读写邮件时，传统 OAuth 模型如何扩展？拆解 Token Exchange、MCP 安全模型、工具级授权、持续验证与审计归因。

【eBPF 内核实现深度拆解】实战：构建微型 eBPF 可观测 Agent

2026-06-12 | kernel · ebpf | #ebpf #libbpf #co-re #ring-buffer #map-pinning #verifier #agent #linux-kernel

把 01--17 的知识串成一条实践线——从 libbpf skeleton 写第一个 BPF 程序、加载到内核、用 ring buffer 回传事件、用 CO-RE 实现跨内核版本兼容、map pinning 实现热升级、配上半自动化的 verifier 错误排障流程——构建一个麻雀虽小五脏俱全的 eBPF 可观测 Agent。