返回 AI Agent / Build Harness

阅读路径

25 篇文章

Build Harness

从 0 到 1 构建 Agent 与 Harness

面向想亲手实现 Agent Harness 的开发者,从 CLI 模型调用、最小 Agent Loop、工具运行时、上下文策略、事件日志到托管运行,逐步搭出可控、可观测、可扩展的工程骨架。

开始阅读

目录

按顺序读下去,会从模型原理一路走到 Agent 与 Harness 的工程视角。

  1. 01 Agent 基础定义:从回答到执行过程 导读 很多人第一次开始做 Agent,最自然的反应是:是不是把 system prompt 写长一点,把规则写细一点,模型就会“像 Agent 一样工作”?
  2. 02 Agent 组成模型:Model、Loop、Tools、State 上一篇我们先把一个误解拆掉:Agent 不是一句更长的 prompt。
  3. 03 系统边界:ChatBot、Workflow、Agent、Harness 的区别 很多人第一次做 Agent 系统时,会自然地把它理解成一条升级路线:
  4. 04 Harness 的控制回路:约束、反馈、再投影 一个 demo 版 CLI Agent 跑通以后,真正的问题才开始:权限、执行、记录、恢复和验证都需要模型外部的控制回路。
  5. 05 Agent 演进路线:从聊天原型到托管运行 用项目里程碑的方式看 Agent 如何从只会聊天,逐步长出工具、运行时控制和托管治理。
  6. 06 手写 Agent 的意义:理解框架抽象背后的最小机制 前面五篇,我们一直在做一件事:先把 Agent 从“神奇的模型能力”拉回到“可解释的运行系统”。
  7. 07 LLM Provider 接入:让 CLI 完成第一次模型调用 前面几篇一直在讲 Agent 和 Harness 的边界。
  8. 08 最小 Agent Loop:从单次回答到多步行动 前面几篇我们一直在拆一个问题:Agent 靠受控过程持续推进任务,不能只靠更长的 Prompt 或更会聊天的模型。
  9. 09 M0 Core Kernel:真实模型接入系统边界 前面几篇已经把 Agent 和 Harness 的心智铺开了。
  10. 10 Intent / Execution 分离:模型提议,系统执行 很多人在第一次写 CLI Agent 时,会把工具调用想得很直接:
  11. 11 Plugin Host:让外部能力按规则进入 Core 从 core 被 provider、工具、hook 和策略污染的现场出发,解释外部能力如何以 contribution 进入系统。
  12. 12 Provider Runtime:把模型输出归一成 ToolIntent 从 SDK execute 入口的诱惑出发,拆清 provider 私有格式如何归一成 ModelEvent 和 ToolIntent。
  13. 13 Tool Runtime:从 ToolIntent 到 Observation 把模型提出的 ToolIntent 沿 registry、validation、permission、scheduler、sandbox、normalization 管线治理成 Observation。
  14. 14 Local Tool Bundle:文件、搜索、终端的本地边界 把 Read、Edit、Write、Glob、Grep、Bash 拆成不同风险语义,说明本地工具如何填充 schema、risk、permission 和 observation。
  15. 15 Context Policy:Context Builder 里的模型输入投影 作为 Context Manager 注意力操作系统中的 Context Builder 子层,解释 Context Policy 如何选择、压缩、隔离和记录这一轮模型该看见的现场。
  16. 16 Session Replay:用事件日志恢复长任务现场 从进程崩在 ToolStarted 后的事故出发,解释事件日志、artifact、snapshot、ReplayRunner 和 ResumeGate 如何恢复现场。
  17. 17 Capability Discovery:按任务暴露最小能力集合 当工具、Skills、MCP 和插件越来越多时,用 Capability Catalog、Discovery Policy 和 Visible Set 治理模型本轮能看见的能力。
  18. 18 Delegation Runtime:把任务分出去,但不丢掉控制权 把 sub-agent 建模成受控工具执行体:父 Agent 通过任务包、权限继承、上下文隔离和 JoinReview 保留控制权。
  19. 19 Trace Analysis:用事实日志定位 Agent 失败 从 Agent 说修好了但测试仍失败的事故出发,把 event log 投影成可诊断 trace,并归因到具体责任边界。
  20. 20 Memory Governance:长期记忆的写入治理 从一次临时约束被写成长期偏好的事故出发,解释记忆候选如何进入 CandidateLedger,再经过治理进入长期存储。
  21. 21 Scoped Retrieval:从边界检索到 audit snapshot 把检索从无边界 topK 改造成带 scope、citation、audit snapshot 和 replay 证据的检索证据包。
  22. 22 Productized CLI:从 demo 入口到稳定运行身份 把 demo CLI 的运行方式收敛成 profile、config resolver、provider resolver、extension loader、doctor 和稳定事件流。
  23. 23 Hosted Harness:Sandbox、Cron、Durable Execution 与远程部署 把本地 CLI Agent 推到远程托管生命周期:job、workspace、sandbox、secret、durable step、artifact、worker lease 与 notification。
  24. 24 Agent Harness 术语地图:从 Intent 到 Context Manager 用 glossary / map 的形式收口核心术语:首讲章节、典型消费者、常见混淆和教学项目字段映射,并补上 Context Policy 与 Context Manager 的边界。
  25. 25 Agent Harness 教程:从 CLI 助手到可控、可观测、可扩展的工程系统 从第一次模型调用、最小 Agent Loop、工具运行时、上下文策略、事件日志到托管运行,逐步构建一个可控、可观测、可扩展的 Agent Harness。