Build Harness

从 0 到 1 构建 Agent 与 Harness

面向想亲手实现 Agent Harness 的开发者，从 CLI 模型调用、最小 Agent Loop、工具运行时、上下文策略、事件日志到托管运行，逐步搭出可控、可观测、可扩展的工程骨架。

开始阅读

按顺序读下去，会从模型原理一路走到 Agent 与 Harness 的工程视角。

01 Agent 基础定义：从回答到执行过程导读很多人第一次开始做 Agent，最自然的反应是：是不是把 system prompt 写长一点，把规则写细一点，模型就会“像 Agent 一样工作”？
02 Agent 组成模型：Model、Loop、Tools、State 上一篇我们先把一个误解拆掉：Agent 不是一句更长的 prompt。
03 系统边界：ChatBot、Workflow、Agent、Harness 的区别很多人第一次做 Agent 系统时，会自然地把它理解成一条升级路线：
04 Harness 的控制回路：约束、反馈、再投影一个 demo 版 CLI Agent 跑通以后，真正的问题才开始：权限、执行、记录、恢复和验证都需要模型外部的控制回路。
05 Agent 演进路线：从聊天原型到托管运行用项目里程碑的方式看 Agent 如何从只会聊天，逐步长出工具、运行时控制和托管治理。
06 手写 Agent 的意义：理解框架抽象背后的最小机制前面五篇，我们一直在做一件事：先把 Agent 从“神奇的模型能力”拉回到“可解释的运行系统”。
07 LLM Provider 接入：让 CLI 完成第一次模型调用前面几篇一直在讲 Agent 和 Harness 的边界。
08 最小 Agent Loop：从单次回答到多步行动前面几篇我们一直在拆一个问题：Agent 靠受控过程持续推进任务，不能只靠更长的 Prompt 或更会聊天的模型。
09 M0 Core Kernel：真实模型接入系统边界前面几篇已经把 Agent 和 Harness 的心智铺开了。
10 Intent / Execution 分离：模型提议，系统执行很多人在第一次写 CLI Agent 时，会把工具调用想得很直接：
11 Plugin Host：让外部能力按规则进入 Core 从 core 被 provider、工具、hook 和策略污染的现场出发，解释外部能力如何以 contribution 进入系统。
12 Provider Runtime：把模型输出归一成 ToolIntent 从 SDK execute 入口的诱惑出发，拆清 provider 私有格式如何归一成 ModelEvent 和 ToolIntent。
13 Tool Runtime：从 ToolIntent 到 Observation 把模型提出的 ToolIntent 沿 registry、validation、permission、scheduler、sandbox、normalization 管线治理成 Observation。
14 Local Tool Bundle：文件、搜索、终端的本地边界把 Read、Edit、Write、Glob、Grep、Bash 拆成不同风险语义，说明本地工具如何填充 schema、risk、permission 和 observation。
15 Context Policy：Context Builder 里的模型输入投影作为 Context Manager 注意力操作系统中的 Context Builder 子层，解释 Context Policy 如何选择、压缩、隔离和记录这一轮模型该看见的现场。
16 Session Replay：用事件日志恢复长任务现场从进程崩在 ToolStarted 后的事故出发，解释事件日志、artifact、snapshot、ReplayRunner 和 ResumeGate 如何恢复现场。
17 Capability Discovery：按任务暴露最小能力集合当工具、Skills、MCP 和插件越来越多时，用 Capability Catalog、Discovery Policy 和 Visible Set 治理模型本轮能看见的能力。
18 Delegation Runtime：把任务分出去，但不丢掉控制权把 sub-agent 建模成受控工具执行体：父 Agent 通过任务包、权限继承、上下文隔离和 JoinReview 保留控制权。
19 Trace Analysis：用事实日志定位 Agent 失败从 Agent 说修好了但测试仍失败的事故出发，把 event log 投影成可诊断 trace，并归因到具体责任边界。
20 Memory Governance：长期记忆的写入治理从一次临时约束被写成长期偏好的事故出发，解释记忆候选如何进入 CandidateLedger，再经过治理进入长期存储。
21 Scoped Retrieval：从边界检索到 audit snapshot 把检索从无边界 topK 改造成带 scope、citation、audit snapshot 和 replay 证据的检索证据包。
22 Productized CLI：从 demo 入口到稳定运行身份把 demo CLI 的运行方式收敛成 profile、config resolver、provider resolver、extension loader、doctor 和稳定事件流。
23 Hosted Harness：Sandbox、Cron、Durable Execution 与远程部署把本地 CLI Agent 推到远程托管生命周期：job、workspace、sandbox、secret、durable step、artifact、worker lease 与 notification。
24 Agent Harness 术语地图：从 Intent 到 Context Manager 用 glossary / map 的形式收口核心术语：首讲章节、典型消费者、常见混淆和教学项目字段映射，并补上 Context Policy 与 Context Manager 的边界。
25 Agent Harness 教程：从 CLI 助手到可控、可观测、可扩展的工程系统从第一次模型调用、最小 Agent Loop、工具运行时、上下文策略、事件日志到托管运行，逐步构建一个可控、可观测、可扩展的 Agent Harness。