「Long-Running Claude Agents」Anthropic 开源长任务 Agent 护栏示例

Anthropic 开源了一个面向长时间运行 Claude Agents 的示例仓库 cwc-long-running-agents。它不是一个开箱即用的完整框架，而是一组可以复制到项目里的 harness primitives，用来给跑几个小时的 Agent 加上更可靠的质量闭环。

仓库把核心问题说得很清楚：长任务 Agent 不能只靠一段好提示词，它还需要结构化约束。比如“完成”必须有被打开过的证据支撑，构建者不能自己给自己打分，下一个会话也要能从清晰的进度记录和 git 提交里接上工作。

示例里包含三类关键原语：Default-FAIL contract 让测试结果默认失败，只有读过截图、日志或结果文件后才允许写入通过状态；Fresh-context evaluator 用一个没有写入权限的独立 subagent 审核 diff 和截图；Agent-maintained handoff 则通过 PROGRESS.md、CLAUDE.md 和 stop hook，把进度与未提交改动留给下一轮会话。

另外还有两个偏操作控制的 hook：kill-switch 可以通过项目根目录的 AGENT_STOP 文件暂停工具调用，steer 则读取 STEER.md，让人类在不中断长跑任务的情况下给 Agent 转向。对于正在搭建 Claude Code、Agent SDK 或自动化开发循环的人，这个仓库更像是一份可拆解的参考样板。