
Anthropic 开源了一个面向长时间运行 Claude Agents 的示例仓库 cwc-long-running-agents。它不是一个开箱即用的完整框架,而是一组可以复制到项目里的 harness primitives,用来给跑几个小时的 Agent 加上更可靠的质量闭环。
仓库把核心问题说得很清楚:长任务 Agent 不能只靠一段好提示词,它还需要结构化约束。比如“完成”必须有被打开过的证据支撑,构建者不能自己给自己打分,下一个会话也要能从清晰的进度记录和 git 提交里接上工作。
示例里包含三类关键原语:Default-FAIL contract 让测试结果默认失败,只有读过截图、日志或结果文件后才允许写入通过状态;Fresh-context evaluator 用一个没有写入权限的独立 subagent 审核 diff 和截图;Agent-maintained handoff 则通过 PROGRESS.md、CLAUDE.md 和 stop hook,把进度与未提交改动留给下一轮会话。
另外还有两个偏操作控制的 hook:kill-switch 可以通过项目根目录的 AGENT_STOP 文件暂停工具调用,steer 则读取 STEER.md,让人类在不中断长跑任务的情况下给 Agent 转向。对于正在搭建 Claude Code、Agent SDK 或自动化开发循环的人,这个仓库更像是一份可拆解的参考样板。
传送门
https://github.com/anthropics/cwc-long-running-agents
原创文章,如若转载,请注明出处:https://wefound.cc/p/1881.html