澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停

行业资讯 (4) 5天前

澳洲牧羊大叔随手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第1张

一觉醒来,Claude Code 又更新!

为了让 Claude 持续工作直到任务完成,Claude Code 最近推出的新功能:/goal 。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第2张

你只要设定条件,Claude 不完成任务它绝不罢休!

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第3张

用过 AI 编程工具的人都懂,这到底多重要!

你给 Agent 下了一个任务,它跑了三个回合,改了两个文件,突然停下来问你「接下来需要我做什么?」

不是,bug 你这还没修完呢啊!

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第4张

Agent 越来越聪明,写代码越来越快,但「从头到尾把一件事干完」这件事,到 2026 年初都没有一家能做到。

然后,一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 解决了。

他把它命名为 Ralph Loop,致敬《辛普森一家》里那个永远搞不清状况但从不放弃的小孩 Ralph Wiggum。

逻辑极其粗暴,无限循环,反复把同一个 prompt 喂给 Agent。进度写在文件系统和 Git 历史里,上下文满了就开新实例,读文件接着干。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第5张

原始,不优雅,但十分有效。

有效到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。

11 天,三家顶级 AI 实验室,不约而同地把这三行 bash 写进了官方产品。

这一刻,所有人都明白了一件事 ——

通用人工智能的临门一脚,可能不是更聪明的模型,而是「把事做完」的模型。

换句话说,AI 编程的核心战场正在从「生成代码」转向「闭环交付」。

4 月 30 日,OpenAI 的 Codex 率先上线 / goal。

Greg Brockman 在 X 上只丢了一句,「Codex 现已内置 Ralph loop++」。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第6张

一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。

11 天。三家。同一个命令。同一个功能。

但实现路径,差了十万八千里。

Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第7张

OpenAI 是三家里最先出手的,方案也最简洁。

在 Codex 里,/goal 是一个持久化的工作流对象,存在本地的 app-server 状态层里。

关掉终端、合上笔记本、甚至重启系统,目标都不会丢。下次打开 Codex,自动接上。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第8张

模型通过结构化的 update_goal 工具汇报进度状态,token 预算耗尽时触发「软着陆」而非硬停。

有人用这个功能连续跑了 14 个小时,中间暂停 5 小时去睡觉,回来 Codex 从断点续跑,把一个设备驱动项目做完了。

工程化,干净,但克制。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第9张

Hermes Agent 的野心最大。

在这里,/goal 只是冰山一角。真正的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队协作问题。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第10张

看板的底层是本地 SQLite,持久化存储,跨重启不丢。

你在上面创建一个任务卡片,Hermes 会直接把它拆成多个子任务,分配给不同的 Agent worker。每个 worker 是一个独立的 OS 进程,有自己的身份、模型配置和工作目录。

看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的目标锁定(Ralph loop),看板管的是多个 Agent 之间的任务调度。一个纵向深入,一个横向铺开。

最后,是五层防烂尾机制。

第一层,心跳检测。每个 worker 定期向看板报到,证明自己还活着。

第二层,僵尸回收。worker 超时没响应?系统自动判定死亡,回收它手上的任务重新分配。macOS 上还有专门的达尔文僵尸检测逻辑。

第三层,退出拦截。worker 没完成任务就退出了?系统自动把它标记为 blocked,不让它再接新活,防止「摸鱼型 Agent」反复领任务又不做。

第四层,幻觉拦截。这是最狠的一层。AI 说「我做完了」不算数,系统会验证它实际产出的代码是否真的落盘了。Agent 说自己创建了一个文件但实际上没有?抓住,回滚,重来。

第五层,重试预算。每个任务有独立的 max_retries,最多重试 N 次,超过就上报人类。绝对不会无限循环到死机。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第11张

Anthropic 是三家里最后出手的,但方案最巧妙。

本质上,Claude Code 的 / goal 是一个 session 级别的 Stop Hook。

你设定一个完成条件(比如「test / auth 目录下所有测试通过且 lint 无报错」),Claude 就开始干活。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第12张

关键设计在验收环节。每干完一轮,系统不让 Claude 自己判断「我做完了没有」。

它把对话记录和你的完成条件一起发给一个独立的小模型(默认是 Haiku),让这个小模型来裁判。

小模型如果觉得没完成,就需要返回一个具体理由(比如「test_login.py 还有 2 个 failure」)。然后这个理由会被注入 Claude 下一轮的上下文,指导它接着干。

如果小模型认为完成了,目标就会自动清除,任务结束。

值得一提的是,这个裁判模型不调用任何工具,不读文件,不跑命令。它只看 Claude 在对话里产出的内容。

所以,你的完成条件必须是 Claude 在对话中能证明的东西。

它最长支持 4000 字符,因此你可以写得很细。

甚至,还可以在条件里加约束,比如「不修改其他测试文件」「20 轮内完成否则停止」等等。

澳洲放羊大叔引爆 AI 编程革命!Claude Code 急推 goal 模式,不干完不许停_http://www.hnzqjt.cn_行业资讯_第13张

把视角拉远一步。

Claude Code 背后站着 Anthropic,Codex 背后站着 OpenAI,Hermes Agent 接入了两边的模型,同时也是 DeepSeek V4 等模型的主力分发渠道。

三条路径,恰好覆盖了 ASI 决赛的三个生态入口。

而他们争的,也是同一样东西 —— 工作流。

谁的 Agent 先让开发者养成「设完目标就走开」的习惯,谁就锁死了工作流入口。

因为习惯一旦形成,迁移成本是指数级的。

你不会轻易离开一个已经跑通了看板调度、断点续传、checkpoint 回滚的 Agent 基础设施。

一个看似很小的 / goal 命令,背后卡的是整条 Agent 工作流的护城河。

参考资料:

本文来自微信公众号:新智元(ID:AI_era),作者:好困 KingZH