OpenAI专家手把手教你最大化利用Codex

AI编程助手正在迎来一个全新阶段:从问答工具演变为能够7×24小时持续“上岗”的数字员工。近期,13k星开源项目Instructor的作者Jason Liu,在被OpenAI招入Codex团队后,毫不吝啬地分享了他的深度使用心得,立刻在开发者社区引发热议。

从“问答”到“打工”:Codex的进化之路

Jason Liu,这位在开源圈颇具影响力的开发者,刚加入OpenAI的Codex团队不久。他不仅大方地发放API额度,还写下了一篇名为Codex-maxxing的玩法指南,彻底颠覆了人们对AI编码助手的传统认知。

在传统用法中,Codex或许只是一个单次对话的编程助手。但在Jason的体系里,它被改造成了一个能自动跟进亚马逊退款、定时扫描Slack需求、甚至在开发者洗澡时持续工作的可靠“员工”。

根据公开数据,Codex周活跃用户已在4月底突破400万。在此背景下,Jason的这份“官方使用指南”显得尤为珍贵。恰逢Codex近期迎来一波重要更新:Appshots截图直喂、Goal模式正式转正、以及锁屏后也能远程执行任务。这些新功能与Jason的深度玩法叠加,揭示了一个趋势:现在的竞争焦点,不再是简单的代码生成,而是谁能驱动AI持续、稳定、自主地完成复杂工作流。

核心逻辑:让代理“自己跑起来”

Jason整套方法论的核心,在于将Codex从被动响应工具,转变为能长期运行、持续接管任务的自主工作系统。

多数用户习惯在单次问答后关闭会话,但Jason的做法截然相反:他开着数十个跨月存活的巨型线程,绝不随意终止。他为每个关键工作流设立一个置顶线程:管理日程的、跟踪开源项目的、监控社交互动的……通过Command-1到Command-9即可一键跳转。

这些线程里积累了几个月的对话历史、偏好设置和过往决策。当再次调用时,Agent无需重复交代背景,就能自动衔接进度。当线程生命周期被拉长,项目背景、沟通习惯和历史决策自然沉淀其中,Agent便具备了惊人的工作连续性。

更值得关注的是,Jason下任务几乎不依赖键盘。他推崇口述指令,认为这样能完整保留原始思路,无需刻意优化Prompt。直接将模糊、跳跃甚至带有溯源需求的想法自然地交给Agent。配合Codex的Steering功能,他还能在Agent执行任务时插队追加指令,说完就走,无需等待。

然而,真正让Codex从工具转变为“职员”的关键,是Heartbeats与@computer的组合运用。Heartbeats本质上是一种定时任务调度机制。Jason有一个“Chief of Staff”线程,每30分钟自动运行一次:扫描Slack和Gmail,判断消息优先级,重要回复则先起草草稿,最终由人决定是否发送。他还举了一个更复杂的例子:做动画项目时,将视频发到Slack审阅线程,让Codex每15分钟检查一次。一旦同事提出反馈,Agent便自动重新渲染新版本并回复。由于Slack MCP服务器暂不支持文件上传,Agent甚至会主动调用@computer去点击“Add file”按钮。

一次有趣的经历是,Jason在洗澡前让Codex盯着亚马逊客服排队状态。等他洗完澡出来,退款已经自动到账。类似的自动化流程,现已扩展到Google Docs评论、GitHub PR Review等场景。而Jason最强调的,是验证机制——这是判断任务何时终止的关键。他曾让Codex将Python的Rich库完整迁移至Rust,硬性要求是通过原库所有单元测试。测试通过与否,决定了任务是否完成;失败,Agent就继续修改。用他的话说:“没有验证机制的野心,顶多算个愿望。” 最新的Codex更新中,OpenAI已将Goal模式从实验版本转正,用户只需明确最终目标和验收标准,Codex便会自主持续推进,短则数小时,长则数天。

主权优先:将记忆掌握在自己手中

Jason这套玩法的另一核心思路,是个人工作记忆不应该托管在平台内部。他的所有长期线程都从一个Obsidian vault起步,目录划分为TODO、people、projects、agent、notes等板块。在顶层的AGENTS.md文件里,他写明了规则:人员信息更新、项目推进、待办办结等变动,都必须同步更新知识库的对应内容。

这意味着,他几乎放弃了Codex的内置记忆系统,将核心记忆数据存放在本地可控文件中。这样既能随时查阅手动修改,也能通过版本对比查看变动,出现问题还能一键回滚。他给出的理由很充分:AI承载的记忆体量越大,就越不该把数据锁死在单一平台。文件是完全属于用户自己的,后续想换工具、迁平台,拎着知识库就能走。虽然Codex自带记忆功能Chronicle(通过截屏构建上下文),但作为实验性功能,在权限、速率和隐私方面仍有短板。因此,文件系统依旧是当前最可靠的记忆基础设施。

与此同时,Codex工作台本身也在升级。侧边栏已不再局限于聊天交互,可直接渲染Markdown、筛选表格、阅览PDF与PPT。Agent还能通过内置浏览器用JavaScript控制网页,用户可边看边标注,无需切屏。Jason经常在侧边面板中同时打开Storybook审阅UI组件、用Remotion Studio做动画、用Slidev做演示文稿。他最喜欢的交付形式,是一个包含JS和CSS的单文件index.html,无需部署,无需服务器。

他还会将成功的流程打包成“Connectors”和“Skills”模版,下次Codex不用重新学习,直接调用即可。最新的远程能力补全,使得电脑锁屏后Codex能继续工作,手机端也可实时查看、审批甚至接管任务。

客观来看,Jason Liu的这些实践展示了一个AI工作流的新范式:机器不再是简单的问答机,而是处理多步骤、跨平台、长周期任务的可靠节点。当AI可以持续接管工作时,人类的角色将从“执行者”转变为“监督者”和“策略制定者”。这种转变不仅提升了个人效率,更可能从根本上重构软件开发与协同工作的流程。

当然,这种深度依赖也带来了新的挑战。如何保证Agent在复杂验证闭环外的决策安全性?当个人将所有工作流数据托管于本地文件系统时,数据同步与备份将变得更为重要。此外,对于普通开发者而言,复现这种高度定制化的玩法仍存在一定门槛。但无论如何,Codex的这次进化,无疑为AI从业者和开发者指明了前行的方向:未来的竞争,将是关于如何构建更智能、更持久、更具自主性的AI工作流。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 9小时前
下一篇 7小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!