DAILY LESSON / 2026-06-20

Codex 学会「看一遍就会」了

OpenAI 给 Codex 加了一个新功能叫 Record & Replay。你不用写提示词描述流程,直接在电脑上做一遍,Codex 看着你操作,然后自动把它变成一个可复用的 Skill。

AIAI动态OpenAIAI智能体AI编程Skill软件工具AI工作流

作者:C 哥·C哥介绍 →

6月18号,OpenAI 给 Codex 加了一个新功能,叫 Record & Replay。

翻译过来就是「录制与回放」。用法很简单:你在电脑上把一个重复性的工作流做一遍,Codex 在后台全程看着,录完之后自动帮你生成一个可复用的 Skill。下次再干同样的活儿,一句话就能让它替你跑完。

听起来像录屏?其实不是。它录的不是鼠标点了哪里,而是你操作的「意图」——哪些步骤是固定的,哪些字段每次会变,做完之后怎么验证结果对不对。

怎么用?三步就搞定

第一步,在 Codex 的 Plugins 面板里选「Record a skill」。第二步,按平常的方式把任务做完——比如上传一个视频到 YouTube,填标题、贴描述、选封面、设可见性、保存草稿。第三步,停止录制,Codex 会自动分析整个过程,生成一份 SKILL.md 文件。

这个文件里写清楚了:这套流程什么时候用、需要哪些输入、按什么步骤走、做完怎么检查。生成的 Skill 是可以编辑的,你觉得哪步不对,直接改。

下次再用的时候,新开一个对话,告诉 Codex 用这个 Skill,把这次的具体值喂给它——比如「用视频发布 Skill,上传这个视频,封面用第二张,先存草稿别发布」。

Codex 调用的不只是一个 Skill 文件。它干活的工具箱包括 Computer Use(操作桌面应用)、浏览器操作、还有你已经安装的各种插件——Slack、Gmail、Notion、Salesforce 这些都可以一起上。一次录制,多种工具联动。

真正的变化:从写提示词到做示范

这个功能有意思的地方在于,它背后藏着一个挺重要的变化:AI 智能体的交互入口,可能正在从「写提示词」转向「做示范」。

你想一下,我们现在跟 AI 智能体配合,最习惯的方式是什么?打字。你用自然语言告诉它要干嘛,它能理解、能执行。这个模式对很多任务来说已经很好用了。

但有些工作,用文字去描述反而是最费劲的方式。

比如上传一个视频。你当然可以写一大段提示词——「打开 YouTube 后台,点创建按钮,选上传视频,在弹出的文件选择器里选桌面上的视频文件,等待上传完成,在标题栏填入……」——写到一半你自己都不想写了。而且网页是会变的,按钮位置会调,弹窗时有时无。

自己做的时候不觉得难,因为已经成了肌肉记忆。难的是把肌肉记忆翻译成一段完整、无歧义的文字。

Record & Replay 绕开了这一步。它不要求你先写说明书,而是让你先做一遍。

说实话,这个思路跟传统 RPA(机器人流程自动化)完全不一样。RPA 录的是像素坐标和 CSS 选择器,界面一改就崩。Codex 这边生成的是一个用自然语言写的 Skill 文件,它靠模型的理解能力来适配当前屏幕上的真实状态,不是硬点到底。

做得好的话,同一套流程下次界面改版了、字段换位置了,它还能按同一个目标完成。不确定的时候停下来问你,而不是闷头点错。

Skill 写规则,Replay 记动作

过去半年多,我们圈子里聊 Skill 聊得很多。Skill 的价值是把一套流程的规则、约束、检查清单写下来——比如文章怎么检查、代码改完要跑哪些测试、哪些步骤必须人工确认。