Computer Use 才是今年最被低估的 AI 能力
前一段时间 OpenClaw 爆火的一大贡献是让人们都知道了 AI 可以自己操作电脑。比如让 AI 自己打开微信,找到一个联系人,把消息敲出来,点发送,全程你就在旁边看着。其实这背后的核心能力叫做 Computer Use。这两天 Claude Opus 4.7 和 OpenAI Codex App 都在增强这方面的能力。
AIAI动态AI模型AI工作流办公自动化ChatGPTOpenAI
围绕 AI 工作流、Agent 设计和内容系统的每日更新。
前一段时间 OpenClaw 爆火的一大贡献是让人们都知道了 AI 可以自己操作电脑。比如让 AI 自己打开微信,找到一个联系人,把消息敲出来,点发送,全程你就在旁边看着。其实这背后的核心能力叫做 Computer Use。这两天 Claude Opus 4.7 和 OpenAI Codex App 都在增强这方面的能力。
OpenAI 昨天发布了 GPT-5.4,这是他们整合了推理、编码和计算机控制能力的新一代旗舰模型。作为日课,我不打算写那种吸引眼球的新闻稿,而是基于权威数据和实测,客观分析这个模型的真实能力。
很多圈友问我,我是怎么选模型的,以及怎么选到便宜的模型渠道。其实真正的问题是:你在为什么场景花钱。场景不同,模型选择完全不同。
3月3日,OpenAI 和谷歌同一天各发了一个新模型。OpenAI 发的是 GPT-5.3 Instant,谷歌发的是 Gemini 3.1 Flash-Lite。两个定位完全不同,但都有一个共同点:官方宣传和实际数据之间,有些值得说清楚的地方。
前天晚上,AI 圈发生了一件非常罕见的事:Anthropic 和 OpenAI 在同一天、几乎同一时刻,各自发布了自家最强的模型。Anthropic 发了 Claude Opus 4.6,OpenAI 发了 GPT-5.3-Codex。两家前后只差了 27 分钟。