一个插件,让 AI 智能体住在你的网页
阿里开源了一个叫 Page-Agent 的项目,GitHub 上 18.9K star,装一个浏览器扩展,就能用自然语言直接操控任何网页。不需要后端服务器、不需要截图 OCR,纯前端 Agent 直接上阵。
围绕 AI 工作流、Agent 设计和内容系统的每日更新。
阿里开源了一个叫 Page-Agent 的项目,GitHub 上 18.9K star,装一个浏览器扩展,就能用自然语言直接操控任何网页。不需要后端服务器、不需要截图 OCR,纯前端 Agent 直接上阵。
OpenAI 给 Codex 加了一个新功能叫 Record & Replay。你不用写提示词描述流程,直接在电脑上做一遍,Codex 看着你操作,然后自动把它变成一个可复用的 Skill。
Hermes 接入飞书后,发的表格、代码块全是原始 Markdown 源码,看得人一脸懵。这不是 Hermes 的问题,是飞书的旧消息格式搞不定。一条指令发给 Hermes,一分钟解决。
昨天,支付宝上线了AI模式「阿宝」,目前还在邀测阶段,一码难求。但这事值得聊,因为它背后藏着支付宝十年未解的战略困局,和一场正在爆发的AI入口争夺战。
MuleRun 的核心是一台 7×24 小时在线的专属云端电脑。你可以让它在半夜跑工作流、主动监控竞品价格、通过Telegram随时汇报。人不在,活照干。
前两天腾讯技术工程发了一篇文章,《如何写好 Skill:一份终极实战经验手册》,里面有大量实操干货。
Claude Code 的创造者 Boris Cherny 说,他现在不再给 Claude 写提示词了,改写 loops。这听起来像一句随口说的金句,但背后藏着一个关于 AI 工作方式的根本性转变:从『问 AI 要答案』变成『让 AI 自己跑』。
从合规对账到调研分析,从交易系统改造到量化因子挖掘,AI 编程智能体结合 Skill 和 MCP 协议,正在解决金融行业最日常也最头疼的那些具体问题。
用 AI 做事的人,大概率都遇到过同一种抓狂:你让它帮你改个东西,它不只改了你说的那个点,还顺手把你之前写的内容也改了。你要检查半天才能搞清楚它到底动了哪些地方。更离谱的是,你让它做一个简单的功能,它给你整了一大套花里胡哨的架构,明明几步就能搞定的事,它硬是绕了一大圈。
Google I/O 2026 刚刚开完。如果你没时间看三个小时的发布会,这篇文章帮你把重点理清楚。