Ralph 循环:让 AI 编程工具自己跑完所有任务
自从大规模开始让智能体 + Skill 干活,有一个事情会非常诱人,那就是让 AI 一口气把所有任务都做完,甚至干活可以一晚上不停。你当然可以一直给 AI 下指令,但大多数时候一个任务最多也就执行个十几分钟到一两个小时就停了,这是因为 AI 的上下文窗口有限,时间太长之后,AI 就干不太动了,质量直线下降。关于上下文长度的含义,在视频课和日课里都提过,大家可以去看。
围绕 AI 工作流、Agent 设计和内容系统的每日更新。
自从大规模开始让智能体 + Skill 干活,有一个事情会非常诱人,那就是让 AI 一口气把所有任务都做完,甚至干活可以一晚上不停。你当然可以一直给 AI 下指令,但大多数时候一个任务最多也就执行个十几分钟到一两个小时就停了,这是因为 AI 的上下文窗口有限,时间太长之后,AI 就干不太动了,质量直线下降。关于上下文长度的含义,在视频课和日课里都提过,大家可以去看。
Kimi K2.6 昨天正式发布并开源。我翻了一圈开发者的实测反馈,也自己上手测了一下。总结来说,K2.6 是国产开源模型里非常值得鼓励的一步,比起 K2.5 进步很大。
browser-use 是目前最火的 AI 浏览器自动化 Skill。它做的事很简单:让 AI 替你操作浏览器。
前两天,Github 上出了一个开源项目叫 video-use,这是一个帮你自动剪辑视频的 Skill,只要用自然语言就能做视频剪辑。
昨天看到一个我觉得非常好的分享,讲的是如何让自己团队 99.5% 的人用好 AI。其实这个问题我听过很多次了,AI 工具买了,培训也搞了,但团队就是用不起来。用的人还是那几个,大部分人试了两下就回到老办法了。钱花了,效果没有。这个问题在国内公司里特别普遍。不是工具不行,也不是人不行,是推的方式不对。
Anthropic 前几天发了一篇官方博客,核心就一句话:让便宜模型跑日常任务,只在遇到难题时请教贵模型。这个思路叫「顾问策略」(Advisor Strategy),效果出乎意料地好,而且普通人在现有的智能体平台里就能实现。
最近 Hermes Agent 越来越火了。我已经给圈友们把它的完整的文档做成了十几万字的中文版,包括完整的功能详解、命令手册和系统架构,成长圈朋友可以到这里去看:https://czq.baiyan.tech/courses-htmls/hermes-agent-docs-zh/index.html。
给大家推荐一个非常不错的、值得学习的 Skill 制作案例。前几天,公众号「数字生命卡兹克」的作者卡兹克,把自己真正在用的内容创作 Skill 完整开源了。
今天给大家更新一大批成长圈专属的 Skill,和之前给圈友们的 Skill 合并在一起,大家现在就可以下载使用了。先说这次变化最大的地方,安装方式全面升级了。