DeepSeek V4:不是最强,但它承载了太多
今天,等了快一年的 DeepSeek V4,终于发布了。说真的,这个模型我期待太久了。不只是我,你只要看看网上的谣言有多少就知道了,从几个月前开始到今天,几乎每隔一两周都有人在说 DeepSeek V4 要来了,但真的来了之后,我依然非常激动。
围绕 AI 工作流、Agent 设计和内容系统的每日更新。
今天,等了快一年的 DeepSeek V4,终于发布了。说真的,这个模型我期待太久了。不只是我,你只要看看网上的谣言有多少就知道了,从几个月前开始到今天,几乎每隔一两周都有人在说 DeepSeek V4 要来了,但真的来了之后,我依然非常激动。
终于来了!GPT IMAGE 2 正式发布!这可能是过去几个月最值得说的一个新模型!
Kimi K2.6 昨天正式发布并开源。我翻了一圈开发者的实测反馈,也自己上手测了一下。总结来说,K2.6 是国产开源模型里非常值得鼓励的一步,比起 K2.5 进步很大。
browser-use 是目前最火的 AI 浏览器自动化 Skill。它做的事很简单:让 AI 替你操作浏览器。
前两天,Github 上出了一个开源项目叫 video-use,这是一个帮你自动剪辑视频的 Skill,只要用自然语言就能做视频剪辑。
前一段时间 OpenClaw 爆火的一大贡献是让人们都知道了 AI 可以自己操作电脑。比如让 AI 自己打开微信,找到一个联系人,把消息敲出来,点发送,全程你就在旁边看着。其实这背后的核心能力叫做 Computer Use。这两天 Claude Opus 4.7 和 OpenAI Codex App 都在增强这方面的能力。
Claude 可以说是目前世界上最重要的模型,没有之一。而就在昨天,Claude Opus 4.7 正式发布,今天的日课我就详细给大家解析一下这个新模型到底怎么样。官方给的数据很漂亮,但一线用户实测下来,喜忧参半。
昨天看到一个我觉得非常好的分享,讲的是如何让自己团队 99.5% 的人用好 AI。其实这个问题我听过很多次了,AI 工具买了,培训也搞了,但团队就是用不起来。用的人还是那几个,大部分人试了两下就回到老办法了。钱花了,效果没有。这个问题在国内公司里特别普遍。不是工具不行,也不是人不行,是推的方式不对。
Anthropic 前几天发了一篇官方博客,核心就一句话:让便宜模型跑日常任务,只在遇到难题时请教贵模型。这个思路叫「顾问策略」(Advisor Strategy),效果出乎意料地好,而且普通人在现有的智能体平台里就能实现。