DAILY LESSON / 2026-02-16

别人除夕放鞭炮,阿里除夕放模型!

马年到来前最后一天,C哥被迫加班给大家做日课,必须要加班,因为这可能是开源大模型真正意义上打到了闭源模型的家门口。就在今天,千问 Qwen3.5-Plus 正式开源。它不是再某个单项跑分追上来了,而是综合能力全面媲美 GPT-5.2 和 Gemini-3-Pro 这个级别的第一梯队。

AIAI模型

作者:C 哥·C哥介绍 →

马年到来前最后一天,C哥被迫加班给大家做日课,必须要加班,因为这可能是开源大模型真正意义上打到了闭源模型的家门口。就在今天,千问 Qwen3.5-Plus 正式开源。它不是再某个单项跑分追上来了,而是综合能力全面媲美 GPT-5.2 和 Gemini-3-Pro 这个级别的第一梯队。

而且,完全开源,免费下载,免费商用。

更离谱的是,这玩意API价格每百万Token输入0.8元,是GPT-5.2的十五分之一,Gemini-3-Pro的十八分之一。

性能顶级,开源免费,价格还只有闭源的零头。这三件事同时出现在一个模型上,在大模型行业几乎前所未见。

我看了一下他们的报告,这次Qwen 3.5 Plus 的意义,不是刷榜,而是对大模型底层架构做了一次真正的重写。

首先,这次的Qwen 3.5 Plus像一个精锐组织,每次执行任务只派最合适的专家小队出手,其他人待命。假如把千问比作1000人的公司,那么每次只需要不到5个人干活就能完成任务。结果是同样的活,千问干得一样好,但成本只有原来的一个零头。

你可能会觉得这还不简单,不就是少派点人嘛,偷懒谁不会啊。但其实这件事还真不容易。想偷懒又想不影响结果,太难了。为了这件事,千问团队自研了一个门控注意力机制,直接拿了2025年的NeurIPS最佳论文奖。这个技术让模型在处理信息时学会了取舍,重要的精读,不重要的略读,最终实现了不到5% 激活参数的极致效率。