DAILY LESSON / 2026-02-16

别人除夕放鞭炮，阿里除夕放模型！

马年到来前最后一天，C哥被迫加班给大家做日课，必须要加班，因为这可能是开源大模型真正意义上打到了闭源模型的家门口。就在今天，千问 Qwen3.5-Plus 正式开源。它不是再某个单项跑分追上来了，而是综合能力全面媲美 GPT-5.2 和 Gemini-3-Pro 这个级别的第一梯队。

AIAI模型

作者：C 哥·C哥介绍 →

而且，完全开源，免费下载，免费商用。

更离谱的是，这玩意API价格每百万Token输入0.8元，是GPT-5.2的十五分之一，Gemini-3-Pro的十八分之一。

性能顶级，开源免费，价格还只有闭源的零头。这三件事同时出现在一个模型上，在大模型行业几乎前所未见。

我看了一下他们的报告，这次Qwen 3.5 Plus 的意义，不是刷榜，而是对大模型底层架构做了一次真正的重写。

首先，这次的Qwen 3.5 Plus像一个精锐组织，每次执行任务只派最合适的专家小队出手，其他人待命。假如把千问比作1000人的公司，那么每次只需要不到5个人干活就能完成任务。结果是同样的活，千问干得一样好，但成本只有原来的一个零头。

你可能会觉得这还不简单，不就是少派点人嘛，偷懒谁不会啊。但其实这件事还真不容易。想偷懒又想不影响结果，太难了。为了这件事，千问团队自研了一个门控注意力机制，直接拿了2025年的NeurIPS最佳论文奖。这个技术让模型在处理信息时学会了取舍，重要的精读，不重要的略读，最终实现了不到5% 激活参数的极致效率。

别人除夕放鞭炮，阿里除夕放模型！

视频号

抖音

小红书

公众号

Bilibili

X (Twitter)

相关推荐

GPT IMAGE 2 来了，AI 生图正式进入下一个阶段

Gemini 3.1 Pro：谷歌把推理能力翻了一倍

阿里Qwen-Image-2.0：AI画图的中文能力，终于被拉满了

QoderWork 免费一个月，真正的差异化在哪里