两个新模型来了,一个治好了 ChatGPT 的说教病,一个主打便宜快
3月3日,OpenAI 和谷歌同一天各发了一个新模型。OpenAI 发的是 GPT-5.3 Instant,谷歌发的是 Gemini 3.1 Flash-Lite。两个定位完全不同,但都有一个共同点:官方宣传和实际数据之间,有些值得说清楚的地方。
3月3日,OpenAI 和谷歌同一天各发了一个新模型。OpenAI 发的是 GPT-5.3 Instant,谷歌发的是 Gemini 3.1 Flash-Lite。两个定位完全不同,但都有一个共同点:官方宣传和实际数据之间,有些值得说清楚的地方。
先说 GPT-5.3 Instant。
这个模型是 ChatGPT 默认模型的一次更新,替换掉了 GPT-5.2 Instant。它不是一次能力上的大跃进,而是一次体验上的集中整改。
整改的核心是什么?就是把 ChatGPT 那股让人抓狂的说教劲儿给压下去。
你可能有过这种体验:问 ChatGPT 一个很普通的问题,它先来一段"首先,我想说,你并没有什么问题……",或者"停一下,深呼吸……",明明你只是在查个信息,它却把你当成了需要心理疏导的对象。这种风格在 GPT-5.2 Instant 时期达到了顶峰,Reddit 上有大量用户吐槽,甚至有人因此取消了订阅。
GPT-5.3 Instant 的改进就是针对这个。OpenAI 官方在 X 上发的那句话很直接:"更准确,更少尴尬。我们听到了你们的反馈。"
具体改了什么?三件事。
第一,减少不必要的拒答。之前 GPT-5.2 Instant 会拒绝一些本来可以安全回答的问题,或者在回答前先来一大段"我需要说明我的边界……"。新版本直接进入回答,不再绕弯子。
第二,改善联网搜索的整合质量。之前的模型有时候会把搜索结果直接堆砌出来,像一个链接列表。新版本能更好地把搜索结果和自身知识融合,给出有背景、有逻辑的回答。
第三,幻觉率下降。在医疗、法律、金融这类高风险领域,联网模式下幻觉率降低了26.8%,不联网时降低了19.7%。在用户真实反馈的错误样本上,联网模式下降了22.5%。
这些数字是 OpenAI 内部评测的结果,目前还没有第三方独立机构的数据,Artificial Analysis 和 Arena.ai 都还没有跑出来。
但有一个数据值得单独说。