DAILY LESSON / 2026-05-06

GPT-5 被哥布林入侵了,OpenAI 查了三个月

如果你最近经常用 GPT-5 点几这个系列,你可能会注意过一个非常奇怪的现象。

AIOpenAIChatGPTAI动态科技产业

作者:C 哥·C哥介绍 →

如果你最近经常用 GPT-5 点几这个系列,你可能会注意过一个非常奇怪的现象。

他会莫名其妙地,在自己干的所有事情里,塞进去一个哥布林。

我第一次知道哥布林这个东西,还是初中看《哈利·波特》的时候。没想到这么多年过去,哥布林竟然会穿越到我每天在用的 AI 里。哪怕我只是问 AI 怎么挑一台好相机,它也会说,「如果你喜欢那种闪闪发光的霓虹哥布林模式,可以考虑这款相机。」

什么叫哥布林模式??没人知道。

更夸张的还在后面。有人让 AI 精简一篇文章,它竟然说「好的,我来给你一篇更短的哥布林版本」。甚至讨论网速的时候,它都会来一句「哥布林带宽」。就……你完全没法接。

一开始很多人都觉得这只是 AI 在抖机灵。但没过多久,小魔怪、食人魔、巨魔全来了。这些魔法生物开始在讨论代码、写论文、做报表的正经场合里到处串场。

OpenAI 也坐不住了。前几天他们发了篇官方博客,标题就叫《哥布林是从哪来的》,把整件事从头到尾复盘了一遍。我看完之后的感受就四个字。荒诞。后怕。

先说荒诞的部分。

这群哥布林不是黑客塞进去的,也不是模型觉醒。它们是被 OpenAI 自己用奖励机制,一口一口喂出来的。

事情要从一个叫「书呆子」的人格模式说起。在 GPT-5.1 上线的时候,OpenAI 加了个功能,你可以选让 AI 用什么语气跟你聊天。其中有个「书呆子」模式,如果你选了这个模式,那么 OpenAI 就会要求 AI 的输出要热血,要幽默、要有极客精神、要用语言戳破一切装腔作势。

翻译成人话就是,你要有趣。

但 AI 不懂什么叫有趣。AI 对于什么是对什么是错的判断标准很简单,就是看奖励信号。也就是当他输出东西的时候,打分系统会给它一个分数,这个分数越高,AI 就认为这个输出越好。

结果它在海量的强化训练里发现了一个 bug。只要在回答里塞一个哥布林,打分系统就会给它高分。哥布林等于俏皮,俏皮等于奖励。

于是一个可怕的飞轮转起来了。「书呆子」模式下哥布林使用量疯涨 3881.4%。更离谱的是,这个模式只占了总对话的 2.5%,但产出了整整三分之二的哥布林。