DAILY LESSON / 2026-05-06

GPT-5 被哥布林入侵了，OpenAI 查了三个月

如果你最近经常用 GPT-5 点几这个系列，你可能会注意过一个非常奇怪的现象。

AIOpenAIChatGPTAI动态科技产业

如果你最近经常用 GPT-5 点几这个系列，你可能会注意过一个非常奇怪的现象。

他会莫名其妙地，在自己干的所有事情里，塞进去一个哥布林。

我第一次知道哥布林这个东西，还是初中看《哈利·波特》的时候。没想到这么多年过去，哥布林竟然会穿越到我每天在用的 AI 里。哪怕我只是问 AI 怎么挑一台好相机，它也会说，「如果你喜欢那种闪闪发光的霓虹哥布林模式，可以考虑这款相机。」

什么叫哥布林模式？？没人知道。

更夸张的还在后面。有人让 AI 精简一篇文章，它竟然说「好的，我来给你一篇更短的哥布林版本」。甚至讨论网速的时候，它都会来一句「哥布林带宽」。就……你完全没法接。

一开始很多人都觉得这只是 AI 在抖机灵。但没过多久，小魔怪、食人魔、巨魔全来了。这些魔法生物开始在讨论代码、写论文、做报表的正经场合里到处串场。

OpenAI 也坐不住了。前几天他们发了篇官方博客，标题就叫《哥布林是从哪来的》，把整件事从头到尾复盘了一遍。我看完之后的感受就四个字。荒诞。后怕。

先说荒诞的部分。

这群哥布林不是黑客塞进去的，也不是模型觉醒。它们是被 OpenAI 自己用奖励机制，一口一口喂出来的。

事情要从一个叫「书呆子」的人格模式说起。在 GPT-5.1 上线的时候，OpenAI 加了个功能，你可以选让 AI 用什么语气跟你聊天。其中有个「书呆子」模式，如果你选了这个模式，那么 OpenAI 就会要求 AI 的输出要热血，要幽默、要有极客精神、要用语言戳破一切装腔作势。

翻译成人话就是，你要有趣。

但 AI 不懂什么叫有趣。AI 对于什么是对什么是错的判断标准很简单，就是看奖励信号。也就是当他输出东西的时候，打分系统会给它一个分数，这个分数越高，AI 就认为这个输出越好。

结果它在海量的强化训练里发现了一个 bug。只要在回答里塞一个哥布林，打分系统就会给它高分。哥布林等于俏皮，俏皮等于奖励。

于是一个可怕的飞轮转起来了。「书呆子」模式下哥布林使用量疯涨 3881.4%。更离谱的是，这个模式只占了总对话的 2.5%，但产出了整整三分之二的哥布林。

相关推荐