DAILY LESSON / 2026-03-04

我用哪些大模型，以及怎么买到便宜 token

很多圈友问我，我是怎么选模型的，以及怎么选到便宜的模型渠道。其实真正的问题是：你在为什么场景花钱。场景不同，模型选择完全不同。

AI模型AI编程GeminiOpenAI软件工具超级个体干货

很多圈友问我，我是怎么选模型的，以及怎么选到便宜的模型渠道。其实真正的问题是：你在为什么场景花钱。场景不同，模型选择完全不同。

平时编程和使用 Skill，我一般我主力用 Claude Sonnet 4.6。Sonnet 在代码理解、长任务执行、工具调用上很稳，你在 Claude Code、OpenCode、OpenClaw 里跑复杂任务，能明显感觉到差距。但就在刚刚，GPT-5.4 已经推出，如果效果不错，可能有些任务我会切到 GPT 5.4。

内容创作方面，我的主力是 Claude Opus 4.6。Opus 的核心优势是逻辑更顺、更有人味，以及长篇文章内部的逻辑框架更清晰和通顺。你让它写长文、写观点、写口播稿，段落之间的气口、转折、节奏都更自然，不是那种机械拼装的感觉。

多模态我最常用 Gemini 3.1 Pro。在同级别旗舰模型里，它相对便宜。看截图、看页面、识别图片、理解产品界面，Gemini 确实顺手。现在很多工作，尤其是产品、运营、设计、自媒体，已经不是单纯文字任务了。多模态能力越来越重要。

日常生活种的问答，我会用豆包。生活里很多问题，要的是方便、反应快、随手能问，而且豆包有个很方便的语音和视频通话模式，且完全免费，这个还挺好用的。比如在国外直接用视频通话让豆包指路、买菜购物等。

说完用什么，再说怎么省钱。省钱的核心不是找便宜渠道，而是改用法。

第一个是缓存机制。不是所有平台都支持，你得看具体平台的说明。如果支持，效果很明显。如果你长期重复发送同一套提示词、项目背景、长文档前缀，缓存能让输入成本下降九成。但如果你每次请求都是全新内容，缓存就没啥用。

第二个是模型分工。不要让 Opus 4.6 去做简单整理、分类、改写，不要让顶尖编程模型去回答大量常识问题。便宜模型做收集、筛选、分类、初稿，贵模型做最终成稿、复杂决策、关键编码、最后把关。

第三个是场景匹配。别用大炮打蚊子。日常闲聊、简单问答、生活咨询，真的不需要上最贵的模型。

我用哪些大模型，以及怎么买到便宜 token

视频号

抖音

小红书

公众号

Bilibili

X (Twitter)

相关推荐

两个新模型来了，一个治好了 ChatGPT 的说教病，一个主打便宜快

Windows用户用AI编程，为什么一定要装WSL？

小白用 AI 编程，你只需要搞懂这五个概念

Opus 4.6 和 GPT-5.3-Codex 同日发布，到底谁更强？