DAILY LESSON / 2026-03-04

我用哪些大模型,以及怎么买到便宜 token

很多圈友问我,我是怎么选模型的,以及怎么选到便宜的模型渠道。其实真正的问题是:你在为什么场景花钱。场景不同,模型选择完全不同。

AI模型AI编程GeminiOpenAI软件工具超级个体干货

作者:C 哥·C哥介绍 →

很多圈友问我,我是怎么选模型的,以及怎么选到便宜的模型渠道。其实真正的问题是:你在为什么场景花钱。场景不同,模型选择完全不同。

平时编程和使用 Skill,我一般我主力用 Claude Sonnet 4.6。Sonnet 在代码理解、长任务执行、工具调用上很稳,你在 Claude Code、OpenCode、OpenClaw 里跑复杂任务,能明显感觉到差距。但就在刚刚,GPT-5.4 已经推出,如果效果不错,可能有些任务我会切到 GPT 5.4。

内容创作方面,我的主力是 Claude Opus 4.6。Opus 的核心优势是逻辑更顺、更有人味,以及长篇文章内部的逻辑框架更清晰和通顺。你让它写长文、写观点、写口播稿,段落之间的气口、转折、节奏都更自然,不是那种机械拼装的感觉。

多模态我最常用 Gemini 3.1 Pro。在同级别旗舰模型里,它相对便宜。看截图、看页面、识别图片、理解产品界面,Gemini 确实顺手。现在很多工作,尤其是产品、运营、设计、自媒体,已经不是单纯文字任务了。多模态能力越来越重要。

日常生活种的问答,我会用豆包。生活里很多问题,要的是方便、反应快、随手能问,而且豆包有个很方便的语音和视频通话模式,且完全免费,这个还挺好用的。比如在国外直接用视频通话让豆包指路、买菜购物等。

说完用什么,再说怎么省钱。省钱的核心不是找便宜渠道,而是改用法。

第一个是缓存机制。不是所有平台都支持,你得看具体平台的说明。如果支持,效果很明显。如果你长期重复发送同一套提示词、项目背景、长文档前缀,缓存能让输入成本下降九成。但如果你每次请求都是全新内容,缓存就没啥用。

第二个是模型分工。不要让 Opus 4.6 去做简单整理、分类、改写,不要让顶尖编程模型去回答大量常识问题。便宜模型做收集、筛选、分类、初稿,贵模型做最终成稿、复杂决策、关键编码、最后把关。

第三个是场景匹配。别用大炮打蚊子。日常闲聊、简单问答、生活咨询,真的不需要上最贵的模型。