
所有人都对 Fable 5的价格破防了,虽然标价是Opus的两倍,但实际上确是翻了好几番。攒了几个省钱实操技巧。如下:
1. 切模型时手动检查 thinking level
从 Opus 4.7/4.8 Extra High 切到 Fable 时,thinking 档位不会自动重置,会沿用 Extra High。切换后第一件事是把 thinking level 调到任务实际需要的档位。推理档位越高,token 烧得越快。
2. 主动压缩,而不是被动等爆
大项目做到一个阶段就压缩一次会话(如用 /graphify 或 /compact),然后继续。只压一次、压在收尾点,别频繁压。
别让一个会话无限长,历史越长,每条新消息的实际成本越高。
3. 对 agentic 任务做好扇出预算
一个复杂请求,不是只跑一次就给你答案。一个复杂的 agentic 任务会发散成很多次模型调用,规划 多个子代理 工具循环 重试 自检,极有可能跑出到千万级 token。
所以在跑大型 agentic 任务前,先用便宜模型把任务拆解、范围定清楚,再让 Fable 执行,减少它自己摸索的轮数。
4. 默认用Sonnet/Opus,Fable 只留给复杂任务
日常问答、简单改码走 Haiku/Sonnet/Opus,只有真正复杂的多步任务才切 Fable。切换前先问自己,这个任务 Opus 4.8 干不了吗?干得了就别上 Fable(单价直接省一半)
5. 盯紧用量节奏
重度 agentic 使用下,5 小时窗口可能几十分钟就烧完,有人观察到约每分钟 2% 的消耗速度。开长任务前看一眼剩余额度,把最烧 token 的任务安排在窗口刷新后。
6. 留意 6 月 22 日这个时间点
Fable 包含在订阅计划里可能只到 6/22,之后需要 usage credits。建议趁包含期把最重的活干完,6/22 前自己去官方公告核实一下具体政策,别只信网上宣言。
一个总的判断原则是:
Fable 的单价只是表面,真正的成本来自它想得太多、跑得久。所以省钱的核心不是少用,而是让它只在刀刃上运转。
便宜模型负责日常和准备工作,Fable 负责真正需要那个智力天花板的部分。
转载请注明:拈花古佛 » 总结一下 Claude Fable 5 的省钱技巧