卍 花径不曾缘客扫, 蓬门今始为君开. 古佛拈花方一笑, 痴人说梦已三生!

总结一下 Claude Fable 5 的省钱技巧

AI 拈花古佛 194℃ 0评论 繁體

总结一下 Claude Fable 5 的省钱技巧

所有人都对 Fable 5的价格破防了,虽然标价是Opus的两倍,但实际上确是翻了好几番。攒了几个省钱实操技巧。如下:

1. 切模型时手动检查 thinking level
从 Opus 4.7/4.8 Extra High 切到 Fable 时,thinking 档位不会自动重置,会沿用 Extra High。切换后第一件事是把 thinking level 调到任务实际需要的档位。推理档位越高,token 烧得越快。

2. 主动压缩,而不是被动等爆
大项目做到一个阶段就压缩一次会话(如用 /graphify 或 /compact),然后继续。只压一次、压在收尾点,别频繁压。
别让一个会话无限长,历史越长,每条新消息的实际成本越高。

3. 对 agentic 任务做好扇出预算
一个复杂请求,不是只跑一次就给你答案。一个复杂的 agentic 任务会发散成很多次模型调用,规划 多个子代理 工具循环 重试 自检,极有可能跑出到千万级 token。
所以在跑大型 agentic 任务前,先用便宜模型把任务拆解、范围定清楚,再让 Fable 执行,减少它自己摸索的轮数。

4. 默认用Sonnet/Opus,Fable 只留给复杂任务
日常问答、简单改码走 Haiku/Sonnet/Opus,只有真正复杂的多步任务才切 Fable。切换前先问自己,这个任务 Opus 4.8 干不了吗?干得了就别上 Fable(单价直接省一半)

5. 盯紧用量节奏
重度 agentic 使用下,5 小时窗口可能几十分钟就烧完,有人观察到约每分钟 2% 的消耗速度。开长任务前看一眼剩余额度,把最烧 token 的任务安排在窗口刷新后。

6. 留意 6 月 22 日这个时间点
Fable 包含在订阅计划里可能只到 6/22,之后需要 usage credits。建议趁包含期把最重的活干完,6/22 前自己去官方公告核实一下具体政策,别只信网上宣言。

一个总的判断原则是:
Fable 的单价只是表面,真正的成本来自它想得太多、跑得久。所以省钱的核心不是少用,而是让它只在刀刃上运转。
便宜模型负责日常和准备工作,Fable 负责真正需要那个智力天花板的部分。

转载请注明:拈花古佛 » 总结一下 Claude Fable 5 的省钱技巧

喜欢 (0)
用户头像
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址