当开发者们还在为Claude Fable 5两倍于Opus 4.8的token单价发愁时,意外发现将Fable 5的努力程度调至最低的low档后,模型不仅性能未减,反而token消耗大幅减少。在SWE - bench Pro测试中,哪怕是最低档位,Fable 5得分75.0,也压过了Opus 4.8开到最强xhigh档的68.6分。
Fable 5定价每百万输入token 10美元、输出50美元,是Opus 4.8的两倍。但Claude Code之父Boris Cherny解释,Fable完成同一个任务平均用的token更少,因为它更聪明、更高效。在一些复杂任务上,纠错动作少,浪费的token也就少,从而砍掉了隐性成本。例如在shortcut电子表格任务测试中,Fable 5在所有effort档位都跑赢Opus 4.8,整体完成速度快25% - 30%。
在过去一天多时间里,Fable 5在各大评测榜单中表现出色。在Artificial Analysis智能指数中以64.9分排名第一,领先GPT - 5.5约5分;在人类最后的测试上,成绩比第二名高出7个百分点以上;在arena.ai的Agent榜单、FrontierCode等评测中均登顶榜首,编程能力也远超其他模型。
Fable 5带着安全分类器上线,涉及敏感请求时系统会自动切换到Opus 4.8并按其价格计费,触发率不到5%的会话。同时,当前免费使用窗口限时至6月22日,之后将消耗用量积分,且使用需开启30天数据保留以满足安全监控要求。
编辑观点:Claude Fable 5虽单价高,但在复杂任务中展现出省钱高效的优势,且评测成绩优异。不过使用限制需关注,未来在复杂任务场景或有较大市场潜力。