Token指数连跌,引发AI交易链震荡
一张由Silicon Data统计的LLM Token支出指数图,点燃了AI增长和账单失控的焦虑。6月11日,该指数已连跌7天,创下今年1月以来最长连跌纪录;过去12天里,有11天是下跌的。这个指数衡量的是全市场每使用100万枚Token平均支付多少钱,可理解为市场愿意为AI“付多少钱”的晴雨表。它自去年12月以来翻了一番以上,并在2026年5月前持续攀升,但近期急转直下,触动的是整条AI交易链。
美国宏观策略师Andreas Steno Larsen在6月9日称这张图为“当前全市场最应关注的一张图”,并警告:如果Token定价持续走弱,本轮周期中从内存到更广泛的硬件及数据中心交易可能宣告结束。不过,华尔街的看法更为复杂和多面,Token定价走弱可能并非单纯的AI需求见顶。
指数下跌原因成谜,需求见顶还是结构下沉?
这张图不能简单读成“AI没人用了”,它量的是每百万Token的加权平均价格,反映的是用户在用什么价位的模型。通过简单计算可知,指数下跌有两种解释:一是需求真的在萎缩;二是用量在爆炸,但用户在主动向低价模型迁移。这正是当前争论的核心:指数下跌,到底是需求见顶,还是用量结构下沉?
Citadel证券发布《Tokenomics》报告认为,AI落地的核心约束已从“模型能力”转向“成本与算力稀缺”,用户正加速向廉价模型迁移。摩根大通TMT分析师Mark Schilsky则在6月11日把近期市场讨论概括为:“AI账单失控了”,同时该行认为当前的Token支出乱象只是“通往更高支出的最小减速带”。
Citadel判断:AI“性价比与稀缺性”更重要
Citadel证券在《Tokenomics》报告中给出明确方向性判断,核心论点是:AI落地的核心约束已从“模型能力”转向“成本与稀缺性”。报告指出,技术落地的核心不再是前沿模型理论上能做什么,而是规模化实现AI运行所需投入品的价格与稀缺性,算力、电力、冷却、内存带宽和推理预算都是限制条件。
报告援引经济学原理,认为价格的三大功能在AI领域同时发生。结论是:未来最好的回报,不会来自构建最强模型的公司,而是来自降低AI成本、提升效率的公司。推理密集型前沿AI不会消失,但会集中在少数有能力承担成本的大型企业手中,对整个经济体而言,在物理约束缓解之前,更简单的模型可能是更具生产力的路径。
低价模型改变账单结构,AI使用或分层
高盛One - Delta部门负责人Rich Privorotsky提到,DeepSeek下调75%的定价,小米MiMo接近99%的降价幅度,基础设施瓶颈缓解正在触发价格战。Coinbase首席执行官Brian Armstrong预测,未来12至18个月,80%的AI工作负载会迁移到成本低99%的模型上,只有20%需要极致智能的任务会继续留在前沿模型上。
Hugging Face首席执行官Clement Delangue援引斯坦福大学数据称,本地模型在真实世界查询中的准确率已升至71.3%,且成本极低。这与Citadel的判断相接近,即前沿AI不会消失,但可能集中在少数能承受算力成本、具备研究深度、且能把高难度问题转化为规模化收益的企业手中。对更广泛的经济体而言,在物理约束缓解前,更简单的模型可能是更便宜的生产力工具,AI使用可能走向分层,高价值、复杂任务继续使用前沿模型,日常任务、批量任务、低回报实验则转向便宜模型或本地模型。
摩根大通:优化账单不等于AI需求见顶
摩根大通认为,现在的账单焦虑可能只是AI需求早期阶段的小减速带,一年后Token支出可能明显更高。如果每百万Token平均成本下降,但美国公司AI付费渗透率仍在上升,总Token用量在算术上就必须大幅增加,即“单位价格下降”和“总使用量爆发”可以同时发生。
企业内部情况类似,已大量使用AI的公司会优化Token预算,减少浪费;还没完全上车的公司,会因模型更便宜、更容易部署而开始使用。智能体AI还会放大Token消耗,有中小企业案例显示,业务agent化后,每个任务的Token消耗变成原来的3.5倍。所以,市场争论的关键不是“Token会不会继续增长”,而是“增长的单位经济模型是否健康”。
企业开始管账单,定价模式生变
企业端最先暴露的问题不是AI没人用,而是用得太随意。Axios援引一位AI顾问消息称,其一家企业客户近期单月在Claude上花费5亿美元,原因是未对员工使用量设置上限。企业内部把AI使用量当作考核指标也产生了副作用,如美国部分公司诱发“Tokenmaxxing”,员工为刷高使用量让AI执行低价值任务。
亚马逊旗下开发者平台Kiro曾设有内部排行榜“Kirorank”,员工为刷榜让AI做无意义任务,推高运营成本,随后亚马逊要求员工“不要为了用AI而用AI”,相关测试版仪表盘被下线,并改用“归一化部署”指标,追踪AI生成代码的实际价值。Meta内部也出现过类似情况。企业不是停用AI,而是开始区分“有效Token”和“无效Token”。
摩根大通提到,Cloudflare推出AI Gateway这类产品,目的是帮助企业控制Token预算,OpenRouter等工具也长期存在,本质都是在不同模型之间做路由和成本管理。定价端也在变化,6月1日,GitHub Copilot正式从按请求收费切换为按Token用量计费,有用户称月度费用预计将从不到45美元升至超过847美元。GitHub首席产品官Mario Rodriguez称,随着智能体AI兴起,旧有定价模式已不可持续。Gartner分析师Arun Chandrasekaran称,随着高级推理模型推高算力消耗,更多企业将转向按用量计费,过去靠固定订阅或补贴隐藏的成本,正在被摆到企业财务表面。
多空分歧:硬件交易逻辑是否成立?
这场争论的终极问题是AI基础设施的投资逻辑是否还成立。多头依据是:高盛的Jim Schneider测算,到2030年,代理式AI将推动Token消耗量增长24倍,云服务商毛利率将在短期内转正;Mark Schilsky也认为,Token支出的短期乱象不会改变长期趋势。
空头依据是:高盛半导体分析师Jim Covello认为,当前产业链繁荣是以牺牲上游消耗为代价的,几乎所有价值都流向了半导体公司,这种状况不可持续;投资人Tommy Shaughnessy警告,AI大厂利润率深度为负,一旦企业直面按量计费的真实价格,支撑GPU采购和模型训练的资本流动将面临逆转。近日,Anthropic CEO Dario Amodei、博通总裁Hock Tan、《大空头》原型Steve Eisman等也谈到企业目前对AI工具存在过度支出问题,随着成本意识增强和计费模式转向按Token收费,未来更需要看实际投资回报率。
社交媒体上也有不同声音,有用户指出“六天连跌去年在采用高峰期发生过四次”“更便宜的模型反而会加速部署,因为成本门槛降低了”,也有人反驳“不管多便宜,每次新模型发布都会指数级消耗更多Token”。目前,这场争论没有定论,但Token支出的边际变化,通过GPU算力、DRAM内存及数据中心需求的传导链条,直接影响英伟达、存储芯片厂商及云服务商的资本开支预期,这张图,投资者不得不盯着看。