漲十周后連降兩周!全球AI大模型Token調(diào)用量遭遇逆轉(zhuǎn),到底誰在為算力漲價買單?
“免費午餐”結(jié)束,算力賬單來了。
狂飆十周的AI大模型Token調(diào)用量,在2026年4月突然踩下“急剎車”。
作為AI行業(yè)的核心 “晴雨表”,全球最大AI模型API聚合平臺OpenRouter數(shù)據(jù)顯示:全球大模型總調(diào)用量在連續(xù)10周增長后,4月6日- 12日、4月13日- 19日連續(xù)兩周下滑,最新單周總量降至20.6萬億Token。更值得關(guān)注的是,中美市場走勢徹底分化 ——中國大模型周調(diào)用量環(huán)比暴跌23.77%至4.44萬億Token,美國模型逆勢增長20.62%至4.91萬億 Token,近兩月首次反超。

01 國產(chǎn)模型產(chǎn)品力迎大考
“Token資費普遍上漲,成本增高,用戶不得不控制總量節(jié)約成本。”上海財經(jīng)大學(xué)特聘教授胡延平告訴《每日經(jīng)濟新聞》記者,當(dāng)價格優(yōu)勢不再突出,模型的產(chǎn)品力便成為左右用戶選擇的關(guān)鍵。
胡延平分析,上周美國AI大模型調(diào)用量回升,主要由Anthropic旗下Claude Sonnet和Opus模型拉動。這兩款模型已成為編程領(lǐng)域的“硬通貨”,而國產(chǎn)大模型在這方面的產(chǎn)品力仍需提升。
OpenRouter數(shù)據(jù)顯示,上周,Claude Sonnet4.6沖上榜首,周調(diào)用量達(dá)1.38萬億Tokens,環(huán)比增長19%。Claude Opus4.6位居第三,周調(diào)用量達(dá)1.22萬億Tokens。兩款模型合計占美國AI大模型周調(diào)用量逾五成。
與此形成對比的,是近期國產(chǎn)模型的過山車行情。
在此前一周(4月6日至12日),阿里Qwen3.6 Plus以1.66萬億Tokens的周調(diào)用量居全球榜首,但僅過一周(4月13日至19日)便下滑出榜單。
此外,記者注意到,此前多次上榜的Kimi K2.5、智譜GLM系列模型,已連續(xù)三周未登榜。此前一度沖上榜單第二的階躍星辰Step 3.5 Flash,近兩周同樣無緣榜單。
胡延平認(rèn)為,OpenRouter平臺的用戶以開發(fā)者和中小企業(yè)為主,對模型迭代能力和垂直場景產(chǎn)品力要求極高。“市場用戶有往頭部主力模型集中的趨向,在能夠觸達(dá)的范圍內(nèi),用戶只用最好的。”他指出,用戶場景越來越要求模型具備強工具調(diào)用能力、多Agent(智能體)支持、長程復(fù)雜任務(wù)的持續(xù)達(dá)成能力,目前OpenRouter上的大部分模型在這方面還需著力提升。
有業(yè)內(nèi)人士也向《每日經(jīng)濟新聞》記者指出,算力成本上漲后,行業(yè)內(nèi)普遍優(yōu)先選擇性能穩(wěn)定、輸出效果可靠的工具,價格已非首要考量。
02 算力漲價的根源:需求 “海嘯” 撞上供給 “天花板”
這場 AI 算力漲價,不是短期波動,而是供需徹底失衡的必然結(jié)果,核心是需求指數(shù)級爆發(fā),供給卻被物理瓶頸死死卡住。
1)需求端:AI 智能體引爆,Token 消耗 “千倍增長”
2026 年 AI 行業(yè)最大的變量,是 **AI Agent(智能體)** 的規(guī)模化爆發(fā)。以爆款應(yīng)用 OpenClaw(“龍蝦”)為代表,智能體徹底改變了 Token 消耗邏輯:
– 傳統(tǒng)模式:人機一問一答,Token 消耗線性增長,單次對話僅數(shù)十至數(shù)百 Token;
– Agent模式:自主拆解任務(wù)、多輪迭代、自我糾錯、反復(fù)調(diào)用工具,單任務(wù) Token 消耗暴漲 1000 倍。
數(shù)據(jù)更直觀:今年 3 月,我國日均 Token 調(diào)用量超 140 萬億,較 2024 年初增長超 1000 倍。一個普通智能體運行一天,算力成本就高達(dá) 1000-5000 美元;甚至有企業(yè)吐槽,“200 美元訂閱費的用戶,每月消耗 5000 美元算力”,完全 “賣得越多虧得越多”。
2)供給端:硬件、產(chǎn)能、能源三重 “硬約束”
需求狂飆,但算力供給卻被物理世界牢牢鎖死:
– GPU 芯片極度稀缺:英偉達(dá) Blackwell 芯片時租 4.08 美元,兩月漲 48%;H100 年租價從 1.7 美元 / 小時漲至 2.35 美元,漲幅近 40%;B200 租價達(dá) 5.47 美元 / 小時,環(huán)比漲 23.5%。高端 GPU 訂單排至 2027 年,有錢也租不到。
– HBM 內(nèi)存價格翻倍:作為大模型核心存儲,HBM 產(chǎn)能不足,2026 年一季度價格直接暴漲 90%。
– 先進(jìn)封裝與能源瓶頸:英偉達(dá) CoWoS 封裝需求年增 40%,產(chǎn)能嚴(yán)重不足;同時,AI 算力耗電極增,多地出現(xiàn)電力供應(yīng)緊張,進(jìn)一步限制算力擴張。
無限需求撞上剛性供給,算力從 “普惠資源” 變成 “頂級稀缺資產(chǎn)”,漲價成了唯一出路。
03 用戶“用腳投票”:國產(chǎn)模型遭遇“過山車”
面對上漲的Token價格,最敏感的開發(fā)者和中小企業(yè)開始“用腳投票”。
以前,大家看誰家搞促銷、送Token就用誰家;現(xiàn)在,Token成了真金白銀的生產(chǎn)資料,價格不再是唯一標(biāo)準(zhǔn),性價比和硬實力才是關(guān)鍵。
1)OpenRouter的數(shù)據(jù)揭示了殘酷的現(xiàn)實:
在4月的第二周,阿里的Qwen3.6 Plus還曾以1.66萬億Tokens的調(diào)用量登頂全球榜首;僅僅一周之后,它就跌出了榜單。與此同時,Kimi K2.5、智譜GLM系列等曾經(jīng)的明星模型,已連續(xù)三周消失在主流視野。
2)取而代之的是誰?是能“干活”的模型。
數(shù)據(jù)顯示,美國模型的反彈完全由Anthropic旗下的Claude Sonnet和Opus拉動。這兩款模型已成為海外編程領(lǐng)域的“硬通貨”,無論是代碼生成還是復(fù)雜邏輯推理,用戶認(rèn)為哪怕貴一點,只要產(chǎn)出穩(wěn)定,就是劃算的。
04 誰在為算力漲價買單?四層成本傳導(dǎo),全行業(yè)承壓
算力漲價的成本,不會憑空消失,而是沿著產(chǎn)業(yè)鏈層層傳導(dǎo),從廠商到企業(yè)、從開發(fā)者到個人用戶,最終由全行業(yè)共同承擔(dān),只是承擔(dān)方式與壓力各不相同。
1)第一層:云廠商與模型企業(yè) ——“被迫漲價,修復(fù)利潤”
過去兩年,AI 行業(yè)陷入 “低價內(nèi)卷”:云廠商靠補貼搶客戶、大模型企業(yè)燒錢換流量,長期 “虧損獲客”。
漲價對它們而言,是 **“被動自救”**:
– 緩解 GPU、HBM 的巨額折舊與采購壓力,從 “規(guī)模優(yōu)先” 轉(zhuǎn)向 “價值優(yōu)先”;
– 把稀缺算力向高毛利、高價值的企業(yè)客戶集中,淘汰低價值的個人粗放調(diào)用;
– 頭部廠商(如擁有自研芯片的企業(yè))反而受益,成本優(yōu)勢進(jìn)一步拉大,加速行業(yè)出清。
2)第二層:中小企業(yè)與開發(fā)者 ——“成本暴增,生死考驗”
這是最直接的承壓層。絕大多數(shù)中小 AI 企業(yè)、獨立開發(fā)者沒有自建算力能力,完全依賴云端 API 與算力租賃:
– 創(chuàng)業(yè)公司:AI 應(yīng)用成本直接上漲 30%-200%,利潤被大幅擠壓,“PPT 創(chuàng)業(yè)” 徹底失去土壤;
– 中小開發(fā)者:低價調(diào)用時代終結(jié),大量個人項目、低價值應(yīng)用因成本過高直接停服;
– 行業(yè)分化:能靠 AI 創(chuàng)造高營收(如電商 AI、企業(yè) SaaS)的企業(yè)尚能承受,純工具、低變現(xiàn)項目直接被淘汰。
3)第三層:重度用戶與企業(yè)客戶 ——“轉(zhuǎn)嫁成本,優(yōu)化使用”
對大型企業(yè)、AI 重度用戶而言,漲價是 **“成本轉(zhuǎn)嫁 + 效率優(yōu)化”**:
– 一方面,將上漲的 AI 成本部分轉(zhuǎn)嫁給終端客戶(如 AI 增值服務(wù)提價);
– 另一方面,主動優(yōu)化 Token 使用:減少無效調(diào)用、精簡上下文、切換更高能效的模型,倒逼 “精細(xì)化運營”。
4)第四層:普通個人用戶 ——“感知有限,體驗分化”
個人用戶感受相對間接:
免費額度縮水、免費模型質(zhì)量下降、付費訂閱價格上漲;
大量低質(zhì)低價的國產(chǎn)模型服務(wù)下架,反而倒逼用戶轉(zhuǎn)向更優(yōu)質(zhì)、更穩(wěn)定的頭部模型,“劣幣驅(qū)逐良幣” 的現(xiàn)象被逆轉(zhuǎn)。
一句話總結(jié):算力漲價的單,最終由 “全行業(yè)共擔(dān)”—— 低效產(chǎn)能被出清,高效玩家留到最后,行業(yè)從 “野蠻生長” 走向 “高質(zhì)量發(fā)展”。
05 專家:全球消耗量仍處快速增長通道
短期數(shù)據(jù)波動,是否意味著AI應(yīng)用熱潮正在消退?
“短期還不宜下結(jié)論。”胡延平提醒,OpenRouter的Token調(diào)用量僅占全球消耗總量的約2%~4%,其排名波動更多反映的是開源、二線及新發(fā)模型的競爭態(tài)勢,不能代表整個市場的走向。
事實上,成本壓力正在倒逼市場進(jìn)化。胡延平觀察到,今年初以來,OpenClaw等各類智能體、多Agent應(yīng)用已將Token調(diào)用量拉升至去年底的兩三倍水平;成本大幅抬高,促使企業(yè)和用戶轉(zhuǎn)而采用記憶優(yōu)化、提示詞壓縮、Harness Engineering(約束工程)等手段主動降耗。
記者了解到,甚至有中小創(chuàng)業(yè)者已將Token使用量納入員工績效考核。市場正從單純追求數(shù)量的“堆量”階段,進(jìn)化到追求更高投入產(chǎn)出比的“提效”階段。
更深層的變化,在于AI應(yīng)用場景本身的質(zhì)變。國聯(lián)民生證券一份研報中提出“Token通脹”的概念。這并非指Token本身變貴,而是指單位時間內(nèi)、單位用戶的Token消耗結(jié)構(gòu)性上升。
用戶的需求正從淺層的“問答”轉(zhuǎn)向深度的“干活”。Token不是傳統(tǒng)互聯(lián)網(wǎng)時代邊際成本幾乎為零的“流量”,而是執(zhí)行生產(chǎn)任務(wù)時必不可少的“燃料”。
摩根大通在研報中對中國市場作出極為樂觀的預(yù)測,預(yù)計2025年至2030年,中國Token消耗量的年復(fù)合增長率將達(dá)330%,5年內(nèi)將實現(xiàn)370倍增長。
胡延平同樣對長期趨勢保持堅定樂觀:“就中長期而言,無論OpenRouter上的統(tǒng)計數(shù)據(jù)如何波動,包括中國在內(nèi),全球Token消耗總量都處在快速增長通道,未來兩三年會有數(shù)十倍甚至數(shù)百倍的增加。”
漲十周、降兩周,看似是數(shù)據(jù)波動,實則是 AI 行業(yè)的一次深刻 “壓力測試”。
算力漲價,擠掉了行業(yè)的虛假繁榮,淘汰了低效產(chǎn)能與投機者,留下真正有技術(shù)、有場景、有商業(yè)化能力的玩家。Token 調(diào)用量的收縮,不是 AI 的終點,而是理性發(fā)展的起點—— 當(dāng)每一分算力都用在 “創(chuàng)造價值” 上,AI 才能真正從 “概念熱潮” 走向 “產(chǎn)業(yè)剛需”。
至于 “誰為算力漲價買單”?答案是:所有人,但也只有扛過成本壓力、守住價值底線的人,才能笑到最后。
這場 AI 算力的 “大通脹”,才剛剛開始。