漲十周后連降兩周！全球AI大模型Token調(diào)用量遭遇逆轉(zhuǎn),到底誰在為算力漲價買單？

新聞中心, 行業(yè)經(jīng)驗分享 2026-04-23 09:29:01 1820

“免費午餐”結(jié)束，算力賬單來了。

狂飆十周的AI大模型Token調(diào)用量，在2026年4月突然踩下“急剎車”。

作為AI行業(yè)的核心 “晴雨表”，全球最大AI模型API聚合平臺OpenRouter數(shù)據(jù)顯示：全球大模型總調(diào)用量在連續(xù)10周增長后，4月6日- 12日、4月13日- 19日連續(xù)兩周下滑，最新單周總量降至20.6萬億Token。更值得關(guān)注的是，中美市場走勢徹底分化 ——中國大模型周調(diào)用量環(huán)比暴跌23.77%至4.44萬億Token，美國模型逆勢增長20.62%至4.91萬億 Token，近兩月首次反超。

AI大模型Token調(diào)用

01 國產(chǎn)模型產(chǎn)品力迎大考

“Token資費普遍上漲，成本增高，用戶不得不控制總量節(jié)約成本。”上海財經(jīng)大學(xué)特聘教授胡延平告訴《每日經(jīng)濟新聞》記者，當(dāng)價格優(yōu)勢不再突出，模型的產(chǎn)品力便成為左右用戶選擇的關(guān)鍵。

胡延平分析，上周美國AI大模型調(diào)用量回升，主要由Anthropic旗下Claude Sonnet和Opus模型拉動。這兩款模型已成為編程領(lǐng)域的“硬通貨”，而國產(chǎn)大模型在這方面的產(chǎn)品力仍需提升。

OpenRouter數(shù)據(jù)顯示，上周，Claude Sonnet4.6沖上榜首，周調(diào)用量達(dá)1.38萬億Tokens，環(huán)比增長19%。Claude Opus4.6位居第三，周調(diào)用量達(dá)1.22萬億Tokens。兩款模型合計占美國AI大模型周調(diào)用量逾五成。

與此形成對比的，是近期國產(chǎn)模型的過山車行情。

在此前一周（4月6日至12日），阿里Qwen3.6 Plus以1.66萬億Tokens的周調(diào)用量居全球榜首，但僅過一周（4月13日至19日）便下滑出榜單。

此外，記者注意到，此前多次上榜的Kimi K2.5、智譜GLM系列模型，已連續(xù)三周未登榜。此前一度沖上榜單第二的階躍星辰Step 3.5 Flash，近兩周同樣無緣榜單。

胡延平認(rèn)為，OpenRouter平臺的用戶以開發(fā)者和中小企業(yè)為主，對模型迭代能力和垂直場景產(chǎn)品力要求極高。“市場用戶有往頭部主力模型集中的趨向，在能夠觸達(dá)的范圍內(nèi)，用戶只用最好的。”他指出，用戶場景越來越要求模型具備強工具調(diào)用能力、多Agent（智能體）支持、長程復(fù)雜任務(wù)的持續(xù)達(dá)成能力，目前OpenRouter上的大部分模型在這方面還需著力提升。

有業(yè)內(nèi)人士也向《每日經(jīng)濟新聞》記者指出，算力成本上漲后，行業(yè)內(nèi)普遍優(yōu)先選擇性能穩(wěn)定、輸出效果可靠的工具，價格已非首要考量。

02 算力漲價的根源：需求 “海嘯” 撞上供給 “天花板”

這場 AI 算力漲價，不是短期波動，而是供需徹底失衡的必然結(jié)果，核心是需求指數(shù)級爆發(fā)，供給卻被物理瓶頸死死卡住。

1）需求端：AI 智能體引爆，Token 消耗 “千倍增長”

2026 年 AI 行業(yè)最大的變量，是 **AI Agent（智能體）** 的規(guī)模化爆發(fā)。以爆款應(yīng)用 OpenClaw（“龍蝦”）為代表，智能體徹底改變了 Token 消耗邏輯：

– 傳統(tǒng)模式：人機一問一答，Token 消耗線性增長，單次對話僅數(shù)十至數(shù)百 Token；

– Agent模式：自主拆解任務(wù)、多輪迭代、自我糾錯、反復(fù)調(diào)用工具，單任務(wù) Token 消耗暴漲 1000 倍。

數(shù)據(jù)更直觀：今年 3 月，我國日均 Token 調(diào)用量超 140 萬億，較 2024 年初增長超 1000 倍。一個普通智能體運行一天，算力成本就高達(dá) 1000-5000 美元；甚至有企業(yè)吐槽，“200 美元訂閱費的用戶，每月消耗 5000 美元算力”，完全 “賣得越多虧得越多”。

2）供給端：硬件、產(chǎn)能、能源三重 “硬約束”

需求狂飆，但算力供給卻被物理世界牢牢鎖死：

– GPU 芯片極度稀缺：英偉達(dá) Blackwell 芯片時租 4.08 美元，兩月漲 48%；H100 年租價從 1.7 美元 / 小時漲至 2.35 美元，漲幅近 40%；B200 租價達(dá) 5.47 美元 / 小時，環(huán)比漲 23.5%。高端 GPU 訂單排至 2027 年，有錢也租不到。

– HBM 內(nèi)存價格翻倍：作為大模型核心存儲，HBM 產(chǎn)能不足，2026 年一季度價格直接暴漲 90%。

– 先進(jìn)封裝與能源瓶頸：英偉達(dá) CoWoS 封裝需求年增 40%，產(chǎn)能嚴(yán)重不足；同時，AI 算力耗電極增，多地出現(xiàn)電力供應(yīng)緊張，進(jìn)一步限制算力擴張。

無限需求撞上剛性供給，算力從 “普惠資源” 變成 “頂級稀缺資產(chǎn)”，漲價成了唯一出路。

03 用戶“用腳投票”：國產(chǎn)模型遭遇“過山車”

面對上漲的Token價格，最敏感的開發(fā)者和中小企業(yè)開始“用腳投票”。

以前，大家看誰家搞促銷、送Token就用誰家；現(xiàn)在，Token成了真金白銀的生產(chǎn)資料，價格不再是唯一標(biāo)準(zhǔn)，性價比和硬實力才是關(guān)鍵。

1）OpenRouter的數(shù)據(jù)揭示了殘酷的現(xiàn)實：

在4月的第二周，阿里的Qwen3.6 Plus還曾以1.66萬億Tokens的調(diào)用量登頂全球榜首；僅僅一周之后，它就跌出了榜單。與此同時，Kimi K2.5、智譜GLM系列等曾經(jīng)的明星模型，已連續(xù)三周消失在主流視野。

2）取而代之的是誰？是能“干活”的模型。

數(shù)據(jù)顯示，美國模型的反彈完全由Anthropic旗下的Claude Sonnet和Opus拉動。這兩款模型已成為海外編程領(lǐng)域的“硬通貨”，無論是代碼生成還是復(fù)雜邏輯推理，用戶認(rèn)為哪怕貴一點，只要產(chǎn)出穩(wěn)定，就是劃算的。

04 誰在為算力漲價買單？四層成本傳導(dǎo)，全行業(yè)承壓

算力漲價的成本，不會憑空消失，而是沿著產(chǎn)業(yè)鏈層層傳導(dǎo)，從廠商到企業(yè)、從開發(fā)者到個人用戶，最終由全行業(yè)共同承擔(dān)，只是承擔(dān)方式與壓力各不相同。

1）第一層：云廠商與模型企業(yè) ——“被迫漲價，修復(fù)利潤”

過去兩年，AI 行業(yè)陷入 “低價內(nèi)卷”：云廠商靠補貼搶客戶、大模型企業(yè)燒錢換流量，長期 “虧損獲客”。

漲價對它們而言，是 **“被動自救”**：

– 緩解 GPU、HBM 的巨額折舊與采購壓力，從 “規(guī)模優(yōu)先” 轉(zhuǎn)向 “價值優(yōu)先”；

– 把稀缺算力向高毛利、高價值的企業(yè)客戶集中，淘汰低價值的個人粗放調(diào)用；

– 頭部廠商（如擁有自研芯片的企業(yè)）反而受益，成本優(yōu)勢進(jìn)一步拉大，加速行業(yè)出清。

2）第二層：中小企業(yè)與開發(fā)者 ——“成本暴增，生死考驗”

這是最直接的承壓層。絕大多數(shù)中小 AI 企業(yè)、獨立開發(fā)者沒有自建算力能力，完全依賴云端 API 與算力租賃：

– 創(chuàng)業(yè)公司：AI 應(yīng)用成本直接上漲 30%-200%，利潤被大幅擠壓，“PPT 創(chuàng)業(yè)” 徹底失去土壤；

– 中小開發(fā)者：低價調(diào)用時代終結(jié)，大量個人項目、低價值應(yīng)用因成本過高直接停服；

– 行業(yè)分化：能靠 AI 創(chuàng)造高營收（如電商 AI、企業(yè) SaaS）的企業(yè)尚能承受，純工具、低變現(xiàn)項目直接被淘汰。

3）第三層：重度用戶與企業(yè)客戶 ——“轉(zhuǎn)嫁成本，優(yōu)化使用”

對大型企業(yè)、AI 重度用戶而言，漲價是 **“成本轉(zhuǎn)嫁 + 效率優(yōu)化”**：

– 一方面，將上漲的 AI 成本部分轉(zhuǎn)嫁給終端客戶（如 AI 增值服務(wù)提價）；

– 另一方面，主動優(yōu)化 Token 使用：減少無效調(diào)用、精簡上下文、切換更高能效的模型，倒逼 “精細(xì)化運營”。

4）第四層：普通個人用戶 ——“感知有限，體驗分化”

個人用戶感受相對間接：

免費額度縮水、免費模型質(zhì)量下降、付費訂閱價格上漲；

大量低質(zhì)低價的國產(chǎn)模型服務(wù)下架，反而倒逼用戶轉(zhuǎn)向更優(yōu)質(zhì)、更穩(wěn)定的頭部模型，“劣幣驅(qū)逐良幣” 的現(xiàn)象被逆轉(zhuǎn)。

一句話總結(jié)：算力漲價的單，最終由 “全行業(yè)共擔(dān)”—— 低效產(chǎn)能被出清，高效玩家留到最后，行業(yè)從 “野蠻生長” 走向 “高質(zhì)量發(fā)展”。

05 專家：全球消耗量仍處快速增長通道

短期數(shù)據(jù)波動，是否意味著AI應(yīng)用熱潮正在消退？

“短期還不宜下結(jié)論。”胡延平提醒，OpenRouter的Token調(diào)用量僅占全球消耗總量的約2%～4%，其排名波動更多反映的是開源、二線及新發(fā)模型的競爭態(tài)勢，不能代表整個市場的走向。

事實上，成本壓力正在倒逼市場進(jìn)化。胡延平觀察到，今年初以來，OpenClaw等各類智能體、多Agent應(yīng)用已將Token調(diào)用量拉升至去年底的兩三倍水平；成本大幅抬高，促使企業(yè)和用戶轉(zhuǎn)而采用記憶優(yōu)化、提示詞壓縮、Harness Engineering（約束工程）等手段主動降耗。

記者了解到，甚至有中小創(chuàng)業(yè)者已將Token使用量納入員工績效考核。市場正從單純追求數(shù)量的“堆量”階段，進(jìn)化到追求更高投入產(chǎn)出比的“提效”階段。

更深層的變化，在于AI應(yīng)用場景本身的質(zhì)變。國聯(lián)民生證券一份研報中提出“Token通脹”的概念。這并非指Token本身變貴，而是指單位時間內(nèi)、單位用戶的Token消耗結(jié)構(gòu)性上升。

用戶的需求正從淺層的“問答”轉(zhuǎn)向深度的“干活”。Token不是傳統(tǒng)互聯(lián)網(wǎng)時代邊際成本幾乎為零的“流量”，而是執(zhí)行生產(chǎn)任務(wù)時必不可少的“燃料”。

摩根大通在研報中對中國市場作出極為樂觀的預(yù)測，預(yù)計2025年至2030年，中國Token消耗量的年復(fù)合增長率將達(dá)330%，5年內(nèi)將實現(xiàn)370倍增長。

胡延平同樣對長期趨勢保持堅定樂觀：“就中長期而言，無論OpenRouter上的統(tǒng)計數(shù)據(jù)如何波動，包括中國在內(nèi)，全球Token消耗總量都處在快速增長通道，未來兩三年會有數(shù)十倍甚至數(shù)百倍的增加。”

漲十周、降兩周，看似是數(shù)據(jù)波動，實則是 AI 行業(yè)的一次深刻 “壓力測試”。

算力漲價，擠掉了行業(yè)的虛假繁榮，淘汰了低效產(chǎn)能與投機者，留下真正有技術(shù)、有場景、有商業(yè)化能力的玩家。Token 調(diào)用量的收縮，不是 AI 的終點，而是理性發(fā)展的起點—— 當(dāng)每一分算力都用在 “創(chuàng)造價值” 上，AI 才能真正從 “概念熱潮” 走向 “產(chǎn)業(yè)剛需”。

至于 “誰為算力漲價買單”？答案是：所有人，但也只有扛過成本壓力、守住價值底線的人，才能笑到最后。

這場 AI 算力的 “大通脹”，才剛剛開始。

上一篇：千萬別錯過！重慶多門店實現(xiàn)小程序定制開發(fā)，挖掘無限商業(yè)潛力

下一篇：工廠全系統(tǒng)場景流轉(zhuǎn)：九大系統(tǒng)如何協(xié)同實現(xiàn)端到端業(yè)財一體？

2026年4月AI大模型排名：谷歌登頂，國產(chǎn)模型全面崛起

如果你最近還在用半年前選定的AI模型做業(yè)務(wù)，可能要重新看一看了。 Artificial Analysis 每72小時更新一次的 LLM 排行榜，目前已收錄 317 個模型。這張榜單不是看論文發(fā)表數(shù)量，也不靠廠商自報，而是從實際 API 調(diào)用中采集智能指數(shù)、響應(yīng)速度、成本和延遲這幾個維度的實測數(shù)據(jù)。換句話說，它大致反映了”花錢買到的模型到底怎么樣”。智能指數(shù)前五，格局已經(jīng)變了排行榜的核心是”智能指數(shù)（Intelligence Index）”，滿分…

新聞中心 2026-04-13
為什么ChatBI智能問數(shù)是數(shù)據(jù)分析領(lǐng)域的下一個重大變革

傳統(tǒng)的商業(yè)智能工具，往往需要用戶先學(xué)習(xí)它的操作邏輯。你需要點擊菜單、設(shè)置篩選條件、選擇統(tǒng)計口徑，再等待儀表板加載完成。對于熟悉系統(tǒng)的人來說這并不復(fù)雜，但對于大多數(shù)業(yè)務(wù)人員而言，門檻并不低。對話式商業(yè)智能改變了這種使用方式。它不是讓人去適應(yīng)系統(tǒng)，而是讓系統(tǒng)理解人的提問方式。比如直接輸入“哪些客戶群體流失風(fēng)險最高”，系統(tǒng)就會自動在數(shù)據(jù)庫中查找相關(guān)數(shù)據(jù)，并返回結(jié)果。整個過程更接近日常交流，而不是技術(shù)操作。這種變化帶來的影響，不只是操作更方便。更重要的是，它改變了數(shù)據(jù)的使用范圍。過去很多數(shù)據(jù)查詢需要…

企業(yè)ERP解決方案 2026-02-26
AI + 定制系統(tǒng)開發(fā)：企業(yè)智能化升級的最佳路徑

我們團隊去年幫一家中型企業(yè)做了AI升級，過程挺有代表性。關(guān)鍵就一條：AI升級不是搞個時髦功能，而是讓系統(tǒng)自己會“看”會“想”。分享下我們走的路徑，很實在。啟動前先做“體檢”。別急著聊模型，先把客戶所有紙質(zhì)流程、Excel表格和口頭交接的環(huán)節(jié)全部挖出來。我們當(dāng)時發(fā)現(xiàn)，客戶的核心痛點是一線工人每天要花3小時填各種表格，管理層第二天才能看到數(shù)據(jù)。第一個判斷標(biāo)準(zhǔn)就是：這個環(huán)節(jié)是否依賴人工重復(fù)處理信息。如果是，就值得用AI改造。接著進(jìn)入“最小可行性閉環(huán)”階段。我們從一堆流程里，只挑了一個點：產(chǎn)品質(zhì)量檢…

新聞中心 2026-01-06
ALL IN AI：深圳正重寫城市“操作系統(tǒng)”

鴻蒙是我國首個全棧自研操作系統(tǒng)，有望成為“數(shù)字中國”的安全基石和全場景的智能引擎，前景無限。而深圳市龍崗區(qū)正是鴻蒙系統(tǒng)的策源地，擁有華為、中軟等一批龍頭企業(yè)和110多家鴻蒙生態(tài)相關(guān)企業(yè)。 2026年初，當(dāng)全世界都在討論新一輪AI浪潮的時候，深圳一個區(qū)沖了出來，提出了“All in AI”戰(zhàn)略。是誰這么敢？答案是深圳市光明區(qū)。它的手里握了哪些“硬牌”？ 01 龍崗“樣板間”：從“工業(yè)第一區(qū)”到“操作系統(tǒng)”重寫作為全國工業(yè)百強區(qū)的“七連冠”，龍崗區(qū)擁有5901.27億元GDP的雄厚制造業(yè)基因，這…

新聞中心 2026-03-09
AI時代還需要定制開發(fā)軟件嗎

AI大模型正在快速改變軟件生產(chǎn)方式，很多企業(yè)開始問同一個問題：既然AI已經(jīng)能自動寫代碼，為什么還要投入軟件定制開發(fā)和系統(tǒng)定制開發(fā)？表面看，AI讓開發(fā)更快了；但站在企業(yè)決策層的角度，真正要解決的不是“能不能寫出代碼”，而是“能不能支撐業(yè)務(wù)長期增長、穩(wěn)定交付、可控維護”。如果你的系統(tǒng)只是一次性工具，標(biāo)準(zhǔn)化產(chǎn)品也許夠用；但一旦涉及多部門協(xié)同、復(fù)雜流程、數(shù)據(jù)治理、權(quán)限控制、合規(guī)要求和未來擴展，AI大模型只能提高效率，不能替代架構(gòu)設(shè)計、業(yè)務(wù)抽象和工程管理。換句話說，AI時代不是不需要定制開發(fā)，而是更需要…

新聞中心 2026-04-07
AI Agent 到底是怎么干活的？一文弄懂AI Agent完整工作流程

想象一下，你告訴AI：“幫我策劃一個下周末去杭州的兩天一夜旅行，預(yù)算2000元，要包含高鐵票和一家評分4.5以上的酒店，然后把行程發(fā)到我的郵箱。” 如果是在幾年前，你可能會得到一個包含各種鏈接和文字建議的回復(fù)。但今天，一個真正的AI Agent（智能體）會怎么做？它會像一個經(jīng)驗豐富的私人助理一樣，默默地開始工作：查詢下周末的高鐵班次、比較價格和余票；搜索杭州的酒店，并根據(jù)你的預(yù)算和評分要求進(jìn)行篩選；將選定的交通和住宿信息整合成一個清晰的行程表；最后，將這個行程表打包發(fā)送到你指定的郵箱。這一切…

新聞中心 2026-04-15
智能問數(shù)ChatBI – AI時代的BI報表解決之道

——從傳統(tǒng)BI報表到AI大模型驅(qū)動的數(shù)據(jù)決策升級在企業(yè)數(shù)字化轉(zhuǎn)型不斷深入的背景下，數(shù)據(jù)已經(jīng)成為管理層最核心的決策依據(jù)。然而，很多企業(yè)在實際運營過程中依然面臨一個普遍問題：數(shù)據(jù)很多，報表很多，但真正支撐決策的內(nèi)容卻很少。隨著企業(yè)逐步邁入數(shù)字化轉(zhuǎn)型的深水階段，數(shù)據(jù)已成為經(jīng)營決策的核心資產(chǎn)。與此同時，AI技術(shù)的快速發(fā)展正在改變企業(yè)獲取和使用數(shù)據(jù)的方式。過去以“拖拽式”操作為主的傳統(tǒng) BI報表工具，正在被更加直觀的自然語言交互方式所替代。通過 ChatBI 或 AI問數(shù)系統(tǒng)，業(yè)務(wù)人員無需掌握復(fù)雜的數(shù)…

ERP系統(tǒng)案例 2026-02-25
如何利用GPT等AI大模型解鎖ERP的潛力

幾十年來，企業(yè)資源規(guī)劃 (ERP) 系統(tǒng)一直是企業(yè)管理的核心支柱。它通過自動化日常運營流程并提供對關(guān)鍵數(shù)據(jù)的實時洞察，幫助企業(yè)高效管理財務(wù)、生產(chǎn)、庫存等方面。然而，隨著人工智能 (AI) 和自然語言處理 (NLP) 技術(shù)的崛起，企業(yè)對于更智能、更易用的解決方案需求不斷上升，ChatGPT、Cluade等就是其中的佼佼者。 ChatGPT 是由 OpenAI 開發(fā)的一種先進(jìn)語言模型，能夠生成與人類對話相似的文本，并且能高度準(zhǔn)確地回答問題。AI大模型強大的功能可以為企業(yè)與 ERP系統(tǒng) 的交互帶來革…

新聞中心 2026-04-02
【建議直接收藏】Windows 11上用OpenClaw接入DeepSeek：2026超詳細(xì)保姆級安裝配置教程！

有了它，你的電腦就多了一位24小時待命的AI員工最近科技圈最火的名詞非OpenClaw莫屬。這款原本名為Clawdbot的個人AI代理工具，因被AI巨頭Anthropic指控商標(biāo)相似而更名為OpenClaw，其中Open代表開源，對所有人開放。簡單來說，普通的AI只會教你如何整理文件，而OpenClaw可以直接上手實操。它是一個AGI雛形下的AI智能體，不僅會思考，擁有永久記憶，更能通過iMessage、WhatsApp和你實時聊天。其核心就是把頂尖LLM大腦塞進(jìn)你的電腦，讓每個人都獲得一…

新聞中心 2026-03-18
傳統(tǒng)ERP和新一代ERP的區(qū)別是什么？AI智能化ERP系統(tǒng)開發(fā)如何碰撞出火花？

簡單來說，ERP系統(tǒng)是一套集成的企業(yè)管理軟件，它就像企業(yè)的“中樞神經(jīng)系統(tǒng)”，將公司內(nèi)部所有核心部門（如財務(wù)、采購、生產(chǎn)、銷售、人力資源等）的數(shù)據(jù)和業(yè)務(wù)流程連接在一個統(tǒng)一的數(shù)據(jù)庫中，實現(xiàn)信息實時共享和流程自動化。 01 核心概念：為什么要用 ERP？在沒有 ERP 之前，企業(yè)的各個部門通常使用獨立的軟件或 Excel 表格管理數(shù)據(jù)： ① 財務(wù)部有自己的賬本； ② 銷售部有自己的客戶名單； ③ 倉庫有自己的庫存表。痛點：數(shù)據(jù)不互通（形成“數(shù)據(jù)孤島”），信息滯后，容易出錯。例如，銷售賣出了貨，但…

新聞中心 2026-03-09