硅谷程序員,瘋狂“投喂”中國大模型

作者:賈樂樂 ,編輯:趙元
一組來自全球最大AI模型API聚合平臺(tái)OpenRouter的數(shù)據(jù),在國內(nèi)外都引發(fā)了強(qiáng)烈震動(dòng)。
截至2026年2月28日,該平臺(tái)內(nèi)前十模型總Token消耗量已突破28.7萬億,其中,國產(chǎn)模型貢獻(xiàn)超過14.69萬億,為歷史上首次單月Token調(diào)用占比過半,且超越了美國模型。
從周維度看,2月16日至2 2日, 中國模型周調(diào)用量達(dá)5.16萬億Token,而同期美國模型跌至2.7萬億,中國模型全球占比達(dá)61%。調(diào)用量排名前五的模型中,中國占據(jù)四席——MiniMax M2.5、月之暗面 Kimi K2.5、DeepSeek V3.2和智譜GLM-5。
盡管接下來的一周,中國模型調(diào)用量下降,反超的時(shí)間很短暫,但能在全球最大的API聚合平臺(tái)上與美國模型正面交鋒并短暫領(lǐng)先,本身已是實(shí)力的證明。
此外,OpenRouter平臺(tái)的用戶中,美國開發(fā)者占比高達(dá)47.17%,而中國開發(fā)者僅占6.01%。也有報(bào)告顯示,80%的美國人工智能初創(chuàng)公司在其產(chǎn)品開發(fā)過程中使用了中國的開源模型。
這意味著,推動(dòng)中國模型登頂?shù)闹髁姡悄切﹣碜怨韫取碜詺W洲的海外開發(fā)者,而非國內(nèi)市場的自嗨。
這是因?yàn)榇竽P蛷?ldquo;誰更聰明”的單維比拼,進(jìn)入到了“誰聰明”“誰省錢”的多維比拼階段。
一、真香定律:美國開發(fā)者愛上中國Token
中國AI模型能夠在全球調(diào)用量上實(shí)現(xiàn)對(duì)美國的超越,背后是多重因素疊加形成的系統(tǒng)性優(yōu)勢(shì),而其中直接的驅(qū)動(dòng)力是,便宜。
先看一組數(shù)字。
長江證券的研報(bào)顯示,在輸入價(jià)格上,MiniMax M2.5和智譜GLM-5都是0.3美元/百萬Token,而Anthropic的Claude Opus 4.6是5美元,是中國模型的16.7倍。
輸出端更夸張,MiniMax-M2.5 價(jià)格為1.1 美元/百萬Token,智譜GLM-5 為2.55 美元/百萬Token,Claude Opus4.6 則為25 美元/百萬Token,分別是前兩者的約22.7 倍和9.8 倍。2月底剛出的阿里Qwen 3.5,直接把百萬Token價(jià)格打到0.8元人民幣,相當(dāng)于谷歌Gemini的十八分之一。
而在大量日常場景里,尤其是伴隨著Agent時(shí)代的到來,用戶對(duì)量大便宜算力的需求,壓過了對(duì)“頂級(jí)智商”的需求。
今年2月,開源框架OpenClaw火了,AI從“聊天工具”變成了能自己干活兒的“數(shù)字員工”。
一個(gè)Agent任務(wù)動(dòng)輒消耗幾十萬上百萬Token,按量付費(fèi)的API成本瞬間成了開發(fā)者的大頭開支。月之暗面順勢(shì)推出KimiClaw,支持一鍵部署,結(jié)果Kimi K2.5發(fā)布20天內(nèi)的調(diào)用量就超過了去年全年,累計(jì)收入也超過了2025年總和。

這也是Google和Anthropic封禁那些在訂閱制下進(jìn)行全自動(dòng)調(diào)用的賬戶,因?yàn)橛嗛嗁M(fèi)用是有限的,遠(yuǎn)遠(yuǎn)覆蓋不了全自動(dòng)調(diào)用的算力成本。
當(dāng)消耗量指數(shù)級(jí)增長時(shí),單位Token的價(jià)格優(yōu)勢(shì),就成了決定生死的競爭力。
這個(gè)成本優(yōu)勢(shì)不是憑空掉下來的,底層是電力和工程的支撐。
算力的盡頭是電力。
中國工業(yè)用電比美國低30%到40%,中西部綠電甚至低50%到70%。加上中國工業(yè)用電盤子大,可以充分利用谷電訓(xùn)練模型,這構(gòu)成了中國AI企業(yè)的物理成本護(hù)城河。
另一頭,是被迫卷出來的工程能力。從2024年4月起,中國AI企業(yè)就在尖端芯片斷供的狀態(tài)下活著,拿不到最好的卡,就把手里的卡壓榨到極限。
中國模型普遍采用混合專家架構(gòu),這一技術(shù)路線重構(gòu)了算力消耗邏輯。一個(gè)幾千億參數(shù)的模型,處理簡單問題時(shí)只激活其中一小部分“專家網(wǎng)絡(luò)”,這種“按需激活”的模式,省電省算力。
最后是開源生態(tài)的正向循環(huán)。
過去一年,中國大模型在全球的Token消耗占比增長了421%。斯坦福的報(bào)告說,2024年8月到2025年8月,中國開發(fā)者貢獻(xiàn)了Hugging Face總下載量的17.1%,略高于美國的15.8%。
開源生態(tài)降低了全球開發(fā)者的使用門檻,也讓中國模型在持續(xù)的技術(shù)反饋里快速迭代,能力和價(jià)格的綜合優(yōu)勢(shì)在擴(kuò)大。如硅谷投資人Aditya Agarwal所說:“50%以上的大模型調(diào)用通過廉價(jià)的開源模型完成,中國模型實(shí)際在支持大部分AI應(yīng)用,美國同行甚至無法替代。”
中國AI模型出海的成功,是技術(shù)架構(gòu)創(chuàng)新+極致成本控制+開源生態(tài)+場景適配共同作用的結(jié)果,也是系統(tǒng)性優(yōu)勢(shì)的集中爆發(fā)。
二、 出海模式:從應(yīng)用到算力、生態(tài)
如果說調(diào)用量數(shù)據(jù)解釋了中國AI“有多強(qiáng)”,那么接下來需要回答的是:這些Token究竟通過什么路徑流向全球?
過去幾年,中國AI出海的主流方式是“應(yīng)用輸出”,即,把AI能力封裝成APP,送到海外用戶手里。字節(jié)的Gauthmath、美圖的影像產(chǎn)品、快手的KLING AI,走的都是這條路。
到今天,這條路徑依然在貢獻(xiàn)可觀的用戶規(guī)模和收入。
以Talkie為例,這款情感陪伴類應(yīng)用覆蓋全球200多個(gè)國家,在北美Z世代中滲透率持續(xù)提升。用戶在和AI角色聊天的過程中,每一句話都在消耗Token。這類C端收入占Minimax收入的70%以上,且仍在快速增長中:2026 年 2 月日均 Token 消耗量達(dá)到了2025 年 12 月的 6 倍以上。
字節(jié)的Gauthmath在美國拍照搜題市場拿下47%的份額,成功替代老牌產(chǎn)品Mathway,也是同樣的邏輯。
這類模式不直接按Token向用戶收費(fèi),而是通過訂閱、內(nèi)購、廣告變現(xiàn)。但從底層看,它們消耗的依然是中國算力,是中國AI出海的“用戶基本盤”。
如果把AI出海比作一條產(chǎn)業(yè)鏈,應(yīng)用是下游,算力是上游。中國企業(yè)先在下游做產(chǎn)品、做流量,然后向上游走,做底層、做基建。
一方面,通過API管道式輸出,直接把算力做成水電煤。
海外開發(fā)者通過OpenRouter等聚合平臺(tái),調(diào)用中國大模型的API,推理在中國本土的數(shù)據(jù)中心完成,按Token付費(fèi)。整個(gè)過程,算力不出境,電力不出境,只有價(jià)值通過Token跨境交付。
這是一種典型的“賣水賣電”生意。開發(fā)者不需要自己部署模型,不需要買顯卡,就能讓應(yīng)用跑在中國的模型上。
據(jù)報(bào)道,月之暗面負(fù)責(zé)API服務(wù)的團(tuán)隊(duì)近期快速擴(kuò)編,以獨(dú)立業(yè)務(wù)分支形式直接向總裁張予彤匯報(bào)。組織層面的調(diào)整,足以說明API業(yè)務(wù)的重要性正在快速上升。
從商業(yè)角度看,這類模式的優(yōu)勢(shì)在于可規(guī)模化、利潤率可觀,而且隨著Agent時(shí)代到來,單次任務(wù)的Token消耗量指數(shù)級(jí)增長,API業(yè)務(wù)的想象空間還在放大。
另一方面,通過構(gòu)建開源生態(tài),為算力輸出修路。
阿里通義千問、DeepSeek系列選擇了一條看起來“免費(fèi)”的路:把模型權(quán)重、工具鏈、工程范式全部開源,海外開發(fā)者可以免費(fèi)下載,在本地服務(wù)器上部署。
免費(fèi)圖的是讓中國模型進(jìn)入全球開發(fā)者的默認(rèn)工具箱,成為他們技術(shù)棧的一部分。當(dāng)一個(gè)開發(fā)者用熟了開源模型,他未來開發(fā)商業(yè)應(yīng)用時(shí),自然會(huì)優(yōu)先考慮調(diào)用同系列的API。
基于阿里和DeepSeek開源模型的衍生模型上傳量,已經(jīng)超過基于美國主流模型的。這意味著全球開發(fā)者正在中國開源模型的基礎(chǔ)上,生長出一個(gè)龐大的技術(shù)生態(tài)。生態(tài)一旦形成,遷移成本就極高。
可以說,今天的中國AI出海,不再是單一的“應(yīng)用輸出”,而是一個(gè)三層結(jié)構(gòu):底層是開源生態(tài),通過開放換取開發(fā)者心智;中間層是API算力輸出,直接把Token賣給全球開發(fā)者,是商業(yè)化的核心引擎;頂層是應(yīng)用輸出,用產(chǎn)品觸達(dá)終端用戶,既是流量入口,也是算力消耗的重要場景。
三層相互支撐,共同說明,中國算力正在成為全球AI的底層基礎(chǔ)設(shè)施。
三、下半場考驗(yàn):商業(yè)優(yōu)勢(shì)遭遇規(guī)則壁壘
OpenRouter平臺(tái)上的數(shù)字確實(shí)亮眼,但OpenRouter不代表全貌。
消費(fèi)級(jí)市場(開發(fā)者、初創(chuàng)公司、Agent應(yīng)用)的決策鏈條短,核心指標(biāo)是性價(jià)比+上手快。開發(fā)者用哪個(gè)模型,往往自己說了算。這個(gè)邏輯下,中國模型的“便宜量又足”是絕對(duì)優(yōu)勢(shì)。
企業(yè)級(jí)市場不一樣。政府、金融、醫(yī)療、關(guān)鍵基礎(chǔ)設(shè)施,決策鏈條長,涉及合規(guī)、安全、審計(jì)、供應(yīng)商穩(wěn)定性等等。
海外的企業(yè)級(jí)市場就更復(fù)雜了。
所以,有一個(gè)問題是繞不開的,即,在國際競爭中,純商業(yè)方面的競爭優(yōu)勢(shì),比如好用、成本低,可能還不夠。
比如,此前的英偉達(dá)H200被禁止出口。雖然現(xiàn)在已經(jīng)可以進(jìn)口英偉達(dá)H200,但在AI競爭層面,美國的政策指不定又會(huì)出現(xiàn)什么“反復(fù)”,而當(dāng)前推理集群還是離不開英偉達(dá)的H100/H200。
當(dāng)然,封鎖具有雙面性,一方面會(huì)使得訓(xùn)練成本上升,模型迭代速度放緩,另一方面正是這種背景,倒逼工程優(yōu)化提升效率,國產(chǎn)芯片取得進(jìn)展。
但風(fēng)險(xiǎn)同樣存在。銀河證券的研報(bào)指出,全球模型迭代周期正在縮短,主流模型更新頻率已由半年縮短至數(shù)月。如果核心能力提升速度放緩,成本優(yōu)勢(shì)可能在高端市場迅速失去吸引力。
大摩首席經(jīng)濟(jì)學(xué)家邢自強(qiáng)認(rèn)為,Token出海肯定是有空間的,但不要過度吹捧中國的開源大模型、Token出海借助電力優(yōu)勢(shì),而忽視了地緣政治與安全考量。
他舉例稱,中國在5G設(shè)備領(lǐng)域同樣有性價(jià)比和技術(shù)優(yōu)勢(shì),但從2018、2019年之后,歐美不少電信網(wǎng)絡(luò)中,中國的5G基站還是被替代了。
在企業(yè)級(jí)市場,對(duì)價(jià)格敏感的中小企業(yè)可能被中國模型的性價(jià)比穿透,但在政府、金融、醫(yī)療等涉及數(shù)據(jù)主權(quán)和關(guān)鍵基礎(chǔ)設(shè)施的領(lǐng)域,準(zhǔn)入邏輯從“性價(jià)比”轉(zhuǎn)向“合規(guī)信任、品牌認(rèn)知與生態(tài)鎖定”。
美國正通過投資審查、標(biāo)準(zhǔn)制定、數(shù)據(jù)主權(quán)規(guī)則,系統(tǒng)性地構(gòu)筑企業(yè)級(jí)市場的準(zhǔn)入門檻。
這意味著地緣政治的“天花板”正在降低。
2025年12月,美國政府提出所謂的“硅和平倡議”(Pax Silica),聲稱要把擁有全球頂尖科技企業(yè)或其他優(yōu)勢(shì)資源的國家聯(lián)合起來,以確保“供應(yīng)鏈安全”等。
專業(yè)人士認(rèn)為,這是試圖用規(guī)則、投資與項(xiàng)目清單重塑全球技術(shù)分工與資本流向,看起來是走向了重塑生態(tài),實(shí)際上是包裝下的排他性整合。
這個(gè)“他”是誰,不言而喻。
從芯片封鎖到“硅和平倡議”,從遏制發(fā)展到規(guī)則輸出,美國的目標(biāo)是從生態(tài)層面重塑游戲規(guī)則、掌握話語權(quán)。
所以,模型調(diào)用量反超,是階段性的成果,但也是故事的一半。
AI出海的下半場,需要在保持成本優(yōu)勢(shì)的同時(shí),面對(duì)更多、更復(fù)雜的問題,有的問題可以靠提升模型性能、系統(tǒng)效率、競爭力來解決,有的問題沒有答案。
原文標(biāo)題 : 硅谷程序員,瘋狂“投喂”中國大模型
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來了
-

OpenAI發(fā)布的AI瀏覽器,市場為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬
-

長安汽車母公司突然更名:從“中國長安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
即日-5.20立即下載>> 【限時(shí)免費(fèi)】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機(jī)器人行業(yè)年度評(píng)選
-
精彩回顧立即查看>> 【在線會(huì)議】液冷服務(wù)器信號(hào)完整性及冷卻液關(guān)鍵電參數(shù)測(cè)試
推薦專題
- 1 特斯拉Optimus Gen3量產(chǎn)在即,哪些環(huán)節(jié)最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測(cè):中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了
- 3 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 6000億美元估值錨定:字節(jié)跳動(dòng)的“去單一化”突圍與估值重構(gòu)
- 5 Tesla AI5芯片最新進(jìn)展總結(jié)
- 6 連夜測(cè)了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個(gè)短板了
- 7 熱點(diǎn)丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 8 2026,人形機(jī)器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號(hào),還繼續(xù)扣錢!
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





