gogogo西西免费高清国语版,国产va免费高清在线观看,继续播放免费观看最新一期高清,歪歪影视收藏我们不迷路

硅谷程序員，瘋狂“投喂”中國大模型

2026-03-08 09:50

作者：賈樂樂，編輯：趙元

一組來自全球最大AI模型API聚合平臺(tái)OpenRouter的數(shù)據(jù)，在國內(nèi)外都引發(fā)了強(qiáng)烈震動(dòng)。

截至2026年2月28日，該平臺(tái)內(nèi)前十模型總Token消耗量已突破28.7萬億，其中，國產(chǎn)模型貢獻(xiàn)超過14.69萬億，為歷史上首次單月Token調(diào)用占比過半，且超越了美國模型。

從周維度看，2月16日至2 2日，中國模型周調(diào)用量達(dá)5.16萬億Token，而同期美國模型跌至2.7萬億，中國模型全球占比達(dá)61%。調(diào)用量排名前五的模型中，中國占據(jù)四席——MiniMax M2.5、月之暗面 Kimi K2.5、DeepSeek V3.2和智譜GLM-5。

盡管接下來的一周，中國模型調(diào)用量下降，反超的時(shí)間很短暫，但能在全球最大的API聚合平臺(tái)上與美國模型正面交鋒并短暫領(lǐng)先，本身已是實(shí)力的證明。

此外，OpenRouter平臺(tái)的用戶中，美國開發(fā)者占比高達(dá)47.17%，而中國開發(fā)者僅占6.01%。也有報(bào)告顯示，80%的美國人工智能初創(chuàng)公司在其產(chǎn)品開發(fā)過程中使用了中國的開源模型。

這意味著，推動(dòng)中國模型登頂?shù)闹髁︓姡悄切﹣碜怨韫取碜詺W洲的海外開發(fā)者，而非國內(nèi)市場的自嗨。

這是因?yàn)榇竽Ｐ蛷?ldquo;誰更聰明”的單維比拼，進(jìn)入到了“誰聰明”“誰省錢”的多維比拼階段。

一、真香定律：美國開發(fā)者愛上中國Token

中國AI模型能夠在全球調(diào)用量上實(shí)現(xiàn)對(duì)美國的超越，背后是多重因素疊加形成的系統(tǒng)性優(yōu)勢(shì)，而其中直接的驅(qū)動(dòng)力是，便宜。

先看一組數(shù)字。

長江證券的研報(bào)顯示，在輸入價(jià)格上，MiniMax M2.5和智譜GLM-5都是0.3美元/百萬Token，而Anthropic的Claude Opus 4.6是5美元，是中國模型的16.7倍。

輸出端更夸張，MiniMax-M2.5 價(jià)格為1.1 美元/百萬Token，智譜GLM-5 為2.55 美元/百萬Token，Claude Opus4.6 則為25 美元/百萬Token，分別是前兩者的約22.7 倍和9.8 倍。2月底剛出的阿里Qwen 3.5，直接把百萬Token價(jià)格打到0.8元人民幣，相當(dāng)于谷歌Gemini的十八分之一。

而在大量日常場景里，尤其是伴隨著Agent時(shí)代的到來，用戶對(duì)量大便宜算力的需求，壓過了對(duì)“頂級(jí)智商”的需求。

今年2月，開源框架OpenClaw火了，AI從“聊天工具”變成了能自己干活兒的“數(shù)字員工”。

一個(gè)Agent任務(wù)動(dòng)輒消耗幾十萬上百萬Token，按量付費(fèi)的API成本瞬間成了開發(fā)者的大頭開支。月之暗面順勢(shì)推出KimiClaw，支持一鍵部署，結(jié)果Kimi K2.5發(fā)布20天內(nèi)的調(diào)用量就超過了去年全年，累計(jì)收入也超過了2025年總和。

這也是Google和Anthropic封禁那些在訂閱制下進(jìn)行全自動(dòng)調(diào)用的賬戶，因?yàn)橛嗛嗁M(fèi)用是有限的，遠(yuǎn)遠(yuǎn)覆蓋不了全自動(dòng)調(diào)用的算力成本。

當(dāng)消耗量指數(shù)級(jí)增長時(shí)，單位Token的價(jià)格優(yōu)勢(shì)，就成了決定生死的競爭力。

這個(gè)成本優(yōu)勢(shì)不是憑空掉下來的，底層是電力和工程的支撐。

算力的盡頭是電力。

中國工業(yè)用電比美國低30%到40%，中西部綠電甚至低50%到70%。加上中國工業(yè)用電盤子大，可以充分利用谷電訓(xùn)練模型，這構(gòu)成了中國AI企業(yè)的物理成本護(hù)城河。

另一頭，是被迫卷出來的工程能力。從2024年4月起，中國AI企業(yè)就在尖端芯片斷供的狀態(tài)下活著，拿不到最好的卡，就把手里的卡壓榨到極限。

中國模型普遍采用混合專家架構(gòu)，這一技術(shù)路線重構(gòu)了算力消耗邏輯。一個(gè)幾千億參數(shù)的模型，處理簡單問題時(shí)只激活其中一小部分“專家網(wǎng)絡(luò)”，這種“按需激活”的模式，省電省算力。

最后是開源生態(tài)的正向循環(huán)。

過去一年，中國大模型在全球的Token消耗占比增長了421%。斯坦福的報(bào)告說，2024年8月到2025年8月，中國開發(fā)者貢獻(xiàn)了Hugging Face總下載量的17.1%，略高于美國的15.8%。

開源生態(tài)降低了全球開發(fā)者的使用門檻，也讓中國模型在持續(xù)的技術(shù)反饋里快速迭代，能力和價(jià)格的綜合優(yōu)勢(shì)在擴(kuò)大。如硅谷投資人Aditya Agarwal所說：“50%以上的大模型調(diào)用通過廉價(jià)的開源模型完成，中國模型實(shí)際在支持大部分AI應(yīng)用，美國同行甚至無法替代。”

中國AI模型出海的成功，是技術(shù)架構(gòu)創(chuàng)新+極致成本控制+開源生態(tài)+場景適配共同作用的結(jié)果，也是系統(tǒng)性優(yōu)勢(shì)的集中爆發(fā)。

二、出海模式：從應(yīng)用到算力、生態(tài)

如果說調(diào)用量數(shù)據(jù)解釋了中國AI“有多強(qiáng)”，那么接下來需要回答的是：這些Token究竟通過什么路徑流向全球？

過去幾年，中國AI出海的主流方式是“應(yīng)用輸出”，即，把AI能力封裝成APP，送到海外用戶手里。字節(jié)的Gauthmath、美圖的影像產(chǎn)品、快手的KLING AI，走的都是這條路。

到今天，這條路徑依然在貢獻(xiàn)可觀的用戶規(guī)模和收入。

以Talkie為例，這款情感陪伴類應(yīng)用覆蓋全球200多個(gè)國家，在北美Z世代中滲透率持續(xù)提升。用戶在和AI角色聊天的過程中，每一句話都在消耗Token。這類C端收入占Minimax收入的70%以上，且仍在快速增長中：2026 年 2 月日均 Token 消耗量達(dá)到了2025 年 12 月的 6 倍以上。

字節(jié)的Gauthmath在美國拍照搜題市場拿下47%的份額，成功替代老牌產(chǎn)品Mathway，也是同樣的邏輯。

這類模式不直接按Token向用戶收費(fèi)，而是通過訂閱、內(nèi)購、廣告變現(xiàn)。但從底層看，它們消耗的依然是中國算力，是中國AI出海的“用戶基本盤”。

如果把AI出海比作一條產(chǎn)業(yè)鏈，應(yīng)用是下游，算力是上游。中國企業(yè)先在下游做產(chǎn)品、做流量，然后向上游走，做底層、做基建。

一方面，通過API管道式輸出，直接把算力做成水電煤。

海外開發(fā)者通過OpenRouter等聚合平臺(tái)，調(diào)用中國大模型的API，推理在中國本土的數(shù)據(jù)中心完成，按Token付費(fèi)。整個(gè)過程，算力不出境，電力不出境，只有價(jià)值通過Token跨境交付。

這是一種典型的“賣水賣電”生意。開發(fā)者不需要自己部署模型，不需要買顯卡，就能讓應(yīng)用跑在中國的模型上。

據(jù)報(bào)道，月之暗面負(fù)責(zé)API服務(wù)的團(tuán)隊(duì)近期快速擴(kuò)編，以獨(dú)立業(yè)務(wù)分支形式直接向總裁張予彤匯報(bào)。組織層面的調(diào)整，足以說明API業(yè)務(wù)的重要性正在快速上升。

從商業(yè)角度看，這類模式的優(yōu)勢(shì)在于可規(guī)模化、利潤率可觀，而且隨著Agent時(shí)代到來，單次任務(wù)的Token消耗量指數(shù)級(jí)增長，API業(yè)務(wù)的想象空間還在放大。

另一方面，通過構(gòu)建開源生態(tài)，為算力輸出修路。

阿里通義千問、DeepSeek系列選擇了一條看起來“免費(fèi)”的路：把模型權(quán)重、工具鏈、工程范式全部開源，海外開發(fā)者可以免費(fèi)下載，在本地服務(wù)器上部署。

免費(fèi)圖的是讓中國模型進(jìn)入全球開發(fā)者的默認(rèn)工具箱，成為他們技術(shù)棧的一部分。當(dāng)一個(gè)開發(fā)者用熟了開源模型，他未來開發(fā)商業(yè)應(yīng)用時(shí)，自然會(huì)優(yōu)先考慮調(diào)用同系列的API。

基于阿里和DeepSeek開源模型的衍生模型上傳量，已經(jīng)超過基于美國主流模型的。這意味著全球開發(fā)者正在中國開源模型的基礎(chǔ)上，生長出一個(gè)龐大的技術(shù)生態(tài)。生態(tài)一旦形成，遷移成本就極高。

可以說，今天的中國AI出海，不再是單一的“應(yīng)用輸出”，而是一個(gè)三層結(jié)構(gòu)：底層是開源生態(tài)，通過開放換取開發(fā)者心智；中間層是API算力輸出，直接把Token賣給全球開發(fā)者，是商業(yè)化的核心引擎；頂層是應(yīng)用輸出，用產(chǎn)品觸達(dá)終端用戶，既是流量入口，也是算力消耗的重要場景。

三層相互支撐，共同說明，中國算力正在成為全球AI的底層基礎(chǔ)設(shè)施。

三、下半場考驗(yàn)：商業(yè)優(yōu)勢(shì)遭遇規(guī)則壁壘

OpenRouter平臺(tái)上的數(shù)字確實(shí)亮眼，但OpenRouter不代表全貌。

消費(fèi)級(jí)市場（開發(fā)者、初創(chuàng)公司、Agent應(yīng)用）的決策鏈條短，核心指標(biāo)是性價(jià)比+上手快。開發(fā)者用哪個(gè)模型，往往自己說了算。這個(gè)邏輯下，中國模型的“便宜量又足”是絕對(duì)優(yōu)勢(shì)。

企業(yè)級(jí)市場不一樣。政府、金融、醫(yī)療、關(guān)鍵基礎(chǔ)設(shè)施，決策鏈條長，涉及合規(guī)、安全、審計(jì)、供應(yīng)商穩(wěn)定性等等。

海外的企業(yè)級(jí)市場就更復(fù)雜了。

所以，有一個(gè)問題是繞不開的，即，在國際競爭中，純商業(yè)方面的競爭優(yōu)勢(shì)，比如好用、成本低，可能還不夠。

比如，此前的英偉達(dá)H200被禁止出口。雖然現(xiàn)在已經(jīng)可以進(jìn)口英偉達(dá)H200，但在AI競爭層面，美國的政策指不定又會(huì)出現(xiàn)什么“反復(fù)”，而當(dāng)前推理集群還是離不開英偉達(dá)的H100/H200。

當(dāng)然，封鎖具有雙面性，一方面會(huì)使得訓(xùn)練成本上升，模型迭代速度放緩，另一方面正是這種背景，倒逼工程優(yōu)化提升效率，國產(chǎn)芯片取得進(jìn)展。

但風(fēng)險(xiǎn)同樣存在。銀河證券的研報(bào)指出，全球模型迭代周期正在縮短，主流模型更新頻率已由半年縮短至數(shù)月。如果核心能力提升速度放緩，成本優(yōu)勢(shì)可能在高端市場迅速失去吸引力。

大摩首席經(jīng)濟(jì)學(xué)家邢自強(qiáng)認(rèn)為，Token出海肯定是有空間的，但不要過度吹捧中國的開源大模型、Token出海借助電力優(yōu)勢(shì)，而忽視了地緣政治與安全考量。

他舉例稱，中國在5G設(shè)備領(lǐng)域同樣有性價(jià)比和技術(shù)優(yōu)勢(shì)，但從2018、2019年之后，歐美不少電信網(wǎng)絡(luò)中，中國的5G基站還是被替代了。

在企業(yè)級(jí)市場，對(duì)價(jià)格敏感的中小企業(yè)可能被中國模型的性價(jià)比穿透，但在政府、金融、醫(yī)療等涉及數(shù)據(jù)主權(quán)和關(guān)鍵基礎(chǔ)設(shè)施的領(lǐng)域，準(zhǔn)入邏輯從“性價(jià)比”轉(zhuǎn)向“合規(guī)信任、品牌認(rèn)知與生態(tài)鎖定”。

美國正通過投資審查、標(biāo)準(zhǔn)制定、數(shù)據(jù)主權(quán)規(guī)則，系統(tǒng)性地構(gòu)筑企業(yè)級(jí)市場的準(zhǔn)入門檻。

這意味著地緣政治的“天花板”正在降低。

2025年12月，美國政府提出所謂的“硅和平倡議”（Pax Silica），聲稱要把擁有全球頂尖科技企業(yè)或其他優(yōu)勢(shì)資源的國家聯(lián)合起來，以確保“供應(yīng)鏈安全”等。

專業(yè)人士認(rèn)為，這是試圖用規(guī)則、投資與項(xiàng)目清單重塑全球技術(shù)分工與資本流向，看起來是走向了重塑生態(tài)，實(shí)際上是包裝下的排他性整合。

這個(gè)“他”是誰，不言而喻。

從芯片封鎖到“硅和平倡議”，從遏制發(fā)展到規(guī)則輸出，美國的目標(biāo)是從生態(tài)層面重塑游戲規(guī)則、掌握話語權(quán)。

所以，模型調(diào)用量反超，是階段性的成果，但也是故事的一半。

AI出海的下半場，需要在保持成本優(yōu)勢(shì)的同時(shí)，面對(duì)更多、更復(fù)雜的問題，有的問題可以靠提升模型性能、系統(tǒng)效率、競爭力來解決，有的問題沒有答案。

原文標(biāo)題 : 硅谷程序員，瘋狂“投喂”中國大模型