算力上演“權(quán)力游戲”:當(dāng)云巨頭不再忍受英偉達(dá)“昂貴租金”

不是替代,是重構(gòu),NPU讓AI算力進(jìn)入“樂高時代”。
作者 | 張思
來源 | 硅基象限
過去十年,AI算力的敘事幾乎被一家公司定義——NVIDIA(英偉達(dá))。
從A100到H100,再到H200,GPU像一條不斷擴(kuò)展的算力工業(yè)流水線,把深度學(xué)習(xí)從實驗室推向大模型時代。
但一個被長期忽視的問題是:GPU最初并不是為AI而生,是為圖形渲染而生。
這意味著它從一開始就是“通用并行計算架構(gòu)”,而不是“AI原生架構(gòu)”。
于是,一個更底層的趨勢開始出現(xiàn):
當(dāng)AI計算規(guī)模指數(shù)級增長時,GPU的邊際效率開始下降。
產(chǎn)業(yè)開始向另一個方向轉(zhuǎn)型,重新設(shè)計計算范式,一種依靠專用計算芯片設(shè)計邏輯(ASIC)的算力芯片——NPU誕生了!
美國時間4月22日,在Google Cloud Next活動上,谷歌推出兩款第八代NPU芯片,TPU8t、TPU8i分別用于AI訓(xùn)練和AI推理。TPU8t每瓦性能上比前代產(chǎn)品提升124%,TPU8i提升117% ,TPU8i的每美元性能提升80%。業(yè)內(nèi)評論,“其如果對外出售,或?qū)⑷〈ミ_(dá)”。
云服務(wù)廠搞芯片,并非是谷歌的獨特路線。
全球云服務(wù)市場的“老大”亞馬遜,在2018年發(fā)布首款用于推理的 NPU—Inferentia1,并在2023年推出了第二代Inferentia2,并在去年底發(fā)布用于訓(xùn)練的NPU,Trainium3;排名第二的微軟云也在2023年發(fā)布了首款云端NPU(Maia 100),并在今年初發(fā)布了Maia 200。
國內(nèi)亦如此。阿里在2019年發(fā)布首款NPU(含光800),專注云端推理和視覺計算;2018 年開始百度發(fā)布基于ASIC邏輯的自研AI芯片昆侖1,并已迭代至昆侖芯3代。
2026年,算力芯片的大客戶,字節(jié)跳動也將對NPU下手。外媒透露字節(jié)跳動已開始與三星洽談自研NPU芯片,代號SeedChip,專為AI推理任務(wù)設(shè)計,預(yù)計2026年3月底前交付首批樣品。
2026年的趨勢是芯片不再是一整塊,谷歌、字節(jié)、阿里們想在英偉達(dá)的平臺上,“拼”入自己的專用模塊。
云廠商自研NPU,或?qū)⒏淖傾I成本結(jié)構(gòu)、能耗曲線,甚至商業(yè)模式。
01什么是 NPU?
谷歌TPU、阿里含光800等本質(zhì)是一種NPU形態(tài)。
NPU(Neural Processing Unit)芯片,英文直接翻譯過來就是神經(jīng)網(wǎng)絡(luò)處理芯片。
要理解NPU和GPU的差別,可以先從它們的底層邏輯開始,NPU廣義上屬于專用處理芯片(ASIC),而GPU屬于通用處理芯片。
芯片按設(shè)計邏輯可以被分為三類,通用計算芯片、FPGA(可重構(gòu)硬件)和ASIC (專用處理芯片)。
第一是通用計算芯片,諸如CPU和GPU,一條指令驅(qū)動成百上千線程并行執(zhí)行,非常擅長處理大規(guī)模并行計算,通常不改變硬件,而是通過軟件(CUDA)改變“任務(wù)調(diào)度”。這就是為什么大家都說英偉達(dá)其實是一家軟件公司,GPU核心特征是高度可編程、適配所有計算任務(wù)、架構(gòu)復(fù)雜(需要很多緩存)。但代價是通用性越強(qiáng),效率越低。
第二類是 ASIC(專用定制芯片),它是為了某一個特定任務(wù)(比如識別圖像、處理語音)而專門定制的,數(shù)據(jù)流固定、能效極高,是一種“把算法固化進(jìn)硅片”的設(shè)計方法。缺點是一旦電路壓印在硅片上,功能就無法更改,不夠靈活。ASIC的本質(zhì)是把AI計算從“軟件問題”變成“物理問題”,但它也意味著靈活性最低、更新周期長。
第三類是FPGA(可重構(gòu)硬件),其可以通過“重新布線” 改變芯片硬件布局和改變軟件代碼,來改變芯片功能,像一套“樂高積木”,它介于通用和專用之間,常用于算法迭代快的原型開發(fā)或邊緣計算。
GPU功能強(qiáng)大,可以并行做很多事,要是把這些能力都用上,可以無比強(qiáng)大,但是單價更高,也更費電,而 NPU只做一件事或一類事,功能單一,但是單價低也更省電。
02不賣芯片,只做更具性價比的云
云服務(wù)商并不賣芯片,而是想要提供更具性價比的算力。
在2015年,谷歌就開始研究NPU,當(dāng)時,谷歌發(fā)現(xiàn)一個問題:其數(shù)據(jù)中心中,神經(jīng)網(wǎng)絡(luò)推理需求暴漲,但GPU效率不足。
于是,谷歌內(nèi)部啟動了TPU項目。2015年第一代僅用于數(shù)據(jù)推理的TPU誕生,2018年對外開放Google Cloud TPU,2020–2024年開始進(jìn)入“訓(xùn)練+推理一體化”階段。
2026年,隨著TPU 8發(fā)布,谷歌首次明確分成兩條路線:用于訓(xùn)練的TPU 8t和用于推理的TPU 8i,這背后反映的是一個更大的趨勢:AI算力的重心,正在從訓(xùn)練轉(zhuǎn)向推理。
行業(yè)機(jī)構(gòu)預(yù)計,到2030年,75%-80%的AI算力將用于推理。這意味著GPT訓(xùn)練一次,推理運行數(shù)億次。因此,誰能把 1 分錢的推理成本壓到 0.1 分,誰就是 未來的算力王者。
谷歌的兩款芯片分別由兩個合作方設(shè)計,TPU8t由博通設(shè)計, TPU8i由聯(lián)發(fā)科設(shè)計,兩顆都或?qū)⒒谂_積電2nm工藝,預(yù)計2027年底量產(chǎn)。TPU 8最核心變化在于試圖解決“內(nèi)存墻”問題,通過更高帶寬HBM、更密集的片間互聯(lián)。

據(jù)悉,此次TPU8對比上一代Ironwood產(chǎn)品,TPU 8i 推理芯片HBM容量從216GB增到288GB,帶寬從6528提到8601GB/s,片上 SRAM提升三倍達(dá)384M。集群規(guī)模從數(shù)萬顆擴(kuò)到13.4萬顆,最多可連100萬顆。
NPU并不是谷歌獨角戲,亞馬遜、微軟等都有NPU產(chǎn)品,而國內(nèi)華為昇騰(Ascend)、寒武紀(jì)、地平線等也有類似產(chǎn)品發(fā)布。
以前云廠商買英偉達(dá)的“全家桶”,現(xiàn)在他們想買英偉達(dá)的“地基”,自己蓋“房子”。
03掌握算力時代主動權(quán)
TPU 8系列發(fā)布背后,是一個非常清晰的戰(zhàn)略:去英偉達(dá)化。
如果TPU成功,AI算力將從“GPU壟斷”變成“多架構(gòu)競爭”。
但取代“英偉達(dá)“,卻并不容易。
最重要的問題是生態(tài),英偉達(dá)的CUDA仍然是行業(yè)標(biāo)準(zhǔn),CUDA 有 400 萬開發(fā)者。另一方面,TPU功能太過單一,GPU可以用于AI訓(xùn)練和推理、圖形處理和渲染,但是TPU的功能單一。
業(yè)內(nèi)人士普遍認(rèn)為,NPU的意義不是“替代GPU”,而是重新定義AI算力結(jié)構(gòu)。未來可能出現(xiàn),GPU作為通用算力底座、TPU/NPU作為AI專用加速層。
英偉達(dá)也看到了這個趨勢,在2025年底,英偉達(dá)斥資 200 億美元對 Groq 進(jìn)行收購,Groq研發(fā)的 LPU (Language Processing Unit) ,在運行大模型(LLM)時,其速度是傳統(tǒng) GPU 的 10 倍以上。
這就像是過去十年,大多手機(jī)廠商的競爭。當(dāng)手機(jī)里最重要的Soc芯片已經(jīng)被高通、聯(lián)發(fā)科壟斷,具備強(qiáng)大的護(hù)城河,自研Soc芯片需要付出很大的成本且面臨高風(fēng)險。
那么,想要有獨特優(yōu)勢、在市場上更具競爭力,大多數(shù)手機(jī)企業(yè)不會選擇自研Soc芯片,而是針對Soc芯片的局部功能做優(yōu)化。
此前,三星、vivo、OPPO等手機(jī)廠商都選擇自研用于提升拍照能力的NPU芯片,實現(xiàn)差異化,比如vivo藍(lán)圖影像芯片、OPPO馬里亞納 MariSilicon芯片。
云廠商的算力競爭也接近白熱化,越來越多用于訓(xùn)練和推理的NPU將會出現(xiàn),并不斷提升能力。
未來真正的算力產(chǎn)業(yè)分水嶺將是:誰能把AI推理成本壓到極致,誰就掌握下一代算力時代主動權(quán)。
原文標(biāo)題 : 算力上演“權(quán)力游戲”:當(dāng)云巨頭不再忍受英偉達(dá)“昂貴租金”
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-5.20立即下載>> 【限時免費】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機(jī)器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機(jī)器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會議】液冷服務(wù)器信號完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 特斯拉Optimus Gen3量產(chǎn)在即,哪些環(huán)節(jié)最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩(wěn)、細(xì)節(jié)炸,設(shè)計師慌了
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 6000億美元估值錨定:字節(jié)跳動的“去單一化”突圍與估值重構(gòu)
- 5 Tesla AI5芯片最新進(jìn)展總結(jié)
- 6 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個短板了
- 7 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 8 2026,人形機(jī)器人只贏了面子
- 9 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續(xù)扣錢!
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













