欧美の无码国产の无码影院,久久人人爽人人爽人人片?V麻烦,欧美亚洲中文高清,韩国电视剧

算力上演“權(quán)力游戲”：當(dāng)云巨頭不再忍受英偉達(dá)“昂貴租金”

2026-04-24 15:48

硅基象限

關(guān)注

不是替代，是重構(gòu)，NPU讓AI算力進(jìn)入“樂高時代”。

作者 | 張思

來源 | 硅基象限

過去十年，AI算力的敘事幾乎被一家公司定義——NVIDIA（英偉達(dá)）。

從A100到H100，再到H200，GPU像一條不斷擴(kuò)展的算力工業(yè)流水線，把深度學(xué)習(xí)從實驗室推向大模型時代。

但一個被長期忽視的問題是：GPU最初并不是為AI而生，是為圖形渲染而生。

這意味著它從一開始就是“通用并行計算架構(gòu)”，而不是“AI原生架構(gòu)”。

于是，一個更底層的趨勢開始出現(xiàn)：

當(dāng)AI計算規(guī)模指數(shù)級增長時，GPU的邊際效率開始下降。

產(chǎn)業(yè)開始向另一個方向轉(zhuǎn)型，重新設(shè)計計算范式，一種依靠專用計算芯片設(shè)計邏輯（ASIC）的算力芯片——NPU誕生了！

美國時間4月22日，在Google Cloud Next活動上，谷歌推出兩款第八代NPU芯片，TPU8t、TPU8i分別用于AI訓(xùn)練和AI推理。TPU8t每瓦性能上比前代產(chǎn)品提升124%，TPU8i提升117% ，TPU8i的每美元性能提升80%。業(yè)內(nèi)評論，“其如果對外出售，或?qū)⑷〈ミ_(dá)”。

云服務(wù)廠搞芯片，并非是谷歌的獨特路線。

全球云服務(wù)市場的“老大”亞馬遜，在2018年發(fā)布首款用于推理的 NPU—Inferentia1，并在2023年推出了第二代Inferentia2，并在去年底發(fā)布用于訓(xùn)練的NPU，Trainium3；排名第二的微軟云也在2023年發(fā)布了首款云端NPU（Maia 100），并在今年初發(fā)布了Maia 200。

國內(nèi)亦如此。阿里在2019年發(fā)布首款NPU（含光800），專注云端推理和視覺計算；2018 年開始百度發(fā)布基于ASIC邏輯的自研AI芯片昆侖1，并已迭代至昆侖芯3代。

2026年，算力芯片的大客戶，字節(jié)跳動也將對NPU下手。外媒透露字節(jié)跳動已開始與三星洽談自研NPU芯片，代號SeedChip，專為AI推理任務(wù)設(shè)計，預(yù)計2026年3月底前交付首批樣品。

2026年的趨勢是芯片不再是一整塊，谷歌、字節(jié)、阿里們想在英偉達(dá)的平臺上，“拼”入自己的專用模塊。

云廠商自研NPU，或?qū)⒏淖傾I成本結(jié)構(gòu)、能耗曲線，甚至商業(yè)模式。

01什么是 NPU？

谷歌TPU、阿里含光800等本質(zhì)是一種NPU形態(tài)。

NPU（Neural Processing Unit）芯片，英文直接翻譯過來就是神經(jīng)網(wǎng)絡(luò)處理芯片。

要理解NPU和GPU的差別，可以先從它們的底層邏輯開始，NPU廣義上屬于專用處理芯片（ASIC），而GPU屬于通用處理芯片。

芯片按設(shè)計邏輯可以被分為三類，通用計算芯片、FPGA（可重構(gòu)硬件）和ASIC （專用處理芯片）。

第一是通用計算芯片，諸如CPU和GPU，一條指令驅(qū)動成百上千線程并行執(zhí)行，非常擅長處理大規(guī)模并行計算，通常不改變硬件，而是通過軟件（CUDA）改變“任務(wù)調(diào)度”。這就是為什么大家都說英偉達(dá)其實是一家軟件公司，GPU核心特征是高度可編程、適配所有計算任務(wù)、架構(gòu)復(fù)雜（需要很多緩存）。但代價是通用性越強(qiáng)，效率越低。

第二類是 ASIC（專用定制芯片），它是為了某一個特定任務(wù)（比如識別圖像、處理語音）而專門定制的，數(shù)據(jù)流固定、能效極高，是一種“把算法固化進(jìn)硅片”的設(shè)計方法。缺點是一旦電路壓印在硅片上，功能就無法更改，不夠靈活。ASIC的本質(zhì)是把AI計算從“軟件問題”變成“物理問題”，但它也意味著靈活性最低、更新周期長。

第三類是FPGA（可重構(gòu)硬件），其可以通過“重新布線” 改變芯片硬件布局和改變軟件代碼，來改變芯片功能，像一套“樂高積木”，它介于通用和專用之間，常用于算法迭代快的原型開發(fā)或邊緣計算。

GPU功能強(qiáng)大，可以并行做很多事，要是把這些能力都用上，可以無比強(qiáng)大，但是單價更高，也更費電，而 NPU只做一件事或一類事，功能單一，但是單價低也更省電。

02不賣芯片，只做更具性價比的云

云服務(wù)商并不賣芯片，而是想要提供更具性價比的算力。

在2015年，谷歌就開始研究NPU，當(dāng)時，谷歌發(fā)現(xiàn)一個問題：其數(shù)據(jù)中心中，神經(jīng)網(wǎng)絡(luò)推理需求暴漲，但GPU效率不足。

于是，谷歌內(nèi)部啟動了TPU項目。2015年第一代僅用于數(shù)據(jù)推理的TPU誕生，2018年對外開放Google Cloud TPU，2020–2024年開始進(jìn)入“訓(xùn)練+推理一體化”階段。

2026年，隨著TPU 8發(fā)布，谷歌首次明確分成兩條路線：用于訓(xùn)練的TPU 8t和用于推理的TPU 8i，這背后反映的是一個更大的趨勢：AI算力的重心，正在從訓(xùn)練轉(zhuǎn)向推理。

行業(yè)機(jī)構(gòu)預(yù)計，到2030年，75%-80%的AI算力將用于推理。這意味著GPT訓(xùn)練一次，推理運行數(shù)億次。因此，誰能把 1 分錢的推理成本壓到 0.1 分，誰就是未來的算力王者。

谷歌的兩款芯片分別由兩個合作方設(shè)計，TPU8t由博通設(shè)計， TPU8i由聯(lián)發(fā)科設(shè)計，兩顆都或?qū)⒒谂_積電2nm工藝，預(yù)計2027年底量產(chǎn)。TPU 8最核心變化在于試圖解決“內(nèi)存墻”問題，通過更高帶寬HBM、更密集的片間互聯(lián)。

據(jù)悉，此次TPU8對比上一代Ironwood產(chǎn)品，TPU 8i 推理芯片HBM容量從216GB增到288GB，帶寬從6528提到8601GB/s，片上 SRAM提升三倍達(dá)384M。集群規(guī)模從數(shù)萬顆擴(kuò)到13.4萬顆，最多可連100萬顆。

NPU并不是谷歌獨角戲，亞馬遜、微軟等都有NPU產(chǎn)品，而國內(nèi)華為昇騰（Ascend）、寒武紀(jì)、地平線等也有類似產(chǎn)品發(fā)布。

以前云廠商買英偉達(dá)的“全家桶”，現(xiàn)在他們想買英偉達(dá)的“地基”，自己蓋“房子”。

03掌握算力時代主動權(quán)

TPU 8系列發(fā)布背后，是一個非常清晰的戰(zhàn)略：去英偉達(dá)化。

如果TPU成功，AI算力將從“GPU壟斷”變成“多架構(gòu)競爭”。

但取代“英偉達(dá)“，卻并不容易。

最重要的問題是生態(tài)，英偉達(dá)的CUDA仍然是行業(yè)標(biāo)準(zhǔn)，CUDA 有 400 萬開發(fā)者。另一方面，TPU功能太過單一，GPU可以用于AI訓(xùn)練和推理、圖形處理和渲染，但是TPU的功能單一。

業(yè)內(nèi)人士普遍認(rèn)為，NPU的意義不是“替代GPU”，而是重新定義AI算力結(jié)構(gòu)。未來可能出現(xiàn)，GPU作為通用算力底座、TPU/NPU作為AI專用加速層。

英偉達(dá)也看到了這個趨勢，在2025年底，英偉達(dá)斥資 200 億美元對 Groq 進(jìn)行收購，Groq研發(fā)的 LPU (Language Processing Unit) ，在運行大模型（LLM）時，其速度是傳統(tǒng) GPU 的 10 倍以上。

這就像是過去十年，大多手機(jī)廠商的競爭。當(dāng)手機(jī)里最重要的Soc芯片已經(jīng)被高通、聯(lián)發(fā)科壟斷，具備強(qiáng)大的護(hù)城河，自研Soc芯片需要付出很大的成本且面臨高風(fēng)險。

那么，想要有獨特優(yōu)勢、在市場上更具競爭力，大多數(shù)手機(jī)企業(yè)不會選擇自研Soc芯片，而是針對Soc芯片的局部功能做優(yōu)化。

此前，三星、vivo、OPPO等手機(jī)廠商都選擇自研用于提升拍照能力的NPU芯片，實現(xiàn)差異化，比如vivo藍(lán)圖影像芯片、OPPO馬里亞納 MariSilicon芯片。

云廠商的算力競爭也接近白熱化，越來越多用于訓(xùn)練和推理的NPU將會出現(xiàn)，并不斷提升能力。

未來真正的算力產(chǎn)業(yè)分水嶺將是：誰能把AI推理成本壓到極致，誰就掌握下一代算力時代主動權(quán)。

原文標(biāo)題 : 算力上演“權(quán)力游戲”：當(dāng)云巨頭不再忍受英偉達(dá)“昂貴租金”

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞

免费久久国产&夜夜毛片&亚洲最大无码中文字幕&国产成人无码免费视频之奶水&吴家丽查理三级做爰&国产日本亚欧在线观看

發(fā)表評論

登錄