算力競速(上):GPU如何蛻變?yōu)锳I時代的新石油
文|錢眼君
來源|博望財經(jīng)
歲末年初,中國資本市場的聚光燈前所未有地聚焦于黃浦江畔。一場聲勢浩大的“GPU旋風(fēng)”正席卷而來:在不到一個月的時間里,沐曦股份、壁仞科技、天數(shù)智芯三家扎根上海的GPU企業(yè)密集登陸資本市場,而與其并稱“上海GPU四小龍”的燧原科技,也已完成IPO輔導(dǎo),即將為這場盛宴落下最后一塊拼圖。
從科創(chuàng)板首日暴漲692.95%的造富神話,到港交所超2300倍的驚人認購紀(jì)錄;從百億級的IPO募資規(guī)模到千億市值俱樂部的批量誕生,國產(chǎn)GPU企業(yè)正以其凌厲的資本攻勢,宣告著國產(chǎn)算力產(chǎn)業(yè)一個新時代的來臨。
這并非偶然的資本狂歡。沐曦股份憑借在手訂單14.3億元及"千卡集群"的商業(yè)化落地,上市首日市值即突破3000億元,創(chuàng)下多項紀(jì)錄;壁仞科技作為"港股國產(chǎn)GPU第一股",獲得23家基石投資者力挺;天數(shù)智芯則以首家實現(xiàn)國產(chǎn)7nm訓(xùn)練推理通用GPU量產(chǎn)的身份,攜覆蓋20多個行業(yè)的業(yè)績登陸港交所。
然而,光環(huán)之下亦有隱憂:天數(shù)智芯三年半累計虧損超28億元,壁仞科技同期虧損超63億元,揭示出這個高投入、高風(fēng)險行業(yè)在搶占窗口期時的"流血沖鋒"本質(zhì)。
這是一場關(guān)乎智能未來的產(chǎn)業(yè)競速賽:一邊是國際巨頭以"黃氏定律"般的速度壘高技術(shù)壁壘,一邊是中國本土力量在資本與政策的雙重加持下集體破局。而要理解這場競賽的深層邏輯,我們必須回溯GPU從游戲配件到算力核心的蛻變之路。
01
定義核心:從圖形助手到算力引擎的蛻變
在探討這場席卷全球的算力革命之前,我們先來厘清一個核心概念——GPU。GPU全稱Graphics Processing Unit,圖形處理器。我們常聽說的CPU(Central Processing Unit)是指中央處理器,它與GPU的核心差異在于架構(gòu)設(shè)計:CPU通常擁有少數(shù)幾個強大的核心,擅長處理復(fù)雜的通用串行任務(wù),如同一位能解奧數(shù)題的中學(xué)生;而GPU則集成數(shù)千個相對簡單的核心,專為處理海量同質(zhì)化的并行任務(wù)而生,好比幾百個小學(xué)生協(xié)作完成數(shù)萬道加減法。

圖:GPU在計算機中的位置,公開資料整理。
如果說CPU是計算機的"大腦",負責(zé)決策與控制,那么GPU則是專精于"大規(guī)模重復(fù)勞動"的"肌肉",其并行計算的天性,使其在圖形渲染和高效能矩陣運算(人工智能的核心)中的效率遠超CPU。
隨著5G與人工智能時代的到來,數(shù)據(jù)中心內(nèi)機器學(xué)習(xí)等AI計算已占據(jù)總計算量的四分之一到三分之一,大數(shù)據(jù)處理的重任正從CPU向算力更強的GPU轉(zhuǎn)移。GPU的應(yīng)用早已超越傳統(tǒng)的個人電腦圖形顯示,其形態(tài)按接入方式可分為獨立與集成;其疆域已擴展至移動設(shè)備、數(shù)據(jù)中心服務(wù)器與個人電腦等多個場景。尤其在AI與云計算浪潮下,GPU憑借其與生俱來的并行計算優(yōu)勢,成為了數(shù)據(jù)處理的核心引擎,開辟出一個規(guī)模空前的增長市場。盡管FPGA和ASIC等更為專用的計算芯片也在特定領(lǐng)域嶄露頭角,但行業(yè)共識在于,GPU憑借其卓越的通用性、成熟的軟件生態(tài)(尤其是英偉達的CUDA)及強大的綜合算力表現(xiàn),仍是當(dāng)前AI計算領(lǐng)域無可爭議的霸主與主導(dǎo)架構(gòu)。
這一定位,是理解其萬億級產(chǎn)業(yè)價值的邏輯起點。
02
GPU從哪來:一部從游戲顯卡到AI基石的創(chuàng)業(yè)史
GPU產(chǎn)業(yè)的崛起,是一部典型的硅谷技術(shù)創(chuàng)業(yè)史詩,而其主角無疑是英偉達(NVIDIA)。故事的開端可追溯至1989年——幾位工程師共同勾勒了一款新圖形加速器的藍圖。1993年,英偉達正式成立,開始的創(chuàng)業(yè)之路充滿坎坷,至1995年,公司面臨設(shè)計出芯片卻無資金建廠制造的困境。創(chuàng)始人黃仁勛致信臺積電創(chuàng)始人張忠謀求助,并成功獲得支持。
這段合作被黃仁勛本人視為關(guān)鍵轉(zhuǎn)折:"如果當(dāng)初我自己建廠生產(chǎn)GPU芯片,我現(xiàn)在可能就是一個守著幾千萬美元的公司的安逸的CEO。"臺積電的代工模式讓英偉達得以輕資產(chǎn)運營,聚焦設(shè)計與創(chuàng)新,從而快速迭代產(chǎn)品,搶占市場。
1999年,英偉達做出了兩個定義行業(yè)的舉動:一是徹底轉(zhuǎn)型專注于顯卡芯片,二是首次在全球提出"GPU"這一革命性概念(但在提出這個概念以后的相當(dāng)一段時間內(nèi),GPU還僅僅用于圖形處理,遠不像現(xiàn)在這般如雷貫耳)。同年,公司在納斯達克上市,市值達6.26億美元,開啟了長達二十余年的高速增長傳奇。
然而,硬件性能的領(lǐng)先并非其構(gòu)筑護城河的終極武器。真正的"神來之筆"發(fā)生在2006年,英偉達在推出新一代GPU的同時,發(fā)布了具有劃時代意義的CUDA計算平臺。CUDA即Compute Unified Device Architecture,統(tǒng)一計算架構(gòu),本質(zhì)上是一套軟件工具,它讓開發(fā)者能夠以前所未有的便捷性,調(diào)用GPU的強大算力進行通用計算(GPGPU),這為后來深度學(xué)習(xí)的爆發(fā)埋下了伏筆。
起初,CUDA的商業(yè)價值并未被市場立刻接受。但英偉達展現(xiàn)出了驚人的戰(zhàn)略耐心與遠見:向全球高校和研究所免費開放并設(shè)立研發(fā)中心;以資金扶持創(chuàng)業(yè)公司使用;持續(xù)開源核心軟件庫;甚至確保廉價的消費級游戲顯卡也支持CUDA,將開發(fā)門檻降至千元級別。
經(jīng)過十余年不計短期回報的持續(xù)灌溉,CUDA逐漸從一款開發(fā)工具,演進為高端計算與圖形領(lǐng)域的事實標(biāo)準(zhǔn),構(gòu)筑了堪比操作系統(tǒng)般的深厚生態(tài)壁壘。即便競爭對手的GPU硬件性能參數(shù)相近,但在AI開發(fā)社區(qū)的受歡迎程度卻有天壤之別,核心差距就在于CUDA所帶來的開發(fā)效率與計算效能倍增。

圖:關(guān)于CUDA的描述,來自英偉達官網(wǎng)
直到2014年前后,英偉達將CUDA與AI計算完美融合,英偉達的騰飛才真正開始。如今,CUDA連接了全球數(shù)百萬開發(fā)者,使英偉達GPU成為AI時代事實上的"計算貨幣",其護城河之深,已難以用單純的晶體管數(shù)量或浮點算力來衡量。這也能說明為何國產(chǎn)GPU公司很難實現(xiàn)快速超車。
03
技術(shù)爭鋒:HBM、架構(gòu)迭代與性能軍備競賽
驅(qū)動GPU產(chǎn)業(yè)以"黃氏定律"速度(顯示芯片性能每6個月提升1倍,AI算力在8年內(nèi)實現(xiàn)千倍增長)前進的,是持續(xù)不斷的技術(shù)創(chuàng)新與白熱化的性能軍備競賽。筆者梳理發(fā)現(xiàn),當(dāng)前的技術(shù)角逐主要集中在3個關(guān)鍵維度:
1、存儲技術(shù)的躍遷
算力的爆炸式增長,不僅需要強大的"引擎"(GPU核心),更依賴于能夠?qū)崟r"喂飽"引擎數(shù)據(jù)的"高速糧道"。自2017年起,英偉達便在高端AIGPU(如A100、H100)中率先采用HBM(高頻寬存儲器)技術(shù)。
這與傳統(tǒng)的GDDR(Graphics Double Data Rate)內(nèi)存有本質(zhì)不同:GDDR作為傳統(tǒng)的內(nèi)存技術(shù),提供了平衡的性能和成本,適用于廣泛的圖形應(yīng)用,而HBM則更專注于提供高性能、高帶寬以及更能效的解決方案,適用于對數(shù)據(jù)傳輸速度和能效要求更高的領(lǐng)域。在結(jié)構(gòu)上,GDDR是一種傳統(tǒng)的圖形內(nèi)存,通常以單個芯片的形式存在,它的設(shè)計比較扁平,內(nèi)存芯片以并行方式連接到圖形處理單元(GPU)。HBM通過3D堆疊、硅通孔(TSV)等尖端封裝工藝,將多層DRAM芯片像蓋樓一樣垂直堆疊,并與GPU邏輯芯片通過硅中介層緊密集成。這種設(shè)計帶來了革命性優(yōu)勢:HBM擁有數(shù)倍于GDDR的帶寬和更低的功耗,但代價是結(jié)構(gòu)極度復(fù)雜、成本高昂。

圖:H200,英偉達官網(wǎng)
以英偉達2023年底發(fā)布的H200 GPU為例,它首次搭載HBM3e,顯存帶寬高達4.8TB/秒,用于700億參數(shù)大模型推理時,速度是前代H100的1.9倍,能耗卻降低一半。這清晰表明,突破"內(nèi)存墻"是算力持續(xù)進化的生死線。
2、架構(gòu)平臺的高速代際飛躍
GPU行業(yè)中,很多企業(yè)把英偉達當(dāng)成終極目標(biāo),但筆者看來,一個殘酷的事實是,這個終極目標(biāo)并非原地不動等待超越,而是仍在向前狂奔,保持著約兩年一次架構(gòu)升級的殘酷節(jié)奏。其下一代平臺"Rubin"已提上日程,計劃于2026年量產(chǎn)。Rubin不再僅僅是單一的GPU芯片,而是一個整合了Rubin GPU、專為AI推理設(shè)計的Vera CPU、新一代NV Link交換機芯片、高速網(wǎng)卡的龐大計算系統(tǒng)。其中,Rubin GPU的關(guān)鍵指標(biāo)呈現(xiàn)跨代躍升:FP4推理性能預(yù)計達到當(dāng)前Blackwell架構(gòu)的5倍。這場競爭已從單一的"芯片對決"升級為"系統(tǒng)平臺戰(zhàn)爭",比拼的是從芯片到集群的全棧優(yōu)化能力。
3、圖形與計算的雙重挑戰(zhàn)
盡管AI計算是當(dāng)前最大的風(fēng)口,但圖形顯示功能本身的技術(shù)壁壘實際上更為森嚴(yán)。硬件結(jié)構(gòu)上,一顆完整的GPU需要集成光柵化、紋理貼圖、光線追蹤等為圖形專門優(yōu)化的硬件單元,其復(fù)雜程度遠超專注于矩陣計算的AI芯片;算法上,圖形處理涉及計算機圖形學(xué),需要融合物理模擬、光學(xué)渲染等多學(xué)科知識,算法難度極高。
因此,能夠同時駕馭高性能圖形渲染與通用AI計算的"全功能GPU",代表了芯片設(shè)計領(lǐng)域的皇冠明珠,這也是諸多國產(chǎn)GPU廠商將"全功能"作為核心戰(zhàn)略方向的原因。
當(dāng)國際巨頭在技術(shù)前沿高歌猛進,用一代代產(chǎn)品定義著算力標(biāo)準(zhǔn)時,一個關(guān)鍵問題擺在全球產(chǎn)業(yè)面前:在這條被巨頭劃定的賽道上,后來者還有機會嗎?中國的答案,正在上海張江的實驗室里、在資本市場的鑼聲中、在一張張累計虧損數(shù)十億的財務(wù)報表背后,悄然書寫。從技術(shù)追隨到生態(tài)破局,國產(chǎn)GPU的征途,遠比想象中更加艱難,也更加波瀾壯闊,我們下篇繼續(xù)分析。
原文標(biāo)題 : 算力競速(上):GPU如何蛻變?yōu)锳I時代的新石油
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-5.20立即下載>> 【限時免費】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會議】液冷服務(wù)器信號完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩(wěn)、細節(jié)炸,設(shè)計師慌了
- 3 6000億美元估值錨定:字節(jié)跳動的“去單一化”突圍與估值重構(gòu)
- 4 Tesla AI5芯片最新進展總結(jié)
- 5 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續(xù)扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰(zhàn)略
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













