韩国乱码伦视频免费,欧洲自拍偷拍,免费观看精彩不断,八戒八戒悟空影院在线观

算力競速（上）：GPU如何蛻變?yōu)锳I時代的新石油

2026-02-10 18:13

文|錢眼君

來源|博望財經(jīng)

歲末年初，中國資本市場的聚光燈前所未有地聚焦于黃浦江畔。一場聲勢浩大的“GPU旋風(fēng)”正席卷而來：在不到一個月的時間里，沐曦股份、壁仞科技、天數(shù)智芯三家扎根上海的GPU企業(yè)密集登陸資本市場，而與其并稱“上海GPU四小龍”的燧原科技，也已完成IPO輔導(dǎo)，即將為這場盛宴落下最后一塊拼圖。

從科創(chuàng)板首日暴漲692.95%的造富神話，到港交所超2300倍的驚人認購紀(jì)錄；從百億級的IPO募資規(guī)模到千億市值俱樂部的批量誕生，國產(chǎn)GPU企業(yè)正以其凌厲的資本攻勢，宣告著國產(chǎn)算力產(chǎn)業(yè)一個新時代的來臨。

這并非偶然的資本狂歡。沐曦股份憑借在手訂單14.3億元及"千卡集群"的商業(yè)化落地，上市首日市值即突破3000億元，創(chuàng)下多項紀(jì)錄；壁仞科技作為"港股國產(chǎn)GPU第一股"，獲得23家基石投資者力挺；天數(shù)智芯則以首家實現(xiàn)國產(chǎn)7nm訓(xùn)練推理通用GPU量產(chǎn)的身份，攜覆蓋20多個行業(yè)的業(yè)績登陸港交所。

然而，光環(huán)之下亦有隱憂：天數(shù)智芯三年半累計虧損超28億元，壁仞科技同期虧損超63億元，揭示出這個高投入、高風(fēng)險行業(yè)在搶占窗口期時的"流血沖鋒"本質(zhì)。

這是一場關(guān)乎智能未來的產(chǎn)業(yè)競速賽：一邊是國際巨頭以"黃氏定律"般的速度壘高技術(shù)壁壘，一邊是中國本土力量在資本與政策的雙重加持下集體破局。而要理解這場競賽的深層邏輯，我們必須回溯GPU從游戲配件到算力核心的蛻變之路。

定義核心：從圖形助手到算力引擎的蛻變

在探討這場席卷全球的算力革命之前，我們先來厘清一個核心概念——GPU。GPU全稱Graphics Processing Unit，圖形處理器。我們常聽說的CPU（Central Processing Unit）是指中央處理器，它與GPU的核心差異在于架構(gòu)設(shè)計：CPU通常擁有少數(shù)幾個強大的核心，擅長處理復(fù)雜的通用串行任務(wù)，如同一位能解奧數(shù)題的中學(xué)生；而GPU則集成數(shù)千個相對簡單的核心，專為處理海量同質(zhì)化的并行任務(wù)而生，好比幾百個小學(xué)生協(xié)作完成數(shù)萬道加減法。

圖：GPU在計算機中的位置，公開資料整理。

如果說CPU是計算機的"大腦"，負責(zé)決策與控制，那么GPU則是專精于"大規(guī)模重復(fù)勞動"的"肌肉"，其并行計算的天性，使其在圖形渲染和高效能矩陣運算（人工智能的核心）中的效率遠超CPU。

隨著5G與人工智能時代的到來，數(shù)據(jù)中心內(nèi)機器學(xué)習(xí)等AI計算已占據(jù)總計算量的四分之一到三分之一，大數(shù)據(jù)處理的重任正從CPU向算力更強的GPU轉(zhuǎn)移。GPU的應(yīng)用早已超越傳統(tǒng)的個人電腦圖形顯示，其形態(tài)按接入方式可分為獨立與集成；其疆域已擴展至移動設(shè)備、數(shù)據(jù)中心服務(wù)器與個人電腦等多個場景。尤其在AI與云計算浪潮下，GPU憑借其與生俱來的并行計算優(yōu)勢，成為了數(shù)據(jù)處理的核心引擎，開辟出一個規(guī)模空前的增長市場。盡管FPGA和ASIC等更為專用的計算芯片也在特定領(lǐng)域嶄露頭角，但行業(yè)共識在于，GPU憑借其卓越的通用性、成熟的軟件生態(tài)（尤其是英偉達的CUDA）及強大的綜合算力表現(xiàn)，仍是當(dāng)前AI計算領(lǐng)域無可爭議的霸主與主導(dǎo)架構(gòu)。

這一定位，是理解其萬億級產(chǎn)業(yè)價值的邏輯起點。

GPU從哪來：一部從游戲顯卡到AI基石的創(chuàng)業(yè)史

GPU產(chǎn)業(yè)的崛起，是一部典型的硅谷技術(shù)創(chuàng)業(yè)史詩，而其主角無疑是英偉達（NVIDIA）。故事的開端可追溯至1989年——幾位工程師共同勾勒了一款新圖形加速器的藍圖。1993年，英偉達正式成立，開始的創(chuàng)業(yè)之路充滿坎坷，至1995年，公司面臨設(shè)計出芯片卻無資金建廠制造的困境。創(chuàng)始人黃仁勛致信臺積電創(chuàng)始人張忠謀求助，并成功獲得支持。

這段合作被黃仁勛本人視為關(guān)鍵轉(zhuǎn)折："如果當(dāng)初我自己建廠生產(chǎn)GPU芯片，我現(xiàn)在可能就是一個守著幾千萬美元的公司的安逸的CEO。"臺積電的代工模式讓英偉達得以輕資產(chǎn)運營，聚焦設(shè)計與創(chuàng)新，從而快速迭代產(chǎn)品，搶占市場。

1999年，英偉達做出了兩個定義行業(yè)的舉動：一是徹底轉(zhuǎn)型專注于顯卡芯片，二是首次在全球提出"GPU"這一革命性概念（但在提出這個概念以后的相當(dāng)一段時間內(nèi)，GPU還僅僅用于圖形處理，遠不像現(xiàn)在這般如雷貫耳）。同年，公司在納斯達克上市，市值達6.26億美元，開啟了長達二十余年的高速增長傳奇。

然而，硬件性能的領(lǐng)先并非其構(gòu)筑護城河的終極武器。真正的"神來之筆"發(fā)生在2006年，英偉達在推出新一代GPU的同時，發(fā)布了具有劃時代意義的CUDA計算平臺。CUDA即Compute Unified Device Architecture，統(tǒng)一計算架構(gòu)，本質(zhì)上是一套軟件工具，它讓開發(fā)者能夠以前所未有的便捷性，調(diào)用GPU的強大算力進行通用計算（GPGPU），這為后來深度學(xué)習(xí)的爆發(fā)埋下了伏筆。

起初，CUDA的商業(yè)價值并未被市場立刻接受。但英偉達展現(xiàn)出了驚人的戰(zhàn)略耐心與遠見：向全球高校和研究所免費開放并設(shè)立研發(fā)中心；以資金扶持創(chuàng)業(yè)公司使用；持續(xù)開源核心軟件庫；甚至確保廉價的消費級游戲顯卡也支持CUDA，將開發(fā)門檻降至千元級別。

經(jīng)過十余年不計短期回報的持續(xù)灌溉，CUDA逐漸從一款開發(fā)工具，演進為高端計算與圖形領(lǐng)域的事實標(biāo)準(zhǔn)，構(gòu)筑了堪比操作系統(tǒng)般的深厚生態(tài)壁壘。即便競爭對手的GPU硬件性能參數(shù)相近，但在AI開發(fā)社區(qū)的受歡迎程度卻有天壤之別，核心差距就在于CUDA所帶來的開發(fā)效率與計算效能倍增。

圖：關(guān)于CUDA的描述，來自英偉達官網(wǎng)

直到2014年前后，英偉達將CUDA與AI計算完美融合，英偉達的騰飛才真正開始。如今，CUDA連接了全球數(shù)百萬開發(fā)者，使英偉達GPU成為AI時代事實上的"計算貨幣"，其護城河之深，已難以用單純的晶體管數(shù)量或浮點算力來衡量。這也能說明為何國產(chǎn)GPU公司很難實現(xiàn)快速超車。

技術(shù)爭鋒：HBM、架構(gòu)迭代與性能軍備競賽

驅(qū)動GPU產(chǎn)業(yè)以"黃氏定律"速度（顯示芯片性能每6個月提升1倍，AI算力在8年內(nèi)實現(xiàn)千倍增長）前進的，是持續(xù)不斷的技術(shù)創(chuàng)新與白熱化的性能軍備競賽。筆者梳理發(fā)現(xiàn)，當(dāng)前的技術(shù)角逐主要集中在3個關(guān)鍵維度：

1、存儲技術(shù)的躍遷

算力的爆炸式增長，不僅需要強大的"引擎"（GPU核心），更依賴于能夠?qū)崟r"喂飽"引擎數(shù)據(jù)的"高速糧道"。自2017年起，英偉達便在高端AIGPU（如A100、H100）中率先采用HBM（高頻寬存儲器）技術(shù)。

這與傳統(tǒng)的GDDR（Graphics Double Data Rate）內(nèi)存有本質(zhì)不同：GDDR作為傳統(tǒng)的內(nèi)存技術(shù)，提供了平衡的性能和成本，適用于廣泛的圖形應(yīng)用，而HBM則更專注于提供高性能、高帶寬以及更能效的解決方案，適用于對數(shù)據(jù)傳輸速度和能效要求更高的領(lǐng)域。在結(jié)構(gòu)上，GDDR是一種傳統(tǒng)的圖形內(nèi)存，通常以單個芯片的形式存在，它的設(shè)計比較扁平，內(nèi)存芯片以并行方式連接到圖形處理單元（GPU）。HBM通過3D堆疊、硅通孔（TSV）等尖端封裝工藝，將多層DRAM芯片像蓋樓一樣垂直堆疊，并與GPU邏輯芯片通過硅中介層緊密集成。這種設(shè)計帶來了革命性優(yōu)勢：HBM擁有數(shù)倍于GDDR的帶寬和更低的功耗，但代價是結(jié)構(gòu)極度復(fù)雜、成本高昂。

圖：H200，英偉達官網(wǎng)

以英偉達2023年底發(fā)布的H200 GPU為例，它首次搭載HBM3e，顯存帶寬高達4.8TB/秒，用于700億參數(shù)大模型推理時，速度是前代H100的1.9倍，能耗卻降低一半。這清晰表明，突破"內(nèi)存墻"是算力持續(xù)進化的生死線。

2、架構(gòu)平臺的高速代際飛躍

GPU行業(yè)中，很多企業(yè)把英偉達當(dāng)成終極目標(biāo)，但筆者看來，一個殘酷的事實是，這個終極目標(biāo)并非原地不動等待超越，而是仍在向前狂奔，保持著約兩年一次架構(gòu)升級的殘酷節(jié)奏。其下一代平臺"Rubin"已提上日程，計劃于2026年量產(chǎn)。Rubin不再僅僅是單一的GPU芯片，而是一個整合了Rubin GPU、專為AI推理設(shè)計的Vera CPU、新一代NV Link交換機芯片、高速網(wǎng)卡的龐大計算系統(tǒng)。其中，Rubin GPU的關(guān)鍵指標(biāo)呈現(xiàn)跨代躍升：FP4推理性能預(yù)計達到當(dāng)前Blackwell架構(gòu)的5倍。這場競爭已從單一的"芯片對決"升級為"系統(tǒng)平臺戰(zhàn)爭"，比拼的是從芯片到集群的全棧優(yōu)化能力。

3、圖形與計算的雙重挑戰(zhàn)

盡管AI計算是當(dāng)前最大的風(fēng)口，但圖形顯示功能本身的技術(shù)壁壘實際上更為森嚴(yán)。硬件結(jié)構(gòu)上，一顆完整的GPU需要集成光柵化、紋理貼圖、光線追蹤等為圖形專門優(yōu)化的硬件單元，其復(fù)雜程度遠超專注于矩陣計算的AI芯片；算法上，圖形處理涉及計算機圖形學(xué)，需要融合物理模擬、光學(xué)渲染等多學(xué)科知識，算法難度極高。

因此，能夠同時駕馭高性能圖形渲染與通用AI計算的"全功能GPU"，代表了芯片設(shè)計領(lǐng)域的皇冠明珠，這也是諸多國產(chǎn)GPU廠商將"全功能"作為核心戰(zhàn)略方向的原因。

當(dāng)國際巨頭在技術(shù)前沿高歌猛進，用一代代產(chǎn)品定義著算力標(biāo)準(zhǔn)時，一個關(guān)鍵問題擺在全球產(chǎn)業(yè)面前：在這條被巨頭劃定的賽道上，后來者還有機會嗎？中國的答案，正在上海張江的實驗室里、在資本市場的鑼聲中、在一張張累計虧損數(shù)十億的財務(wù)報表背后，悄然書寫。從技術(shù)追隨到生態(tài)破局，國產(chǎn)GPU的征途，遠比想象中更加艱難，也更加波瀾壯闊，我們下篇繼續(xù)分析。

原文標(biāo)題 : 算力競速（上）：GPU如何蛻變?yōu)锳I時代的新石油