英偉達GTC 2025主題演講核心內容總結
一年一度的GTC(GPU Technology Conference)又召開了,這個會算是英偉達的AI傳教會了,不過又有點類似于武林盟主召開的武林大會,畢竟科技界的各路都來了,不但Meta,Open AI等科技企業,還有UC Berkeley等學術機構,最重要的是非常多的例如理想、小米、商湯、Rivian、Wayve國內外汽車智能企業參加。本次GTC, 黃仁勛的兩小時演講強調了 Nvidia 系統支持的 AI 應用的廣度。黃仁勛詳細闡述了 Nvidia 在自動駕駛汽車、更好的無線網絡和先進機器人技術發展方面的貢獻。他還列出了公司未來兩年的產品路線圖。
本文將結合英偉達黃仁勛在 GTC 2025主題演講的核心內容總結,幫助大家了解英偉達的 AI帝國,啟發和暢想下在英偉達生態下的AI應用和發展。萬物皆可“Token” - AI is everything在互聯網數字時代,我們的信息都可以轉成01的數字代碼。而現在我們身處生成'token*'的前沿時代(*AI的基本構建單元),它們開啟了一個可能性無邊的新世界。這些token正在將:科學洞察轉化為圖像——描繪外星大氣層數據,指引未來探索者原始數據轉化為前瞻預判——讓人類為下一次挑戰做好準備物理定律解碼重構——推動我們走得更快、更遠,例如我們的Physical AI 自動駕駛,機器人。生命密碼破譯應用——在疾病顯現前發現隱患

從數字的Agentic AI 數字信息生成到與物理世界的人交戶的Physical AI 萬物皆可“Token”,AI 成為數字時代的引擎,把數字時代帶入AI 時代。AI工廠:計算范式的革命而面對萬物皆可“Token”的背景下,AI 工廠將引導硬件的革命,我們需要怎樣的AI 計算單元?從檢索到生成:AI工廠不再是存儲數據的倉庫,而是通過生成式AI實時生產“token”(信息單元)的智能引擎。規模化挑戰:未來數據中心需處理指數級增長的推理需求(如Agentic AI生成數千個中間token),需要AI算力芯片的架構和冷卻技術來支撐超大規模部署。
經濟模型變革:AI工廠的收益與“token生成速度×吞吐量”直接相關,能源效率(每瓦特token數)成為核心競爭力。AI 應用潛力巨大的市場外加新型計算范式的革命,英偉達給出的解藥是什么呢?怎么幫助大家更好的應用呢?新一代GPU Blackwell登場老套路了,每一次GTC Jenson 都要發布或者透露下他的看家本領GPU新架構。Blackwell架構:采用革命性設計,集成2080億晶體管,支持高達20 petaflops的AI計算性能,比前代Hopper提升25倍能效。


其中有三大關鍵突破:推理性能飛躍:通過MVLink高速互聯技術,實現72個GPU的無縫協同,解決大模型推理時的內存與帶寬瓶頸。動態資源分配:結合Dynamo操作系統,靈活分配算力用于“預填充”(上下文理解)和“解碼”(生成答案),優化AI工廠效率。4-bit浮點量化:顯著降低能耗,支持更復雜模型的實時推理。最重要的是,這次Blackwell真正要加速量產了。英偉達AI芯片未來路線圖2025 下半年:Blackwell Ultra上市,性能再提升50%。2026:Vera Rubin架構(CPU+GPU協同設計)Vera 為 Nvidia 設計 的CPU,HBM4內存與硅光子網絡(1.6T CPO)登場。包含 144 個獨立的 Nvidia GPU。2027: Rubin Ultra架構,包含 576 個GPU,實現單機柜15 exaflops算力,支撐百萬GPU集群。2028 年某個時候 Feynman 推出。


有了這個強大AI算力芯片的加持,英偉達表示繼續推動AI計算范式的革命.軟件生態:CUDA-X與Dynamo本次會議,英偉達推出了兩個軟件生態,幫助大家容易部署算力硬件的軟件。CUDA-X加速庫:大家都熟悉英偉達的CUDA,大家一般把他理解為算子,CUDA 是基礎層:提供 GPU 編程模型(線程層次、內存管理),開發者這利用CUDA去開發AI應用。
這次,英偉達推出的CUDA-X, CUDA-X可以理解成上層建筑:基于 CUDA 封裝領域專用優化,類似“工具箱”。可以幫助開發者將 GPU 的暴力算力轉化為行業生產力。它讓開發者無需成為硬件專家,即可在 AI、科學、工業等領域實現“性能自由”,是加速計算時代的核心基礎設施。CUDA-X加速庫覆蓋科學計算、5G、量子化學等領域,如cuQuantum加速量子模擬,cuLitho革新半導體光刻。

Dynamo操作系統:專為AI工廠設計,動態調度GPU集群資源,支持萬億參數模型的分布式訓練與推理,實現“一個GPU巨腦”。而起這還是一款開源軟件,英偉達表示該軟件可以提高人工智能推理的效率并降低成本。機器人技術:物理AI的突破Nvidia 首席執行官黃仁勛在 GTC 主題演講中宣布了一種基于 Llama 的新型企業推理模型,該模型名為 Nvidia Llama Nemotron Reasoning。
稱其為“任何人都可以運行的令人難以置信的新模型”,超越了 DeepSeek。它是 Nvidia Nemotron 系列模型的一部分,旨在增強Agentic AI的開發。按照Jenson的路徑圖,除了Agentic AI,Physical AI 還有巨大開啟空間,具體Physical AI 方面怎么讓大家快速上手?Nvidia 發布所謂的人形機器人 AI 基礎模型,名為 Groot N1,是一款“通用”模型,基于生成式AI和強化學習,具備多任務泛化能力,通過Omniverse數字孿生生成海量訓練數據,可以很快部署機器人。
讓天下沒有難做的智能人形機器人的 GrootNvidia 聲稱,Groot N1 具有“雙系統架構”,可實現“快速和慢速思考”,靈感來自人類的認知過程。Groot N1 現已開源。也就是說,英偉達通過 Groot開源生態:開發者可基于GROOT快速定制機器人技能,那么做個機器人跟大家現在做一款手機那么容易了。

行業合作與未來愿景對于汽車行業的自動駕駛,英偉達提供從云端算法訓練,驗證虛擬仿真,車端新品NVIDIA全套方案,本次GTC Jenson 黃并沒有提太多,大家可以看我們之前文章《AI 巨頭 Nvidia 英偉達在汽車領域做什么?》了解。但這次會議,英偉達推出了 NVIDIA Halos,一款適用于自動駕駛汽車的全棧綜合安全系統,NVIDIA 將其安全 AV 開發技術套件從云端到汽車統一起來——涵蓋車輛架構到 AI 模型——包括芯片、軟件、工具和服務。

這樣可以簡化自動駕駛開發流程和時間,但壞處就是以后需要買英偉達的全家桶。此外,Jenson 發布了一個重磅消息,那就是通用汽車(GM)投奔到英偉達懷抱了,要知道之前通用智能駕駛一直采用Mobileye 和 高通系列芯片。通用汽車(GM)將采用NVIDIA全套方案(訓練、仿真、車載芯片),推動自動駕駛落地。

邊緣計算:與思科、T-Mobile合作構建AI邊緣網絡,優化5G基站智能調度。數字孿生:Omniverse平臺助力設計AI工廠,模擬能耗、散熱與網絡拓撲,降低萬億美元級數據中心建設風險。量子計算:推出CUDA-Q量子-經典混合計算框架,加速算法研究。核心洞察按照英偉達的發展和眼光:AI工業化:計算從“通用”轉向“專用”,AI工廠成為新基建核心。能源為王:未來數據中心收益由能源效率決定,液冷與硅光子技術是關鍵。機器人爆發:物理AI+生成式訓練開啟人形機器人商用元年,彌補全球勞動力缺口。NVIDIA正通過“芯片+軟件+生態”三位一體,推動從云到邊緣、從數據到物理世界的全棧AI革命。總結起來,英偉達讓天下沒有難做的AI和機器人。
未經準許嚴禁轉載和摘錄-參考資料:
英偉達 GTC 2025 keynote 演講PPT以及視頻
原文標題 : 馬云開這次 GTC 標題肯定是“讓天下沒有難做的AI和機器人” - 英偉達GTC 2025主題演講核心內容總結
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













