特斯拉用400萬輛車,探索到算力芯片的邊界
2019 年 特斯拉的Autonomy Day(自動駕駛?cè)眨?nbsp;這是 HW3 正式亮相的時刻。
在 HW3 發(fā)布前后,馬斯克的口徑非常堅決,現(xiàn)有的硬件(HW3)已經(jīng)完全足夠?qū)崿F(xiàn)全自動駕駛(L4/L5),剩下的只是軟件問題。
馬斯克當(dāng)時稱 HW3 芯片是“世界上最強大的芯片”,并留下了那句著名的論斷:“任何非特斯拉制造的芯片在自動駕駛領(lǐng)域都是二流的。HW3 的算力是實現(xiàn) FSD 的底線,且擁有巨大的冗余度。”

但后來馬斯克在財報會議上明確表示:“Hardware 3 根本不具備實現(xiàn)無監(jiān)督(Unsupervised)FSD 的能力。” 主要是內(nèi)存帶寬(Memory Bandwidth)不足。
HW3 的內(nèi)存帶寬僅為 Hardware 4(AI4)的 1/8。
他承認(rèn)特斯拉此前過于樂觀,曾認(rèn)為 HW3 的冗余度足以支持全自動駕駛,但實際跑下來的神經(jīng)網(wǎng)絡(luò)規(guī)模超出了硬件承載能力。
全球市值最高的車企——至今仍有超過400萬輛車,正在用被現(xiàn)實毒打之后的經(jīng)歷告訴大家芯片設(shè)計的分水嶺。
智能駕駛行業(yè)有一個心照不宣的秘密:新發(fā)布標(biāo)稱算力更高的芯片,往往跑不過標(biāo)稱算力更低但芯片更成熟的方案。
標(biāo)稱算力TOPS,是芯片在較為理想工況下的理論峰值。而自動駕駛從誕生之初,面對的就是充滿物理約束和海量并發(fā)任務(wù)的極端復(fù)雜系統(tǒng)。
當(dāng)行業(yè)仍在圍繞TOPS營銷時,工程實踐上有所變化。
在CNN時代,算力與性能確實呈線性正相關(guān)。模型規(guī)整,計算局部性高,堆算力就能直接轉(zhuǎn)化速度。但Transformer改變了一切。全局注意力機制引入了復(fù)雜的數(shù)據(jù)訪問模式。
當(dāng)今智駕系統(tǒng)需要同時運行感知、預(yù)測、規(guī)劃等數(shù)十個神經(jīng)網(wǎng)絡(luò),各任務(wù)嚴(yán)格時序耦合。性能不再由單一計算瓶頸決定,而是取決于數(shù)據(jù)流轉(zhuǎn)和任務(wù)調(diào)度。
TOPS描述的是硬件"能算多快",而智駕真正需要回答的是在真實約束下能穩(wěn)定輸出多少"有效算力"。
如果有效算力決定"算得精不精",數(shù)據(jù)通路架構(gòu)則決定"算得動不動"。
自動駕駛是極度數(shù)據(jù)密集的實時系統(tǒng)。十余顆攝像頭持續(xù)輸出海量視頻流,需要經(jīng)過圖像處理、寫入內(nèi)存、再次讀取用于推理。

在這一過程中,內(nèi)存帶寬成為最直接的物理瓶頸"存儲墻"。
◎ HW3:LPDDR4,帶寬約50 GB/s
◎ HW4:GDDR6,帶寬約384 GB/s
AI4的帶寬達到HW3的7倍以上。這就是為什么HW3無法運行最新的FSD版本——不是算力不夠,而是數(shù)據(jù)"血管"太細。算力是肌肉,帶寬是血管。肌肉再強大,血管堵塞也是癱瘓。
汽車硬件生命周期跑不過AI迭代周期,汽車生命周期7年 > 軟件生命周期,Transformer代際更替2年 < 硬件壽命。
這才是HW3真正可怕的地方。一輛機械壽命仍然完好的汽車,因為無法運行下一代模型,而被排除在智能駕駛體系之外。
下一個時代的門檻,是有效算力+內(nèi)存帶寬+架構(gòu)效率的綜合實力。
汽車正在從"硬件定義軟件",轉(zhuǎn)向"軟件定義硬件",最終走向"AI定義硬件"。
小結(jié)
目前內(nèi)存價格很高,所以車企也很難在內(nèi)存很貴的時候去全面升級,可以說智能駕駛的進一步發(fā)展,需要等待芯片和內(nèi)存都有合理成本的時候,同時算法也需要進一步提升。
原文標(biāo)題 : 特斯拉用400萬輛車,探索到算力芯片的邊界
最新活動更多
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享









