華為ai系列研究:昇騰的Atlas 800訓練服務器
上一篇了解到華為昇騰的Atlas 500智能小站,今天學習一下華為昇騰的Atlas 800訓練服務器。大家發現沒?越往后研究越是高級的產品。
Atlas 800 訓練服務器(型號:9000)是基于華為鯤鵬920+昇騰910處理器的AI訓練服務器,具有最強算力密度、超高能效與高速網絡帶寬等特點。該服務器廣泛應用于深度學習模型開發和訓練,適用于智慧城市、智慧醫療、天文探索、石油勘探等需要大算力的行業領域。
這里面非常關鍵的一個信息是,AI處理器從昇騰310換成了昇騰910,這也是算力的增強。我們就先說一下310和910的區別。
昇騰310:昇騰310是一款高效、靈活、可編程的AI處理器。基于典型配置,八位整數精度(INT8)下的性能達到22TOPS,16位浮點數(FP16)下的性能達到11 TFLOPS,而其功耗僅為8W。昇騰310芯片采用華為自研的達芬奇架構,集成了豐富的計算單元,在各個領域得到廣泛應用。隨著全AI業務流程的加速,昇騰310芯片能夠使智能系統的性能大幅提升,部署成本大幅降低。
昇騰310在功耗和計算能力等方面突破了傳統設計的約束。隨著能效比的大幅提升,昇騰310將人工智能從數據中心延伸到邊緣設備,為平安城市、自動駕駛、云服務和IT智能、智能制造、機器人等應用場景提供了全新的解決方案,使能智慧未來。

圖片來自華為官網
昇騰910 AI處理器:昇騰910是一款具有超高算力的AI處理器,其最大功耗為310W,華為自研的達芬奇架構大大提升了其能效比。八位整數精度(INT8)下的性能達到640TOPS,16位浮點數(FP16)下的性能達到320 TFLOPS。
作為一款高集成度的片上系統(SoC),除了基于達芬奇架構的AI核外,昇騰910還集成了多個CPU、DVPP和任務調度器(Task Scheduler),因而具有自我管理能力,可以充分發揮其高算力的優勢。
昇騰910集成了HCCS、PCIe 4.0和RoCE v2接口,為構建橫向擴展(Scale Out)和縱向擴展(Scale Up)系統提供了靈活高效的方法。HCCS是華為自研的高速互聯接口,片內RoCE可用于節點間直接互聯。最新的PCIe 4.0的吞吐量比上一代提升一倍。

圖片來自華為官網
通過兩款芯片的對比,它們的主要區別是算力大小以及算力管理能力,大算力者可以做訓練服務器。研究完主芯片之后,我們再回到Atlas 800 訓練服務器,它用又分風冷和液冷兩種:

圖片來自華為官網
它的外形如下圖:



圖片來自華為官網

產品規格表
更多研究,請參考鏈接:華為800。接下來的每周研究,將會對使用場景進行深入研究,包括應用的生態,華為是大廠中做生態做得最好的公司了,敬請期待。
免責聲明:
本公眾號為個人研究專題學習分享,非商業公眾號無任何商業目的,如果文章內容有侵權或者非法信息,請立即與本號聯系刪除謝謝
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













