維科網(wǎng)智能制造3月12日消息,國內AI芯片龍頭云天勵飛傳來重磅消息:成功中標湛江市AI滲透支撐新質生產(chǎn)力基礎設施建設項目。
據(jù)悉該項目中標金額達4.2億元,將打造國內首個基于國產(chǎn)技術棧的AI推理千卡集群,為國產(chǎn)算力落地智能制造場景提供關鍵實踐樣本。
“國模國芯”協(xié)同新實踐
與傳統(tǒng)“訓推一體”的智算中心不同,該集群精準聚焦推理任務,主打高效適配產(chǎn)業(yè)應用場景,為傳統(tǒng)制造業(yè)AI化轉型提供直接算力支撐。
項目將分三期推進,全程采用云天勵飛自研國產(chǎn)AI推理加速卡,構建全棧自主可控的算力體系。
在技術架構上,集群確立了“優(yōu)先優(yōu)化Prefill、兼顧Decode”的核心路線,針對性解決大模型推理中高并發(fā)、高吞吐與低延遲的核心需求。
網(wǎng)絡層面采用400G光網(wǎng)絡構建統(tǒng)一高速互聯(lián)架構,實現(xiàn)節(jié)點間高帶寬、低延遲通信,相比傳統(tǒng)異構網(wǎng)絡,減少了協(xié)議轉換開銷,也簡化了部署流程。
同時,針對大模型推理中KV Cache訪問壓力,系統(tǒng)在計算與存儲互聯(lián)層面進行協(xié)同優(yōu)化,提升數(shù)據(jù)讀取效率,確保長上下文推理場景下的性能穩(wěn)定。
注:Prefill(預填)、Decode(解碼)是大模型推理的兩個核心階段,Prefill負責理解長上下文并完成計算,Decode負責持續(xù)生成結果;KV Cache(鍵值緩存)用于存儲推理過程中的中間狀態(tài),提升推理效率。
此外,該集群具備靈活擴展能力,可實現(xiàn)單節(jié)點數(shù)十卡到千卡級規(guī)模的平滑升級,適配不同規(guī)模的智能制造等行業(yè)應用需求。
據(jù)悉集群建成后,將搭載DeepSeek等國產(chǎn)大模型,深度適配政務、產(chǎn)業(yè)等多場景需求,探索“國模國芯”協(xié)同的生態(tài)樣板,助力湛江打造“AI滲透之城”,為當?shù)睾Q蠼?jīng)濟、臨港工業(yè)等優(yōu)勢產(chǎn)業(yè)的智能化升級提供低成本、便捷的AI算力支撐。
云天勵飛的AI底蘊
拿下這一標桿項目,源自云天勵飛在AI推理領域的長期深耕。
作為聚焦AI推理芯片研發(fā)與商業(yè)化的企業(yè),云天勵飛定位邊緣AI領域,擁有大模型和AI芯片兩大技術平臺,構建了“算法分析—指令集定義—芯片架構設計—工具鏈開發(fā)”的完整研發(fā)流程。
業(yè)務布局上,公司已形成消費級、企業(yè)級、行業(yè)級三大場景覆蓋,消費級業(yè)務進入華為、榮耀等終端品牌供應鏈,行業(yè)級業(yè)務覆蓋公共安全、智慧交通等領域,服務國內外100多個城市,其“1+1+N自進化城市智能體”框架還被納入中國信通院示范案例。
技術實力方面,公司已完成第四代NPU研發(fā),正推進下一代高性能NPU迭代,自研AI芯片采用獨特的“算力積木”架構,可靈活應對不同場景算力需求,支撐7B-671B參數(shù)大模型高效推理。
此次項目一期將部署X6000推理加速卡,二、三期則會搭載公司最新一代芯片產(chǎn)品,其中首款Prefill芯片 DeepVerse 100預計年內完成流片,并率先在湛江集群部署。
結語
從去年的DeepSeek,到今年的”養(yǎng)龍蝦“爆火可以看出,AI技術已從技術探索向規(guī)模化應用快速轉變,推理算力已成為決定產(chǎn)業(yè)落地速度的關鍵。
未來,云天勵飛在湛江打造的國產(chǎn)AI推理千卡集群,可通過芯片、網(wǎng)絡、系統(tǒng)的多層優(yōu)化,在效率與成本控制上形成明顯優(yōu)勢,為產(chǎn)業(yè)提供了一個更經(jīng)濟的算力方案,也將進一步推動AI技術在智能制造、政務服務等領域的滲透,助力湛江打造粵西人工智能創(chuàng)新高地。
而對于云天勵飛自身而言,該項目也是其作為國產(chǎn)AI推理龍頭算力規(guī)模化商用的新標桿,也將進一步強化其在推理芯片領域的市場地位,加速推動其愿景——“1001計劃”的落地。
注:“1001 計劃”由云天勵飛董事長兼CEO 陳寧提出,目的是降低推理成本,目標:在2030年,實現(xiàn)百億Token一分錢人民幣。