端側(cè)AI,如何化解國(guó)內(nèi)算力之困?
解決了算力之困后,端側(cè)大模型將有可能最先引爆本輪AI革命的盈利點(diǎn)。
算力和數(shù)據(jù)的天花板,決定了本輪的AI熱潮究竟能走多遠(yuǎn)。
但不幸的是,對(duì)國(guó)內(nèi)而言,其中的算力天花板,離“到頂”已經(jīng)越來(lái)越近。
就在8月初,美簽署最新行政令,禁止美國(guó)對(duì)中國(guó)計(jì)算機(jī)芯片等敏感技術(shù)進(jìn)行一些新投資,重點(diǎn)將在限制美國(guó)資本對(duì)于中國(guó)半導(dǎo)體設(shè)計(jì)軟件和制造硬件的投資。

此消息一出,不少人頓感:國(guó)內(nèi)算力危矣!
而機(jī)警的大廠,也開(kāi)始了各自未雨綢繆的準(zhǔn)備。
《金融時(shí)報(bào)》的一篇報(bào)道稱,國(guó)內(nèi)包括阿里、字節(jié)在內(nèi)的科技巨頭,已經(jīng)訂購(gòu)50億美元的英偉達(dá)的A800芯片,來(lái)面對(duì)訓(xùn)練大語(yǔ)言模型需要的算力挑戰(zhàn)。

按照此前媒體報(bào)道,目前中國(guó)企業(yè)GPU芯片持有量超過(guò)1萬(wàn)枚的不超過(guò)5家,擁有1萬(wàn)枚A100的至多1家。
那么,在愈發(fā)緊張的算力之下,中國(guó)AI的前途、命運(yùn)將如何發(fā)展?
短期來(lái)看,算力之困對(duì)于業(yè)內(nèi),似乎是個(gè)無(wú)解的問(wèn)題。然而,技術(shù)的發(fā)展,有時(shí)就像生物的進(jìn)化,當(dāng)一種技術(shù)在面臨“生存挑戰(zhàn)”時(shí),也會(huì)由于選擇壓力而發(fā)生一系列的突變。
而對(duì)國(guó)內(nèi)而言,這樣的突變方向,也許就是分散于各個(gè)終端里的端側(cè)大模型。
01 端側(cè)大模型,如何解算力之困?
端側(cè)大模型的發(fā)展,對(duì)國(guó)內(nèi)算力突圍有著怎樣的意義?這還得從目前云計(jì)算的需求說(shuō)起。
當(dāng)下,面對(duì)大模型高昂的算力成本,許多致力于涉足AI領(lǐng)域,但卻算力匱乏的企業(yè),往往都選擇了租用云算力的方式,來(lái)滿足訓(xùn)練需求。
在此背景下,昇騰AI集群這樣的云服務(wù)平臺(tái)也趁勢(shì)而起,成為了孵化國(guó)內(nèi)各個(gè)大模型的“母工廠”。

然而,即使是云計(jì)算本身,也需要大量的GPU支撐。
如果云服務(wù)商無(wú)法獲取足夠的GPU資源,那么它們也無(wú)法為國(guó)內(nèi)AI企業(yè)提供高效、可靠的云計(jì)算服務(wù)。
而端側(cè)AI最重要的意義,就在于分擔(dān)了目前國(guó)內(nèi)云計(jì)算的壓力。
倘若我們將十幾億分散的智能手機(jī),當(dāng)成了一個(gè)個(gè)潛在的、擁有大量閑置算力的移動(dòng)計(jì)算單元,那么部署在手機(jī)中的端側(cè)AI,就能在這些設(shè)備閑置時(shí)間里,將這些碎片化、分布式算力利用起來(lái),產(chǎn)生頗為可觀的規(guī)模效應(yīng)。

鴻蒙4中出現(xiàn)的手機(jī)大模型
具體來(lái)說(shuō),聯(lián)邦計(jì)算,就是這樣為人熟知的分布式計(jì)算方式之一。
所謂聯(lián)邦計(jì)算,簡(jiǎn)而言之,就是在數(shù)據(jù)源(例如用戶設(shè)備)上進(jìn)行模型的局部訓(xùn)練,然后將這些局部模型的參數(shù)或更新聚合到中央服務(wù)器上,形成一個(gè)“全局模型”。
相比于集中式的訓(xùn)練,這種分布式的方式可以更好地利用各個(gè)設(shè)備的計(jì)算能力,降低中央服務(wù)器的算力需求。
在這樣的過(guò)程中,依靠終端設(shè)備(例如手機(jī))的龐大數(shù)量規(guī)模,每個(gè)“全局模型”的訓(xùn)練成本,在無(wú)意中便被不斷攤薄了。
因?yàn)槊總(gè)“小模型”的訓(xùn)練只需要消耗端側(cè)設(shè)備的計(jì)算資源,而不需要傳輸大量的原始數(shù)據(jù)到云端。這樣,就可以節(jié)省網(wǎng)絡(luò)帶寬和云端存儲(chǔ)空間,也可以減少云端服務(wù)器的計(jì)算壓力。

更重要的是,與云端GPU這類高成本的訓(xùn)練方式相比,由于端側(cè)AI芯片往往是針對(duì)特定的AI應(yīng)用和算法,進(jìn)行優(yōu)化和定制,因此其往往有著相對(duì)更明確的“回血”途徑。
例如,前段時(shí)間,爆火的妙鴨相機(jī),大家應(yīng)該都聽(tīng)說(shuō)了。在其最受追捧的初期,成千上萬(wàn)的用戶涌進(jìn)應(yīng)用中,高峰期一度有4000-5000人排隊(duì),需要等待10多個(gè)小時(shí)才能出片。
之后,是阿里云進(jìn)行了緊急擴(kuò)容,才勉強(qiáng)應(yīng)對(duì)了這暴漲數(shù)百倍的算力需求。
但倘若用戶不用在云端等待,而是直接在本地,或者通過(guò)端云協(xié)同的方式,就能實(shí)現(xiàn)這樣的生成效果呢?

一種可能的方式,是先在端側(cè)生成低分辨率的圖片,之后再上傳到云端,用較少的資源對(duì)圖片進(jìn)行清晰化處理。
如此一來(lái),既降低了云端算力的負(fù)擔(dān),又在一定程度上保障了生成的質(zhì)量、效率。
在當(dāng)下的AI應(yīng)用開(kāi)發(fā)中,開(kāi)發(fā)者不僅需要支付云端大模型API接口的成本,還得自己租用服務(wù)器,保證密鑰安全。
如果是文字生成類AI,文字量大的話,相應(yīng)的token也是一筆不小的開(kāi)支。
而隨著算力門檻的降低,眾多AI應(yīng)用的開(kāi)發(fā)者,將不再被云端算力的成本所縛,而只需調(diào)用端側(cè)大模型提供的開(kāi)放API,就可以快速開(kāi)發(fā)各類AI應(yīng)用。
在此基礎(chǔ)上,一個(gè)開(kāi)放的、多樣化的AI應(yīng)用生態(tài),就隨著端側(cè)大模型的普及,而應(yīng)運(yùn)而生了。
02 以“偏”補(bǔ)“全”的端側(cè)芯片
AI應(yīng)用井噴的時(shí)代似乎近在眼前,但要想讓每臺(tái)手機(jī)都標(biāo)配一個(gè)大模型,前面還有道難以回避的門檻——硬件基礎(chǔ)。
由于芯片架構(gòu)不同,在端側(cè)部署時(shí),往往需要對(duì)模型網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行一通修改才能勉強(qiáng)“上車”。
具體來(lái)說(shuō),目前GPT這類主流AI所使用的Transformer架構(gòu),往往部署于云端服務(wù)器。

這是因?yàn)镚PU對(duì)于MHA結(jié)構(gòu)(Transformer中的多頭注意力機(jī)制)計(jì)算支持更友好。而端側(cè)AI的芯片,則主要側(cè)重于CNN(卷積神經(jīng)網(wǎng)絡(luò))的結(jié)構(gòu)。
如果將前者強(qiáng)行轉(zhuǎn)移到端側(cè),帶來(lái)的一個(gè)明顯問(wèn)題,就是模型精度下降。
那么有沒(méi)有什么辦法,能讓大模型在進(jìn)行端側(cè)化改造的同時(shí),仍能保證其精度呢?
愛(ài)芯元智推出的端側(cè)芯片AX650N,似乎提供了一個(gè)可能的路線。
AX650N芯片擁有自研混合精度NPU和愛(ài)芯智眸AI-ISP兩大核心技術(shù),其對(duì)Transformer結(jié)構(gòu)的網(wǎng)絡(luò)進(jìn)行了專門的優(yōu)化,在其NPU中增加了專門用于自注意力計(jì)算的單元,可以大幅提升Transformer網(wǎng)絡(luò)的運(yùn)行速度和準(zhǔn)確率。

憑借著這類針對(duì)端側(cè)的優(yōu)化技術(shù),AX650N已經(jīng)做到了在端側(cè)部署原版Swin Transformer只需要5分鐘,而跑起私有模型,只要1個(gè)小時(shí)就能搞定。
但盡管如此,受限于架構(gòu)和內(nèi)存,這樣的優(yōu)化,僅僅只是針對(duì)視覺(jué)大模型方向而言的,因?yàn)閺挠布懔ι蟻?lái)說(shuō),端側(cè)AI芯片,始終難以做到GPU芯片那樣“面面俱到”的通用性、兼容性。
既然如此,國(guó)內(nèi)的大模型之困,是否就指望不上它了?
其實(shí)不然,從量的角度來(lái)講,邊緣側(cè)、端側(cè)的需求一定比云側(cè)更大,畢竟邊緣側(cè)、端側(cè)設(shè)備會(huì)更多。
而在這眾多的需求中,只要使用了大模型的終端(如手機(jī)、智能音箱),能做到兩點(diǎn),那么國(guó)內(nèi)大模型在應(yīng)用層,就有盤(pán)活的可能。
其中第一點(diǎn),就是夠降低人們獲取信息、知識(shí)的成本。

倘若以后人們打開(kāi)手機(jī)或者其他終端,就能獲得一個(gè)諸如私人醫(yī)生和律師、廚師的AI助理,能為我們提供成本低廉、快速的咨詢服務(wù),那么人們就會(huì)對(duì)其產(chǎn)生依賴。
因?yàn)閺男袨閷W(xué)上來(lái)說(shuō),人總歸是有惰性的。
雖然目前的某些律所,也能為人們提供免費(fèi)的咨詢服務(wù),但這其中卻包含了無(wú)形的時(shí)間成本、溝通成本。
正如互聯(lián)網(wǎng)出現(xiàn)后,雖然人們?nèi)阅芡ㄟ^(guò)紙制地圖進(jìn)行導(dǎo)航,但大部分人卻再也離不開(kāi)手機(jī)上的定位功能一樣。
從某種程度上說(shuō),壓縮了各種知識(shí)、智能的端側(cè)模型,將會(huì)重復(fù)這一過(guò)程。
第二點(diǎn),則是個(gè)性化功能的普及。

在“前AI時(shí)代”,個(gè)性化定制的大規(guī)模推廣,是一件不可想象的事。
在沒(méi)有AI技術(shù)支持的情況下,實(shí)現(xiàn)個(gè)性化定制通常需要大量的人力和時(shí)間投入。為每個(gè)用戶提供個(gè)性化的產(chǎn)品或服務(wù),往往需要大量的人工處理。
然而,隨著本輪AI革命的到來(lái),人們已經(jīng)在應(yīng)用層,看到了AI用于個(gè)性化、定制化服務(wù)的可能。
例如character.Ai一類的應(yīng)用,支持用戶根據(jù)自己的需求、偏好,量身定制一個(gè)“AI伴侶”。

試想一下,倘若這樣的定制化服務(wù)進(jìn)入到了端側(cè),端側(cè)大模型就能不斷收集用戶數(shù)據(jù),再進(jìn)行反饋、訓(xùn)練,并最終打造出一個(gè)獨(dú)一無(wú)二的、貼身的AI助手。
而這樣量身定制的體驗(yàn),顯然比大規(guī)模的標(biāo)準(zhǔn)化服務(wù),更具吸引力。
03 總結(jié)
盡管在模型規(guī)模、性能等方面,端側(cè)大模型目前還遠(yuǎn)無(wú)法與云端大模型相比,但分布式的算力格局,以及龐大的規(guī)模效應(yīng),都將大大降低目前國(guó)內(nèi)云端算力的負(fù)擔(dān)。
而在算力成本降低之后,大量基于API接口的AI應(yīng)用,也得以通過(guò)一個(gè)個(gè)部署在本地的端側(cè)大模型不斷涌現(xiàn)。
在應(yīng)用大爆發(fā)的背景下,一些捕捉到先機(jī)的應(yīng)用,就會(huì)基于端側(cè)大模型實(shí)時(shí)響應(yīng)、個(gè)性化定制的功能,引爆本輪AI革命真正的盈利點(diǎn)。
而這,正是無(wú)數(shù)人在這股AI浪潮中苦苦追尋的。
原文標(biāo)題 : 端側(cè)AI,如何化解國(guó)內(nèi)算力之困?
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
即日-5.20立即下載>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
-
精彩回顧立即查看>> 【在線會(huì)議】液冷服務(wù)器信號(hào)完整性及冷卻液關(guān)鍵電參數(shù)測(cè)試
推薦專題
- 1 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測(cè):中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了
- 3 6000億美元估值錨定:字節(jié)跳動(dòng)的“去單一化”突圍與估值重構(gòu)
- 4 Tesla AI5芯片最新進(jìn)展總結(jié)
- 5 連夜測(cè)了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個(gè)短板了
- 6 熱點(diǎn)丨AI“瑜亮之爭(zhēng)”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤(pán):9秒刪庫(kù)跑路,全員被封號(hào),還繼續(xù)扣錢!
- 8 2026,人形機(jī)器人只贏了面子
- 9 DeepSeek降價(jià)90%:價(jià)格屠夫不是身份,是戰(zhàn)略
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





