華為高級研究員謝凌曦: 下一代人工智能計算模型探索
導 讀
為什么、難在哪、怎么做:——下一代人工智能計算模型探索
Next Generation of AI-Computing Models:——Why, What, and How下一代人工智能計算模型,主要是使用一些自動化技術(shù)幫助我們設(shè)計更好的深度學習網(wǎng)絡(luò)結(jié)構(gòu),并在任務(wù)中提升性能。本文會重點從Why、What、How這3個地方重點講解。
第一部分 什么是網(wǎng)絡(luò)架構(gòu)搜索(NAS)?為什么很重要?
一、AI領(lǐng)域未來面臨的挑戰(zhàn)
有3件事是確定的:數(shù)據(jù)(data),模型(model),知識(knowledge)

1. 數(shù)據(jù)
Data-efficiency:如何利用有限或多模態(tài)數(shù)據(jù)訓練模型?
在如今的數(shù)據(jù)爆炸時代,會產(chǎn)生海量的數(shù)據(jù),其中只有很少的數(shù)據(jù)有數(shù)據(jù)標注,大量的數(shù)據(jù)沒有數(shù)據(jù)標注,且數(shù)據(jù)很“臟”。于是引出了第一個問題:如何從海量數(shù)據(jù)重,真正學習到自己想要的東西。
AI未來的發(fā)展方向是從全監(jiān)督發(fā)展成自監(jiān)督和無監(jiān)督的方向。
2. 模型
Auto-learning:如何為人工智能應(yīng)用設(shè)計強大高效的模型?
這一代的計算模型主要是基于深度學習的,尤其是卷積神經(jīng)網(wǎng)絡(luò)。深度學習在圖像識別領(lǐng)域的應(yīng)用,使得原先的模型從手工識別特征發(fā)展到自動學習特征。
基于這種發(fā)展的趨勢,我們將模型繼續(xù)推進一步,使得深度學習的網(wǎng)絡(luò)設(shè)計也從手動轉(zhuǎn)為自動。這是模型部分所面臨的挑戰(zhàn)。
3. 知識
Knowledge-aware:如何定義和存儲知識,使訓練后的模型安全可靠?
現(xiàn)有模型的算法,大部分都是擬合和訓練數(shù)據(jù),并不能保證擬合得到的結(jié)果具備分析常識的能力,即“不能真正地學習知識”。由于計算機缺乏常識,對知識的學習,可能會成為AI未來5年的研究方向。
二、AutoML介紹
本文的重點是模型部分,主要分析手動和自動,這兩種思路的區(qū)別。
2017年自動化網(wǎng)格搜索架構(gòu)被提出后,“手動更好”還是“自動更好”這類爭論不斷。在爭論的過程中逐漸催生出了一個新的方向,稱為自動化機器學習(AutoML)。這一方向在工業(yè)界得到了更多的關(guān)注度。
工業(yè)界的關(guān)注度超過學術(shù)結(jié),主要有兩個原因:
(1) 工業(yè)界的算力更強。
AutoML算法對計算資源的消耗非常大。例如,Google發(fā)表的NAS方面的論文,需要上萬個GPU /天才能完成這樣的計算。
(2) 工業(yè)界有很強的需求。AutoML可以幫工業(yè)界節(jié)省很多的開發(fā)成本。
以華為為例,華為有各種各樣不同的手機產(chǎn)品,從旗艦機到低端的手機,芯片的計算能力會差很多。用戶會需要在不同的手機中完成相似的功能(如拍視頻),因此針對不同的芯片需要設(shè)計不同的網(wǎng)絡(luò)架構(gòu)以滿足用戶的需求;另一方面,用戶的需求(如清晰度的要求)是實時變化的,如果使用人工機器學習算法,會帶來巨大的人力投入。基于此,工業(yè)界存在自動化算法的需求。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-5.20立即下載>> 【限時免費】物理場仿真助力生物醫(yī)學領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會議】液冷服務(wù)器信號完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩(wěn)、細節(jié)炸,設(shè)計師慌了
- 3 6000億美元估值錨定:字節(jié)跳動的“去單一化”突圍與估值重構(gòu)
- 4 Tesla AI5芯片最新進展總結(jié)
- 5 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續(xù)扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰(zhàn)略
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













