CVPR 2020: SGAS,一種基于貪心思想的CNN/GCN網絡結構搜索算法
論文作者來自阿卜杜拉國王科技大學的在讀博士生李國豪,本次分享的是KAUST與Intel ISL在 CVPR 2020 的工作:SGAS,一種基于貪心思想的CNN/GCN網絡結構搜索算法。


本工作通過貪心(greedy)的搜索方式減輕了NAS中模型排名在搜索和最后評估不一致的問題。是一種更優更快的網絡結構搜索算法,并同時支持CNN和GCN的搜索。代碼已開源,想在圖像,點云,生物圖數據上做網絡結構搜索的同學都可以試一試。

相關工作
網絡結構搜索(NeuralArchitecture Search, 簡稱NAS) 是一種神經網絡結構自動化設計的技術。NAS基于相應算法在特定的樣本集內自動設計出高性能的網絡結構。這些自動搜索出的網絡結構在某些任務上已經媲美或超過了人類專家手工設計的網絡結構。
早期NAS的算法是基于強化學習(Zoph et al.[1])或進化算法(Real et al.[2])。這些算法計算成本高昂,阻礙了其廣泛應用。近來,Liu et al.[3]提出了一種高效的可微分的網絡結構搜索算法:可微分網絡結構搜索(Differentiable Architecture Search, 簡稱DARTS)。DARTS的提出使得網絡結構搜索在單卡一天內完成搜索。后續許多工作都基于DARTS基礎上進行改進,比如SNAS/FBNet/ProxylessNAS/P-DARTS/GDAS/MdeNAS/PC-DARTS/FairDARTS等等。
背景知識:DARTS
DARTS采用基于單元(Cell)的搜索方法進行網絡結構搜索。Cell是一個網絡子模塊,可以自由堆疊多次形成卷積網絡。DARTS通過學習cell的結構,完成對網絡的結構搜索。Cell是由N個節點的有序序列組成的有向無環圖(如圖1)。Cell中每個節點x^(i)是卷積網絡中的特征圖,每個有向邊(i,j)代表一種對x的運算o(i, j) (如3x3的卷積)。一個cell具有兩個輸入節點,一個輸出節點和多個中間結點。Cell的輸入節點被定義為前兩層的輸出。Cell的輸出是對所有中間節點進行歸約運算(例如concatenation)后的結果。每個中間節點由它之前結點經過算子op變換后相加得到:

DARTS為了實現可微搜索,提出了搜索空間的continuousrelaxation機制,利用softmax函數來學習所有可能候選運算op的權重:

其中,$mathcal(O)$ 表示搜索空間中的候選運算(例如卷積,最大池化,零)等,零表示沒有運算(邊)。其中一對節點(i,j)之間的運算由向量lpha_{i, j}參數化。運算的結果是每種可能運算結果的加權求和。向量lpha_{i, j}的維度為搜索空間長度|O|。因而,DARTS將網絡結構搜索的任務簡化為了學習一組連續變量lpha= {lpha(i, j)},如圖1所示。DARTS在搜索結束階段,通過argmax得到權重最大的候選運算op當作該邊的搜索結果:


圖1 DARTS的單元結構以及網絡結構搜索示意圖[3]
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













