CVPR 2020: SGAS,一種基于貪心思想的CNN/GCN網絡結構搜索算法
SGAS詳細方案
針對退化的搜索評估相關性這一重要的問題,我們提出了SGAS(SequentialGreedy Architecture Search),一種順序貪心決策的搜索算法。

圖2 SGAS的網絡結構搜索示意圖
我們基于貪心算法的思想將網絡結構的搜索問題,轉化為逐步地選擇一條邊并確定其運算的子問題。實驗證明,依次解決這些簡單的子問題,可以讓最終結構具有更高的搜索-測試相關性。算法的迭代過程如算法1所示。

在每個決策時期,我們根據預先確定的選擇標準選擇一條邊(i^{+}, j^{+})。通過用公式(3)得到這條邊的運算,并替換相應的混合運算o^{ar}。所選擇的運算,即是所選的邊基于貪心的最優選擇。每當確定好一條邊的運算,我們就不再需要這條邊的結構參數lpha(i^{+}, j^{+}))以及混合操作中其余路徑的權重,我們可以將這條邊從后續的優化中去除。這樣可以帶給我們一個額外的好處是:優化問題得到了剪枝,進而可以提高搜索的效率。一條邊被剪枝后,剩下的超網絡以及參數形成一個新的子問題,該子問題將被以相同的算法迭代求解。在搜索階段的最后,便得到一個沒有權重共享的離散子網絡,如圖2所示。SGAS算法基于順序貪心算法,減少了在搜索階段和評價階段的模型不一致性和權重共享的副作用,使得模型的搜索-測試相關性最大化。
在SGAS中,選擇標準的設計至關重要。我們考慮影響邊的選擇的三個重要因素:邊的重要性,選擇確定性和選擇穩定性。
邊的重要性:如果這條邊的非零運算選擇的可能性越高,表明這條邊越重要。

選擇確定性:熵(entropy)是分布用度量不確定性的常。非零運算的歸一化權重可以看作是一種分布:

我們將選擇確定性定義為一減去操作分布的歸一化熵:

選擇穩定性:為了讓選擇更穩定,我們需要考慮選擇確定性的歷史分布。直方圖相交[48]是檢測分布變化的常用方法,我們利用直方圖相交來計算第T步中的前K時間的邊的平均選擇穩定性:

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













