CVPR 2020 最佳論文提名 | 神經網絡能否識別鏡像翻轉
經過圖像處理后,每個循環群

將變化為

:

命題3里,我們假設T和J具備交換律,那么我們可以將上面的公式改寫,并得到

:

原分布D不具備視覺手性意味著:每個循環群

中的元素都有相同的概率出現。因此,由于經過J圖像處理后循環群變為了

,我們只需要證明以下運算為同態(homomorphism):

因為對于同態來說,根據第一同構基本定理(First Isomorphism Theorm)可以推理出每個輸出對應著相同數量的輸入。而因為每個循環群中單個輸入

在原分布D上有著相同的概率,意味著每個輸出

也具備相同的概率,也意味著

不具備視覺手性。證明同態的步驟如下:

以上為命題3的證明。通過命題3,我們知道了J和T的交換律與處理后圖像分布的視覺手性的關系。那么,只需要通過檢查交換律,我們便可以判斷圖像處理是否可能產生新的視覺手性。檢查的方式也很簡單,對于任意圖片x,我們只需要計算其交換殘差(commutative residual)是否為0:

下圖形象的解釋了交換殘差的計算過程:

文中使用去馬賽克、JPEG壓縮、以及兩者結合這三種圖像處理方法,對于鏡像翻轉這一圖片變換方式分別計算了交換殘差。
當去馬賽克處理的圖像寬度為奇數時,處理后的圖像分布可能具備視覺手性;反之如果為偶數,則不具備視覺手性。當JPEG壓縮的圖片不為16整除時,處理后的圖像分布可能具備視覺手性,反之則不具備。當兩者結合后,處理后的圖片一定具備視覺手性:

作者為了驗證這些結論,在原本不具備視覺手性的人工數據集(高斯分布生成的隨機圖片)上,對不同寬度的圖片分別進行了這三種處理,并使用神經網絡進行了自監督學習。實驗結果符合這一測試的預期。因為大量互聯網圖片都經過了去馬賽克和JPEG壓縮,這一結論意味著數字圖像處理所帶來的視覺手性現象在互聯網圖片中廣泛存在。
當加入隨機剪裁(random cropping)后,我們還能得到這一結論么?作者的答復是肯定的。
為了理解隨機剪裁對于視覺手性的影響,作者提到了兩個關鍵點。
第一點:命題三中只討論了單種J的情況。而隨機剪裁可以被視為許多種J(例如

是向右平移一格并剪裁,

是向右平移兩個并剪裁)的結合,每一種有相同概率出現。
第二點:命題三中并沒有討論T和J不具備交換律的情況。例如當J是向將圖片右平移十個像素并進行一次中心剪裁時,T和J無法具備交換律。在這種情況下,新的圖像分布并不一定具備視覺手性。
對于第一點來說,假設我們有多種不同的J(例如

,

,

),而他們分別與T具備交換律時,我們可以用以下公式表達新的圖像分布:

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













