光神經網絡,正在照亮智能計算的未來
如果問一個問題——能夠進行深度神經網絡計算的芯片有哪些?大家給出的答案可能五花八門:CPU、GPU、DSP、NPU……
過去幾年里,電子計算已經成為實現人工智能算法——尤其是深度神經網絡模型——最重要的算力支撐。盡管具體的硬件架構各有不同,但一言以蔽之,都是采用了馮諾依曼型的計算原理,即VLSI(超大規模集成電路)的“電子+邏輯”信息處理模式,以復雜的邏輯電路和處理器芯片來完成計算任務。
但是電子方法有其先天缺陷:一是信號之間容易相互干擾,對需要高密度連接的神經網絡帶來一定的困難;二是能源需求太高,導致計算成本居高不下。
在以AI為主旋律的“數字基建”大規模爆發前夜,在算力上未雨綢繆,自然也就成了學術界和產業界共同關注的頭等大事。
最近,明斯特大學、牛津大學和埃克塞特大學的研究人員就共同實現了一項新的計算芯片,采用光學系統來幫助神經網絡進行“學習”,以此實現計算、識別等行為。
不過,無論是光學計算,還是類腦芯片,類似的提法其實在學界早已有之,并且由于自身的局限性一直進展緩慢。那么,光學深度學習芯片的出現,是否真的突破了先天的技術桎梏,又意味著哪些新的產業機遇呢?
光學計算+深度神經網絡的“攪和”歷史
在介紹新計算硬件之前,先言簡意賅地解答一下大家心中可能存在的困惑——光到底是如何進行計算的?又為什么比電子方法更有優勢呢?
我們知道,深度學習神經網絡是模仿人類大腦神經元的運行方式而來的。在每一層中,來自上一層(或者輸入源)的信號經由神經元處理,將結果和前向信號傳遞給下一層的神經元。
很顯然,這種計算方式需要依賴神經元之間的大量、動態的連接才能完成,會對大多數使用電子方法的集成電路造成壓力。
因此,大家紛紛開始研究其他硬件,光學芯片因此成為“全村的希望”。
2017年,MIT的研究人員就研發出了一種使用光子技術實現神經網絡的方法。他們使用一系列相互連接的波導管(傳輸微波波段的電磁波裝置),來為特定的計算編程。而處理器則通過一系列耦合光子波導來引導光線,因此只需要運用鏡片改變光線的方向,就可以達成運算。
可編程、低能耗,聽起來是不是棒棒噠?不過這種方式打造的硬件準確率實在是不太令人滿意,只有77%,被傳統方法吊打的節奏啊。
不過科學家們并沒有認輸,2018年加州大學洛杉磯分校的科學家們又將光學深度學習送上了《Science》雜志。
這次,科學家們采用3D 打印的方式制造出了一種全光學的深度學習框架D2NN。
簡單來說,研究人員訓練出了能夠識別不同數據類型的光學網絡模型,并為它們分別創建了模型,該模型由多個像素層組成,每個像素之間如同神經元一樣進行連接,并通過光來傳輸信息。
然后,研究人員采用五層 3D 打印塑料對仿真模型進行物理再現,固態成品的探測器就可以通過物體表面反射的光來判斷出相應的分類結果。
這種由光學元件堆疊而成的神經網絡硬件,準確率能達到 91.75%,成本相對便宜,但是卻很難做到器件的小型化,難以處理復雜的數據及圖像分析,而且所有參數3D打印之后就不能被再次編程了。
(使用 3D 打印的“人工神經網絡”芯片)
總結一下就是,此前的研究都對光學計算+神經網絡的解決方案提出了自己的方法,但帶來的問題多于答案,科學家們不得不繼續探索。
全光學神經突觸系統:能否刷新光學計算的進程?
5月8日,來自德國明斯特大學的科學家將其研究成果發布在了《Nature》雜志上。
論文《All-optical spiking neurosynaptic networks with self-learning capabilities》(具有自學習功能的全光學尖峰神經突觸網絡),提出了一種可以在毫米級光子芯片上實現的全光學神經網絡。
研究人員是這么設想的:
輸入的數據(即光波導)可以被微米級環狀諧振器調制成不同的波長,然后注入網絡并停留在光學微芯片上。接著利用集成在一起的相變材料,來實現權重調制,這種物質可以由光觸發顯著的變化,非常適合模擬突觸和神經元之間的“沖動”。
信息在光學神經網絡中的傳輸,就好像是兩組人(單個波導的兩條路徑)同時在玩傳聲游戲,需要隔的距離比較遠,來防止另一個組的聲音干擾(耦合)。同時還不能有人亂開腦洞急轉彎,免得傳話內容南轅北轍(光離開波導)。
因此,在每個組的傳話過程中,都派出一個小秘書(相變材料),根據每組任務(權重)的不同,在每次傳遞過程中(微環諧振器的入口和出口處),對隊員們向下傳遞的信息進行微調,將被傳錯/修改的信息復位,這樣就能最大限度地保證每個隊伍向后傳遞的信息,既能保持差異,又足夠準確。
為了證明這一點,研究人員開發了一個由四個人工神經元和60個突觸組成的芯片。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產聯看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 4 Tesla AI5芯片最新進展總結
- 5 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰略
- 10 AI Infra產業鏈卡在哪里了?


分享













