使用相機和深度學習制作偽LiDAR
1.監督深度估計
“監督”深度學習背后的概念很簡單,收集RGB圖像及其相應的深度圖,訓練類似于“自動編碼器”的體系結構進行深度估計。(盡管訓練起來不那么簡單,但如果不通過訓練過程整合一些特殊技巧,FCN就永遠無法真正發揮作用:)。
盡管此方法更易于掌握,但在現實生活中收集深度圖是一項昂貴的任務。LiDAR數據可用于訓練這類網絡,因此,如果我們對由LiDAR收集的數據進行訓練,則神經網絡的性能將明顯優于LiDAR,但仍然可以,因為我們不需要那種級別的準確性來駕駛汽車例如,知道樹上是否有葉子的確切距離。
2.無監督深度估計
僅在一系列環境中記錄質量深度數據是一個具有挑戰性的問題。無監督方法可以在沒有地面真實深度圖的情況下學習深度!
“這種方法只是查看未標記的視頻,并找到一種方法來創建深度圖,方法不是嘗試正確,而是嘗試保持一致。”
3.神經網絡架構
該網絡具有類似于U-Net的架構,編碼器部分是在ImageNet數據集上訓練的預訓練DenseNet模型。解碼器部分使用雙線性上采樣而不是簡單的上采樣。
簡而言之,我們使用雙線性上采樣是因為它在上采樣后會整體上產生“平滑”圖像。輸出是深度圖,深度圖是圖像大小的一半,這有助于網絡學習更快。
4.圖像增強
對于圖像增強,可以使用以下技術:圖像翻轉,輸入圖像的色彩通道改組,向輸入圖像添加噪點,增加輸入圖像的對比度,亮度,溫度等。這樣可以確保模型在整個訓練過程中始終看到新數據,并更好地泛化未見數據。
目前,深度估計在AR / VR中已經得到了許多應用。
請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
精彩回顧立即查看>> 【線下會議】恩智浦創新技術峰會·深圳
-
精彩回顧立即查看>> 【在線直播】可視化神器!VisionSym 賦能汽車光學原型開發
-
精彩回顧立即查看>> 12月16-17日 AMD 嵌入式峰會
-
精彩回顧立即查看>> 恩智浦創新技術峰會
-
精彩回顧立即查看>> 【工程師系列】汽車電子技術在線大會
-
精彩回顧立即查看>> Works With 開發者大會深圳站
推薦專題


分享










