偷欢艳妇熟女小说,日韩伦理视频在线观看,国产欧美日韩视频一区二区三区,中文字幕成人影片

ECCV2020 GigaVision挑戰賽，深蘭科技包攬十億級像素雙賽道冠軍

2020-09-03 15:08

深蘭科技

關注

DeepBlueAI團隊榮獲兩項第一

任務一：

ECCV2020 GigaVision挑戰賽，深蘭科技包攬十億級像素雙賽道冠軍

任務二：

ECCV2020 GigaVision挑戰賽，深蘭科技包攬十億級像素雙賽道冠軍

賽題特點

圖像分辨率極高、近景和遠景目標尺度差異大十億像素級的超高分辨率是整個數據集的核心問題。一方面，由于計算資源的限制，超高分辨率使得網絡無法接受大圖作為輸入，而單純將原圖縮放到小圖會使得目標丟失大量信息。另一方面，圖像中近景和遠景的目標尺度差異大，給檢測器帶來了巨大的挑戰。目標在圖像中分布密集，并且遮擋嚴重數據集均從廣場、學校、商圈等真實場景采集，其人流和車輛密度極大。同時，行人和車輛的擁擠、遮擋等情況頻發，容易造成目標的漏檢和誤檢。

主要工作

賽道一 Pedestrian ＆ Vehicle Detection

根據以往積累的經驗，團隊首先將原圖縮放到合適尺度，并使用基于Cascade RCNN的檢測器直接檢測行人的三個類別和車輛，將其作為Baseline： Backbone ＋ DCN ＋ FPN ＋ Cascade RCNN，并在此基礎上進行改進。

ECCV2020 GigaVision挑戰賽，深蘭科技包攬十億級像素雙賽道冠軍

實驗結果顯示，模型存在大量的誤檢和漏檢。這些漏檢和無意義的檢測結果大幅降低了模型的性能。團隊將上述問題歸納為兩方面的原因：

訓練和測試時輸入模型的圖像尺度不合適。圖像經過縮放后，目標的尺度也隨之變小，導致遠景中人的頭部等區域被大量遺漏。

網絡本身的分類能力較弱。行人的可見區域和全身區域十分相似，容易對分類器造成混淆，從而產生誤檢。

根據上述問題，團隊進行了一些改進。首先，使用滑動窗口的方式切圖進行訓練。滑動窗口切圖是一種常用的大圖像處理方式，這樣可以有效的保留圖像的高分辨率信息，使得網絡獲得的信息更加豐富。如果某個目標處于切圖邊界，根據其IOF大于0．5來決定是否保留。其次，對于每個類別采用一個單獨的檢測器進行檢測。經過實驗對比，對每個類別采用單獨的檢測器可以有效的提高網絡的效果，尤其是對于可見區域和全身區域兩類。同時向檢測器添加了Global Context （GC） block來進一步提高特征提取能力。GC－Block結合了Non－local的上下文建模能力，并繼承了SE－Net節省計算量的優點，可以有效的對目標的上下文進行建模。

ECCV2020 GigaVision挑戰賽，深蘭科技包攬十億級像素雙賽道冠軍