日韩无套无码精品在线播放,国产成人精品国内自产拍麻豆,丁香花在线视频观看免费,日韩在线视频免费观看高清完整版

免费久久国产&夜夜毛片&亚洲最大无码中文字幕&国产成人无码免费视频之奶水&吴家丽查理三级做爰&国产日本亚欧在线观看

論文：基于關鍵點的單目3D目標檢測

2020-09-09 15:06

學術頭條

關注

關鍵點檢測網絡

本文的關鍵點檢測網絡將 RGB 圖像當作輸入，輸出 3D 檢測框的頂點及中心點，其包括三個組成部分：骨架、關鍵點特征金字塔以及檢測頭，主要架構采用了與 2D 無錨檢測器相似的一階段策略。

為了在速度和準確性之間進行平衡，本文使用兩種不同的結構作為主干：ResNet18 和 DLA－34。所有模型均拍攝單個 RGB 圖像 I∈R＾｛W×H×3｝，并以因子 S ＝ 4 對輸入進行降采樣。ResNet－18 和 DLA－34 用于圖像分類網絡，最大降采樣因子為 ×32。我們通過三個雙線性插值和 1×1 卷積層對瓶頸三次進行上采樣。在上采樣層之前連接了相應的低級特征圖，同時添加了一個 1×1 卷積層以減小通道尺寸。經過三個上采樣層后，通道分別為 256、128、64。

圖像中的關鍵點在大小上沒有差異。因此，關鍵點檢測不適合使用特征金字塔網絡（FPN）。本文提出了一種新的關鍵點特征金字塔網絡（KFPN），以檢測點空間中尺度不變的關鍵點。假設我們有F個尺度特征圖，我們首先調整每個大小f的大小，將其統(tǒng)一為最大的 f 的大小。然后通過 softmax 運算生成軟權重，以表示每個尺度的重要性。通過線性加權獲得最終的尺度空間得分圖：

檢測頭由三個基本組件和六個可選組件組成，可以任意選擇這些組件以提高 3D 檢測的準確性，而計算量卻很少。受 CenterNet 的啟發(fā)，本文將關鍵點作為連接所有特征的主要中心由于在截斷的情況下對象的 3D 投影點可能會超出圖像邊界，因此將更適當地選擇 2D 框的中心點。Heatmap 定義為 M，其中 C 是目標種類的數量，另一部分是由頂點和中心點投影出的 9 個點 V，對于一個對象的關鍵點，本文將回歸得到的主中心的局部偏移量 Vc 作為指標。最接近 Vc 坐標的 V 的關鍵點被作為一個對象的集合。盡管 9 個關鍵點的 18 個的約束能夠恢復物體的 3D 信息，但是越多的先驗條件能夠增加更多的約束，中心偏移 M＿OS，頂點偏移 V＿OS 是 heatmap 中對每個關鍵點的離散誤差。

3D 目標的維度 D 方差小容易預測，本文引用基于 Multi－Bin 方法對偏航角 θ 進行回歸。將 θ 的余弦偏移和正弦偏移概率在 1 個 bin 中進行分類，并使用 2 個 bin 生成方向特征圖，同時對 3D 邊框的中心深度Z進行回歸。最終的 loss 如下（各部分 loss 的定義參見原文，在此不再贅述）：