【第11篇】微軟發布的Dynamic Head,創造COCO新記錄:60.6AP
微軟發布的Dynamic Head,創造COCO新記錄:60.6AP
論文地址:https://arxiv.org/pdf/2106.08322.pdf
摘要
在目標檢測中結合定位和分類的復雜性導致了方法的蓬勃發展。以前的工作試圖提高各種物體檢測頭的性能,但未能呈現出統一的觀點。在本文中,我們提出了一種新穎的動態頭部框架,以將目標檢測頭部與注意力統一起來。通過在尺度感知的特征級別之間、空間感知的空間位置之間以及任務感知的輸出通道內相干地組合多個自注意力機制,所提出的方法顯著提高了對象檢測頭的表示能力,而無需任何計算開銷。進一步的實驗證明了所提出的動態頭在 COCO 基準上的有效性和效率。使用標準的 ResNeXt-101-DCN 主干,我們大大提高了流行對象檢測器的性能,并在 54.0 AP 上實現了新的最新技術。此外,借助最新的變壓器主干和額外數據,我們可以將當前最佳 COCO 結果推至 60.6 AP 的新記錄。代碼將在 https://github.com/microsoft/DynamicHead 上發布。
1 簡介
物體檢測是回答計算機視覺應用中“什么物體位于何處”的問題。在深度學習時代,幾乎所有現代物體檢測器 [11, 23, 12,35, 28, 31, 33] 共享相同的范式– 特征提取的主干和定位和分類任務的負責人。如何提高物體檢測頭的性能已經成為現有物體檢測工作中的關鍵問題。
開發一個好的物體檢測頭的挑戰可以概括為三類。首先,頭部應該是尺度感知的,因為具有截然不同尺度的多個對象通常共存于一個圖像中。其次?
版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。