最近一年語義SLAM哪些代表性工作?

      網友投稿 822 2022-05-29

      目前 Semantic SLAM (注意不是 Semantic Mapping)工作還比較初步,可能很多思路還沒有打開,但可以預見未來幾年工作會越來越多。語義 SLAM 的難點在于怎樣設計誤差函數,將 Deep Learning 的檢測或者分割結果作為一個觀測,融入 SLAM 的優化問題中一起聯合優化,同時還要盡可能做到至少 GPU 實時。

      下面是一些有代表性的文章,提供下載和簡單思路的理解,但個人精力、能力有限也歡迎大家隨時提供更多更好的文章。

      1、《Probabilistic Data Association for Semantic SLAM》 ICRA 2017

      語義 SLAM 中的概率數據融合,感覺應該算開山鼻祖的一篇了。這篇也獲得了 ICRA 2017 年的 Best Paper,可見工作是比較早有創新性的。文章中引入了 EM 估計來把語義 SLAM 轉換成概率問題,優化目標仍然是熟悉的重投影誤差。這篇文章只用了 DPM 這種傳統方法做檢測沒有用流行的深度學習的檢測網絡依然取得了一定的效果。當然其文章中有很多比較強的假設,比如物體的三維中心投影過來應該是接近檢測網絡的中心,這一假設實際中并不容易滿足。不過依然不能掩蓋其在數學上開創性的思想。

      文章下載:probabilistic-data-association-for-semantic-slam

      2、《VSO: Visual Semantic Odometry》 ECCV 2018

      既然檢測可以融合,把分割結果融合當然是再自然不過的想法,而且直觀看來分割有更加細粒度的對物體的劃分對于 SLAM 這種需要精確幾何約束的問題是更加合適的。ETH 的這篇文章緊隨其后投到了今年的 ECCV 2018。這篇文章依然使用 EM 估計,在上一篇的基礎上使用距離變換將分割結果的邊緣作為約束,同時依然利用投影誤差構造約束條件。在 ORB SLAM2 和 PhotoBundle 上做了驗證取得了一定效果。這篇文章引入距離變換的思路比較直觀,很多人可能都能想到,不過能夠做 work 以及做了很多細節上的嘗試,依然是非常不容易的。但仍然存在一個問題是,分割的邊緣并不代表是物體幾何上的邊緣,不同的視角這一分割邊緣也是不停變化的,因此這一假設也不是非常合理。

      最近一年語義SLAM有哪些代表性工作?

      文章下載:vso-visual-semantic-odometry

      3、《Stereo Vision-based Semantic 3D Object and Ego-motion Tracking for Autonomous Driving》 ECCV 2018

      港科大沈邵劼老師團隊的最新文章,他們的 VINS 在 VIO 領域具有很不錯的開創性成果。現在他們切入自動駕駛領域做了這篇雙目語義3D物體跟蹤的工作,效果還是很不錯的。在沈老師看來,SLAM 是一個多傳感器融合的框架,RGB、激光、語義、IMU、碼盤等等都是不同的觀測,所以只要是解決關于定位的問題,SLAM 的框架都是一樣適用的。在這篇文章中,他們將不同物體看成不同的 Map,一邊重建一邊跟蹤。使用的跟蹤方法仍然是傳統的 Local Feature,而 VIO 作為世界坐標系的運動估計。語義融合方面,他們構造了4個優化項:

      最終取得了很好的效果。

      演示地址:https://www.youtube.com/watch?v=5_tXtanePdQ

      文章下載:stereo-vision-based-semantic-3d-object-and-ego-motion-tracking-for-autonomous-driving

      4、《Long-term Visual Localization using Semantically Segmented Images》ICRA 2018

      這篇論文講得比較有意思,它不是一個完整的SLAM系統,不能解決Mapping的問題。它解決的問題是,當我已經有了一個很好的3D地圖后,我用這個地圖怎么來定位。在傳統方法中,我們的定位也是基于特征匹配的,要么匹配 Local Feature 要么匹配線、邊等等幾何特征。而我們看人在定位時的思維,其實人看不到這么細節的特征的,通常人是從物體級別去定位,比如我的位置東邊是某某大樓,西邊有個學校,前邊有個公交車,我自己在公交站牌的旁邊這種方式。當你把你的位置這樣描述出來的時候,如果我自己知道你說的這些東西在地圖上的位置,我就可以基本確定你在什么地方了。這篇文章就有一點這種意思在里邊,不過它用的觀測結果是分割,用的定位方法是粒子濾波。它的地圖是三維點云和點云上每個點的物體分類。利用這樣語義級別的約束,它仍然達到了很好的定位效果。可想而知這樣的方法有一定的優點,比如語義比局部特征穩定等;當然也有缺點,你的觀測中的語義信息要比較豐富,如果場景中你只能偶爾分割出一兩個物體,那是沒有辦法work的。

      演示地址:https://www.youtube.com/watch?v=M55qTuoUPw0

      文章下載:long-term-visual-localization-using-semantically-segmented-images

      AI

      版權聲明:本文內容由網絡用戶投稿,版權歸原作者所有,本站不擁有其著作權,亦不承擔相應法律責任。如果您發現本站中有涉嫌抄襲或描述失實的內容,請聯系我們jiasou666@gmail.com 處理,核實后本網站將在24小時內刪除侵權內容。

      上一篇:物聯網的三個源頭:智慧、網絡與物聯
      下一篇:【數據挖掘】分類任務簡介 ( 分類概念 | 分類和預測 | 分類過程 | 訓練集 | 測試集 | 數據預處理 | 有監督學習 )
      相關文章
      亚洲中文字幕日本无线码| 亚洲午夜精品一区二区| 亚洲麻豆精品果冻传媒| 亚洲一区二区精品视频| 一本久久综合亚洲鲁鲁五月天 | 亚洲精华国产精华精华液| 亚洲精品亚洲人成在线播放| 亚洲国产综合在线| 亚洲日本香蕉视频| 亚洲欧洲日产专区| 亚洲免费黄色网址| 亚洲伦理中文字幕| 亚洲人成网站免费播放| 亚洲国产成人手机在线观看| 无码天堂亚洲国产AV| 亚洲国产成人爱av在线播放| 亚洲日韩国产成网在线观看| 久久精品亚洲福利| 中文字幕精品亚洲无线码二区| 国产亚洲精品久久久久秋霞| 久久91亚洲人成电影网站| 婷婷精品国产亚洲AV麻豆不片 | 亚洲成a∨人片在无码2023 | 国产精品亚洲综合天堂夜夜| 国产成人亚洲综合无| 亚洲伦乱亚洲h视频| 国产成人麻豆亚洲综合无码精品| 亚洲欧洲日产国码一级毛片| 久久国产成人亚洲精品影院 | 在线观看亚洲AV每日更新无码| 亚洲国产欧洲综合997久久| 极品色天使在线婷婷天堂亚洲 | 亚洲综合色成在线播放| 亚洲精品无码久久千人斩| 亚洲一二成人精品区| 亚洲国产美女视频| 亚洲日韩一区二区一无码| 男人的天堂亚洲一区二区三区 | 亚洲国产精品成人综合色在线| gogo全球高清大胆亚洲| 亚洲中文字幕无码一区二区三区|