论文笔记_SLAM_An Overview of SLAM_SPIE

青旅半醒 2023-07-07 03:43 123阅读 0赞

目录

1 论文介绍

2 典型的 Visual SLAM 结构

3 ORB-SLAM

4 RGB-D SLAM

5 发展趋势

5.1 多传感器融合

5.2 深度学习在SLAM上的应用

5.3 动态的场景的探索

5.4 多机器人协作

6 经典文献


1 论文介绍

  • 出处:SPIE 国际光学工程学会
  • 时间:2018
  • 作者:Feng Yang, Northwestern Polytechnical University

2 典型的 Visual SLAM 结构

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3NoeWpoeXAxMQ_size_16_color_FFFFFF_t_70

3 ORB-SLAM

  • 起源:Mur-Artal [28] in 2015
  • 论文:ORB-SLAM: A Versatile and Accurate Monocular SLAM System[J]. IEEE Transactions on Robotics, 2015

    • 作者:Raul Mur-Artal, J. M. M. Montiel, and Juan D. Tardos.
  • 特点:特征稳定,高精度,易于使用

4 RGB-D SLAM

  • 起源:Henry in 2010
  • 论文:RGB-D mapping: Using Kinectstyle depth cameras for dense 3D modeling of indoor environments[J]. International Journal of Robotics Research, 2010
  • 基本特点:

    • 使用深度相机,可以直接获取空间点的三维信息,且价格低廉
    • RANSAC:(随机样本一致性),匹配提取的特征点;
    • ICP:(迭代最近点),估计相机的姿态;
    • 算法后端采用基于树的网络优化(TORO)[39],并加入循环检测,构造全局最优的三维场景地图;
    • SIFT:提取两幅相邻彩色图像的SIFT[36]特征,加入相应深度信息,生成3D-3D特征点对信息;

      • 使用SIFT缺点:

        • 计算量太大
    • Henry 2014 自己的改进:

      • 使用 Feature from Accelerated Segment Test (FAST)
      • 使用 Calonder方法 计算 descriptors
    • Engelhard 2011 的改进:

      • SURF算法;
      • RANSAC: 估计两帧之间的运动;
      • 改进的ICP法:优化状态转移矩阵。
    • Endres 2012 改进:

      • 使用General Graph Optimization (g2o) 优化后端全局位姿图;
      • 对得到的点云进行体素化,构建三维网格图。
  • 优缺点:

    • 优点:

      • 直接获取图像点的深度信息,从而减少计算量;
      • 可以建立稠密的地图,使用红外结构光或飞行时间来测量深度,确保深度数据独立于纹理。
    • 缺点:

      • 测量距离短;
      • 受日光影响大,不能用于大型户外环境。
    • 对比 Lidar SLAM 优缺点

      • 优点:

        • 精度高;
        • 技术成熟;
        • 所构建的地图可直接用于路径规划。
      • 缺点:

        • 探测范围有限;
        • 无法获取语义信息。

5 发展趋势

5.1 多传感器融合

  • MSCKF: Mourikis 2008 提出的,基于EKF方法,对 monocular vision 和 IMU 进行实时整合的方法
  • OKVIS: Leutenegger 2013 提出的,基于关键帧和IMU融合,使用全概率的方式,将IMU的误差融合到roadmap的重投影误差中去,,形成了一个联合的非线性优化误差函数,联合优化相机的pose和3D map点。
  • IMU Pre-integration: Forster 2015,通过 Pre-integration 选择的关键帧序列之间的inertial measurement,降低计算的复杂度。
  • V-LOAM: Zhang J, Singh S. 2017, 联合使用vision传感器和 laser radar(激光雷达)。

5.2 深度学习在SLAM上的应用

  • 应用领域:

    • inter-frame 评估
    • 闭环检测
  • 一些探索

    • Konda 2015:使用end-to-end的深度神经网络结构,预测相机速度和方向的改变
    • Costante 2015:利用卷积神经网络,学习图像数据的最优特征表示,进行visual odometry (视觉测量) 估计

      • 该方法对运动模糊图像,和光照变化,具有鲁棒性
    • Hou Y, Zhang H,2015: 利用caffe框架下的AlexNet模型,进行特征提取

      • 提高了提取速度和鲁棒性
    • Arandjelovic R 2017:提出了一种端到端 scene recognition(场景识别)算法
    • Lecun Y. 2016:提出了一种基于深度学习的,stereo matching(立体匹配)方法
    • Costante G,2015:利用卷积神经网络,学习最佳视觉特征,和视觉测量的最优估计
    • Kendall A, 2015:提出了一种利用贝叶斯卷积神经网络,从单色图像中计算相机六自由度姿态,及其不确定性的重定位系统
    • Anand A,2013:在语义SLAM上,构造带有object labels(对象标签)的map。

5.3 动态的场景的探索

  • Saarinen J P, 2013 ,提出三维正态分布转换占有地图(3D Normal Distributions Transform Occupancy Maps)

5.4 多机器人协作

  • Zou D, Tan P. 2013,CoSLAM: Collaborative Visual SLAM in Dynamic Environments

6 经典文献

  • [14] Wang L J, Chen J B, Huan Y U, et al. An Overview of RGB-D SLAM[J]. Navigation Positioning & Timing, 2017
  • [15]QUAN Meixiang, PIAO Sonhao, LI Guo. An overview of visual SLAM [J]. CAAI transactions on intelligent systems, 2016, 11(6):768-776.
  • [16]Liu H, Zhang G, Bao H. A Survey of Monocular Simultaneous Localization and Mapping[J]. Journal of Computer-Aided Design &Computer Graphics, 2016.

发表评论

表情:
评论列表 (有 0 条评论,123人围观)

还没有评论,来说两句吧...

相关阅读