1 Star 5 Fork 7

飞行器智能感知与控制 / research_semantic_localization

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

基于语义地图的集群无人机自主定位

1. 研究目标

人类的感知没有精确计算自己所在场景的位置信息,仅仅通过场景的相似性来进行定位,既通过目前看到的场景和之前走过的那个场景相似从而完成定位。因此通过深度学习来对场景进行相似性判断,并和地图库中的场景进行比对,可以模拟人的认知过程,从而实现基于视觉(非几何计算)的定位。

主要的研究目标有:

  1. 单张图像的相似性判断已经比较多,而序列化的图像的场景相似性判断还没有。研究如何将多张图像所拍摄的场景进行建模,可以构建图,然后在地图(图网络)上进行子图匹配,找到最优的匹配点。

  2. 如何更好的生成场景中物体的特征,可以NetVLAD或参考《Image Matching Based on Deep Feature and Spatial Correlation Graph》中的FE-Net。

  3. 如何构建图卷积神经网络(Graph Convolutional Networks)来计算相似性。

  4. 如何将所经过的场景提取特征并保存到一个图中,从而完成语义地图的构建。

2. 主要思路

研究思路:

  1. 先通读一下主要的参考文献,建立对所研究问题的基本认识,了解基本的方法等。
  2. 找一些代码运行一下,建立直觉的认识,并熟悉数据集。
  3. 可以从基本的深度学习提取特征开始,然后再深入到图卷积神经网络。

具体的研究方法(需要尝试):

  1. 使用EdgeBox或者其他方法找到感兴趣的区域,然后提取对象的深度学习特征
  2. 研究Siamese网络,提高特征的区分能力 (可以参考《Image Matching Based on Deep Feature and Spatial Correlation Graph》中的FE-Net)
  3. 研究Graph Convolutional Networks,如何提取网络节点的特征,并做图匹配等。

3. 关键技术

1.匹配精度,用来衡量图片匹配的精度。 2.Precision-Recall 曲线,用来衡量检索相关地点的图片的相关性。 3.内存使用量、算法复杂度,用来衡量内存使用的效率,以及算法的性能。 4.针对先前工作存在的问题所做出的改善,包括提高视觉上相似但不是同一地点的错误匹配、场景建模的性能、子图匹配等。 5.网络设计的合理性和损失函数设计的合理性。

4. 研究计划

第 1 周~第 2 周 课程设计

第 3 周~第 4 周 撰写课程设计报告

第 5 周 查阅与课题有关的文献资料,撰写开题报告和任务书

第 6 周~第 7 周 根据要求,分析制定设计方案,划分程序基本功能模块

第 8 周~第11周 研究视觉算法、深度学习网络设计、程序构成等

第12周~第13周 撰写毕业论文

第14周~第15周 准备毕业答辩

5.0 参考资料

5.1 VLAD/NetVLAD

5.2 特征提取

  • Place Recognition with ConvNet Landmarks: Viewpoint-Robust, Condition-Robust, Training-Free

  • 2020 Visual search over billions of aerial and satellite images

5.3 网络方法

  • Image Matching Based on Deep Feature and Spatial Correlation Graph
  • Location Graphs for Visual Place Recognition
  • Learning Convolutional Neural Networks for Graphs
  • Robust Visual Semi-Semantic Loop Closure Detection by a Covisibility Graph and CNN Features
  • Siamese Network

5.4 图神经网络

  • Learning Convolutional Neural Networks for Graphs
  • Image Matching Based on Deep Feature and Spatial Correlation Graph

5.5 多视角的检索

5.6 索引方法

  • Tree-based indexing for real-time ConvNet landmark-based visual place recognition
  • 2020 Visual search over billions of aerial and satellite images

5.7 Codes

5.8 Dataset

空文件

简介

语义定位的研究资料 展开 收起
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
1
https://gitee.com/pi-lab/research_semantic_localization.git
git@gitee.com:pi-lab/research_semantic_localization.git
pi-lab
research_semantic_localization
research_semantic_localization
master

搜索帮助