Обычно нам нужны фотометрические измерения из другого положения в мире, чтобы сформировать геометрическое представление о мире (также известное как карта глубины). Для одного изображения невозможно измерить геометрию, но можно сделать вывод о глубине на основе предварительного понимания.
Один из способов того, чтобы одно изображение работало, — это использовать метод, основанный на глубоком обучении, для определения глубины. Обычно все подходы, основанные на глубоком обучении, основаны на python, поэтому, если вы знакомы только с python, вам следует выбрать именно этот подход. Если изображение достаточно маленькое, я думаю, что это возможно для производительности в реальном времени. Есть много таких работ с использованием CAFFE, TF, TORCH и т. д., вы можете поискать на git hub для получения дополнительной информации. Тот, который я разместил здесь, - это то, что я использовал недавно
![введите здесь описание изображения](https://i.stack.imgur.com/afISN.png)
ссылка: Godard, Clément, et al. Копаемся в самоконтролируемой монокулярной оценке глубины. Материалы международной конференции IEEE по компьютерному зрению. 2019.
Исходный код: https://github.com/nianticlabs/monodepth2
Другой способ — использовать видео с большим полем зрения для SLAM на основе одной камеры. У этого есть различные ограничения, такие как потребность в хороших функциях, большом поле зрения, замедленном движении и т. д. Вы можете найти многие из этих работ, такие как DTAM, LSDSLAM, DSO и т. д. Есть несколько других пакетов от HKUST или ETH, которые выполняют отображение с учетом положения (например, если у вас есть GPS/компас), некоторые из известных имен — REMODE+SVO open_quadtree_mapping и т. д.
Типичным примером SLAM на основе одной камеры может быть LSDSLAM. Это SLAM в реальном времени.
Этот реализован на основе ROS-C++, я помню, что они публикуют изображение глубины. И вы можете написать узел python для прямой подписки на глубину или на глобальное оптимизированное облако точек и спроецировать его на карту глубины под любым углом обзора.
![введите здесь описание изображения](https://i.stack.imgur.com/3tPqV.jpg)
ссылка: Энгель, Якоб, Томас Шёпс и Даниэль Кремерс. LSD-SLAM: Крупномасштабный прямой монокулярный SLAM. Европейская конференция по компьютерному зрению. Спрингер, Чам, 2014.
исходный код: https://github.com/tum-vision/lsd_slam
person
Dr Yuan Shenghai
schedule
04.11.2020