If you are like me, you are probably fascinated by the idea of SLAM and since you are here reading Perception ML articles, you are probably even more excited about Visual SLAM. Along my path to become a better engineer, I have been doing some self-study for learning Visual SLAM.
Al mismo tiempo, no es exactamente un tema fácil para principiantes, y por eso no hay muchos recursos para estudiarlo. Sin embargo, hay un libro gratis que la mayoridad de gente estudiando SLAM visual recomienden. Se llama "Introduction to Visual SLAM" y se puede leerlo gratis por el github repositorydel autor. Además, el libro cobra una gran cantidad de temas utiles y también contiene secciones de código en C++ que se puede usar para entender el contenido mejor. Lamentablemente, solamente existen versiones en ingles y chino, pero espero que les pueda ayudar en sus estudios.
Tiene 13 capítulos separado en las siguientes temas:
Parte 1
- Introduction to Visual SLAM
- 3D Rigid Body Motion
- Lie Group and Lie Algebra
- Cameras and Images
- Non-linear Optimization
Part 2
- Visual Odometry: Part 1
- Visual Odometry: Part 2
- Filters and Optimization Approaches: Part 1
- Filters and Optimization Approaches: Part 2
- Loop Closure
- Dense Reconstruction
- Practice: Stereo Visual Odometry
- Discussions and Outlook
This touches on a lot of the core knowledge necessary for doing Visual SLAM, but I want to emphasize the word “touches” here. This book makes it a point of keeping things simple by primarily introducing the parts of each topic directly related to Visual SLAM. This is great because you don’t spend forever covering math that isn’t directly related to what you want to do. On the other hand, this can also be problematic because sometimes you will lack some knowledge and intuition that could help you understand the topics better.
Como Recomiendo Usar Este Libro
Mientras leo este libro, un problema que me ocurre a veces es no tener bastante conocimientos previos. Es un problema porque típicamente paso sobre las partes que no entiendo y me hace fallar conceptos importantes.
En lugar de pasar los partes que no entendés, recomiendo pasar un poco mas tiempo en cada tema. Para cada tema hay un montón de recursos gratis que podes ver o leer para improver tu conocimiento de los temas en este libro. Además, en el futuro espero introducir unos en este sitio también.
Otra cosa que debes hacer es preguntar a alguien que sabe los temas bien. Claro que eso no es siempre posible. Yo también no tengo un ingeniero de SLAM que puedo preguntar a cualquier tiempo. En este caso, te recomiendo preguntar ChatGPT sobre las cosas que no entendés o usarlo para confirmar las cosas que crees que entendés. También ChatGPT puede hacerte un quiz si querés, pero recuérdate confirmar que la información es verdadero. Ya sabemos que ChatGPT no es perfecto.
Anyways, here are a few useful resources I found for some of the individual concepts. I’ll add more as I find them.
Recursos Utiles Adicionales
Lie Group and Lie Algebra: Tom Drummond’s slides on Lie Groups and Lie Algebra
Cameras and Images: First Principles of Computer Vision
Kalman Filters: kalmanfilters.net
Conclusión
Learning Visual SLAM is a large task. Introduction to Visual SLAM is a great starting point, but make sure to look out for supporting resources to fill in the blanks where you need them. Most of the resources are from famous universities like Columbia, Stanford etc, so you can even think of it as giving yourself a top class education! Good luck with your studies, and feel free to drop me a message if you have any questions.
Click acá to read other Computer Vision articles.
Deja un comentario
Lo siento, tenés que estar conectado para publicar un comentario.
Connect with
Login with Linkedin