Gracias a una técnica desarrollada por investigadores de la Universidad Estatal de Carolina del Norte, algún día los vehículos autónomos podrían circular mucho mejor por las carreteras.
La técnica permite a los programas de inteligencia artificial mapear con mayor precisión espacios tridimensionales utilizando imágenes bidimensionales.
“La mayoría de los vehículos autónomos utilizan potentes programas de IA llamados transformadores de visión para tomar imágenes 2D de múltiples cámaras y crear una representación del espacio 3D alrededor del vehículo“, dice Tianfu Wu, profesor asociado de ingeniería eléctrica e informática en la Universidad Estatal de Carolina del Norte y autor correspondiente de un artículo sobre la nueva técnica.
“Sin embargo, aunque cada uno de estos programas de IA adopta un enfoque diferente, todavía hay mucho margen de mejora”.
La nueva técnica desarrollada por Wu y sus colaboradores tiene el potencial de mejorarlos sustancialmente a todos.
“Nuestra técnica, llamada Contextualización Atenta Multivista (MvACon), es un complemento plug-and-play que se puede utilizar junto con estas IA de transformadores de visión existentes para mejorar su capacidad de mapear espacios 3D“, dice Wu.
“Los transformadores de visión no obtienen datos adicionales de sus cámaras, simplemente pueden hacer un mejor uso de los datos”.
El equipo de investigación probó el rendimiento de MvACon con tres transformadores de visión líderes actualmente en el mercado, todos los cuales dependen de un conjunto de seis cámaras para recopilar las imágenes 2D que transforman.
MvACon mejoró significativamente el rendimiento de los tres transformadores de visión.
“El rendimiento mejoró particularmente en lo que respecta a la localización de objetos, así como a la velocidad y orientación de esos objetos”, dice Wu.
Fuente: CVF