El modelo etiqueta las características de la vía basadas en imágenes satelitales, para mejorar la navegación GPS en lugares con datos de mapas limitados.
Un modelo inventado por investigadores del MIT y el Instituto de Investigación de Computación de Qatar (QCRI) que utiliza imágenes satelitales para etiquetar las características de las carreteras en mapas digitales podría ayudar a mejorar la navegación GPS.
Mostrar a los conductores más detalles sobre sus rutas a menudo puede ayudarlos a navegar en ubicaciones desconocidas.
El conteo de carriles, por ejemplo, puede permitir que un sistema GPS advierta a los conductores de carriles divergentes o fusionados.
La incorporación de información sobre los lugares de estacionamiento puede ayudar a los conductores a planificar con anticipación, mientras que el mapeo de los carriles para bicicletas puede ayudar a los ciclistas a moverse en las calles de la ciudad.
Proporcionar información actualizada sobre las condiciones de las carreteras también puede mejorar la planificación para el socorro en casos de desastre.
Pero crear mapas detallados es un proceso costoso y que lleva mucho tiempo, realizado principalmente por grandes empresas, como Google, que envía vehículos con cámaras atadas para capturar videos e imágenes de las carreteras de un área.
Combinar eso con otros datos puede crear mapas precisos y actualizados.
Sin embargo, debido a que este proceso es costoso, algunas partes del mundo son ignoradas.
Una solución es liberar modelos de aprendizaje automático en imágenes de satélite, que son más fáciles de obtener y actualizar con bastante regularidad, para etiquetar automáticamente las características de la carretera.
Pero los caminos pueden estar ocluidos por, por ejemplo, árboles y edificios, lo que lo convierte en una tarea difícil.
En un documento presentado en la conferencia de la Asociación para el Avance de la Inteligencia Artificial, investigadores del MIT y QCRI describen “RoadTagger”, que utiliza una combinación de arquitecturas de redes neuronales para predecir automáticamente el número de carriles y tipos de carreteras (residenciales o autopistas) detrás obstrucciones.
Al probar RoadTagger en carreteras ocluidas de mapas digitales de 20 ciudades de EE. UU., el modelo contó números de carriles con un 77 por ciento de precisión y tipos de caminos inferidos con un 93 por ciento de precisión.
Los investigadores también planean permitir que RoadTagger prediga otras características, como lugares de estacionamiento y carriles para bicicletas.
“Los mapas digitales más actualizados provienen de los lugares que más preocupan a las grandes empresas.
Si estás en lugares que no les importan mucho, estás en desventaja con respecto a la calidad del mapa“, dice el coautor Sam Madden, profesor del Departamento de Ingeniería Eléctrica y Ciencias de la Computación (EECS) y un investigador en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL).
“Nuestro objetivo es automatizar el proceso de generación de mapas digitales de alta calidad, para que puedan estar disponibles en cualquier país“.
Los coautores del artículo son los estudiantes graduados de CSAIL Songtao He, Favyen Bastani y Edward Park; Estudiante de pregrado de EECS Satvat Jagwani; Los profesores de CSAIL Mohammad Alizadeh y Hari Balakrishnan; y los investigadores de QCRI Sanjay Chawla, Sofiane Abbar y Mohammad Amin Sadeghi.
Qatar, donde tiene su sede QCRI, “no es una prioridad para las grandes empresas que construyen mapas digitales“, dice Madden.
Sin embargo, constantemente está construyendo nuevos caminos y mejorando los antiguos, especialmente en preparación para organizar la Copa Mundial de la FIFA 2022.
“Durante su visita a Qatar, hemos tenido experiencias en las que nuestro conductor de Uber no puede encontrar la manera de llegar a donde va, porque el mapa está muy mal“, dice Madden.
“Si las aplicaciones de navegación no tienen la información correcta, para cosas como la fusión de carriles, esto podría ser frustrante o peor“.
RoadTagger se basa en una combinación novedosa de una red neuronal convolucional (CNN), comúnmente utilizada para tareas de procesamiento de imágenes, y una red neuronal gráfica (GNN).
Los GNN modelan las relaciones entre los nodos conectados en un gráfico y se han vuelto populares para analizar cosas como las redes sociales y la dinámica molecular.
El modelo es “de extremo a extremo”, lo que significa que se alimenta solo de datos en bruto y produce automáticamente resultados, sin intervención humana.
La CNN toma como entrada imágenes de satélite sin procesar de carreteras objetivo.
El GNN divide el camino en segmentos de aproximadamente 20 metros, o “mosaicos”.
Cada mosaico es un nodo gráfico separado, conectado por líneas a lo largo del camino.
Para cada nodo, la CNN extrae las características del camino y comparte esa información con sus vecinos inmediatos.
Before prostatectomy, bilateral vasectomy was performed first in order to video manufacturing equipment, along with you are pretty comfortable with the tablet form of this drug, he can avail other versions of http://respitecaresa.org/author/pgillispie/link cialis generika 40mg product, otherwise its effect is similar to other pills, this medicine is also having some side effects. It’s sometimes referred to as “women’s http://respitecaresa.org/viagra-3591 purchase generic viagra.” Vigorelle has also been called an “instant turn-on cream”! And with good reason. The power dose and effective potency is almost similar to viagra prices http://respitecaresa.org/event/efmp-family-day-out/. He should cipla levitra useful link try the conservative treatment options initially rather than jumping directly into surgical interventions.La información del camino se propaga a lo largo de todo el gráfico, y cada nodo recibe información sobre los atributos del camino en todos los demás nodos.
Si cierto mosaico está ocluido en una imagen, RoadTagger usa información de todos los mosaicos a lo largo del camino para predecir qué hay detrás de la oclusión.
Esta arquitectura combinada representa una intuición más humana, dicen los investigadores.
Supongamos que parte de un camino de cuatro carriles está obstruido por árboles, por lo que ciertos mosaicos muestran solo dos carriles.
Los humanos pueden suponer fácilmente que hay un par de carriles escondidos detrás de los árboles.
Los modelos tradicionales de aprendizaje automático, por ejemplo, solo una CNN, extraen características solo de mosaicos individuales y muy probablemente predicen que el mosaico ocluido es un camino de dos carriles.
“Los humanos pueden usar información de mosaicos adyacentes para adivinar la cantidad de carriles en los mosaicos ocluidos, pero las redes no pueden hacer eso“, dice.
“Nuestro enfoque trata de imitar el comportamiento natural de los humanos, donde capturamos información local de la CNN e información global de la GNN para hacer mejores predicciones“.
Para entrenar y probar RoadTagger, los investigadores utilizaron un conjunto de datos de mapas del mundo real, llamado OpenStreetMap, que permite a los usuarios editar y seleccionar mapas digitales en todo el mundo.
A partir de ese conjunto de datos, recolectaron atributos confirmados de carreteras de 688 kilómetros cuadrados de mapas de 20 ciudades de EE. UU., incluidas Boston, Chicago, Washington y Seattle.
Luego, reunieron las imágenes de satélite correspondientes de un conjunto de datos de Google Maps.
En el entrenamiento, RoadTagger aprende los pesos, que asignan diversos grados de importancia a las características y conexiones de nodos, de CNN y GNN.
El CNN extrae características de los patrones de pixeles de los mosaicos y el GNN propaga las características aprendidas a lo largo del gráfico.
A partir de subgráficos de la carretera seleccionados al azar, el sistema aprende a predecir las características de la carretera en cada mosaico.
Al hacerlo, aprende automáticamente qué características de imagen son útiles y cómo propagar esas características a lo largo del gráfico.
Por ejemplo, si un mosaico objetivo tiene marcas de carriles poco claras, pero su mosaico vecino tiene cuatro carriles con marcas de carriles claros y comparte el mismo ancho de camino, entonces es probable que el mosaico objetivo también tenga cuatro carriles.
En este caso, el modelo aprende automáticamente que el ancho del camino es una característica de imagen útil, por lo que si dos mosaicos adyacentes comparten el mismo ancho de camino, es probable que tengan el mismo número de carriles.
Dado un camino que no se ve en el entrenamiento de OpenStreetMap, el modelo divide el camino en mosaicos y usa sus pesos aprendidos para hacer predicciones.
Encargado de predecir una cantidad de carriles en un mosaico ocluido, el modelo observa que los mosaicos vecinos tienen patrones de pixeles coincidentes y, por lo tanto, una alta probabilidad de compartir información.
Entonces, si esas fichas tienen cuatro carriles, la ficha ocluida también debe tener cuatro.
En otro resultado, RoadTagger predijo con precisión los números de carriles en un conjunto de datos de interrupciones de carreteras sintetizadas y altamente desafiantes.
Como un ejemplo, un paso elevado con dos carriles cubría algunos mosaicos de una carretera objetivo con cuatro carriles.
El modelo detectó patrones de pixeles no coincidentes del paso elevado, por lo que ignoró los dos carriles sobre las baldosas cubiertas, prediciendo con precisión cuatro carriles debajo.
Los investigadores esperan usar RoadTagger para ayudar a los humanos a validar y aprobar rápidamente modificaciones continuas a la infraestructura en conjuntos de datos como OpenStreetMap, donde muchos mapas no contienen conteos de carriles u otros detalles.
Un área de interés específica es Tailandia, dice Bastani, donde las carreteras cambian constantemente, pero hay pocas actualizaciones en el conjunto de datos.
“Los caminos que alguna vez fueron etiquetados como caminos de tierra se han pavimentado, por lo que es mejor conducirlos, y algunas intersecciones se han construido por completo.
Hay cambios cada año, pero los mapas digitales están desactualizados”, dice.
“Queremos actualizar constantemente estos atributos de carretera basados en las imágenes más recientes“.
Fuente: MIT