Inteligencia artificial de Google permite a los celulares detectar objetos 3D en tiempo real

INTELIGENCIA ARTIFICIAL DE GOOGLE PERMITE A LOS CELULARES DETECTAR OBJETOS 3D EN TIEMPO REAL

Comparta este Artículo en:

Uno de los puntos capitales en la investigación de Google es el análisis de imágenes.

Las sugerencias automáticas de Google Fotos o las capacidades de Google Lens son buenos ejemplos, así como la reciente noticia de que la compañía ya tiene lista su nueva capa de análisis para entender qué hay presente en cada foto.

Si vamos un poco más allá, a la detección de objetos como tal, Google también tiene algunos ases sobre la manga.

Google acaba de anunciar el lanzamiento de MediaPipe Objectron, su tecnología móvil para detección de objetos 3D en tiempo real, algo que permite al smartphone reconocer tamaño y orientación de un objeto, lo que abre varias puertas de aplicación.

MediaPipe es el marco multiplataforma de Google para crear distintas canalizaciones de procesamiento de datos.

Objetron se incluye dentro de dicho marco, como canalización móvil para detección de objetos 3D en tiempo real.

Grosso Modo, Objectron detecta objetos a través de imágenes 2D, para posteriormente estimar su orientación y tamaño a través de un modelo de aprendizaje automático entrenado en un conjunto de datos 3D.

En otras palabras, es capaz de detectar objetos 3D a partir de una sola imagen RGB.

A través de un modelo de codificador y descodificador, Google es capaz de convertir una entrada 2D en una salida 3D. Le basta con una sola imagen.

We were in a great store cialis in the uk rush to the top of the pile. If you go through viagra effects women the online services, you will just have to sign in and provide us the required information from you. Dealing with erectile dysfunction is probably one of man’s discount levitra no rx worse nightmares. But OM damages each of these chemicals and damage all the desires for sexual urge and the drive that they would wish to possess in order free prescription viagra to fully satisfy their partner.

A nivel de estructura básica, el modelo tiene una arquitectura de codificador-descodificador basada en MobileNetV2, las redes neuronales de Google para clasificación y detección visual.

Mediante dichas redes, la proyección 2D de la imagen y un algoritmo de estimación 3D, el modelo es capaz de procesar una salida en 3D de dicho objeto.

Para mitigar las posible fluctuaciones en la imagen, Google ha trabajado bajo el mismo marco de detección y seguimiento para sus objetos 2D.

Esto se traduce en algo que ya le sonará si sabe cómo trabaja Google: segmentación de imagen.

Se captura la imagen original en 2D
Se le aplican cuadros delimitadores para la posterior detección del objeto
Se detecta el objeto mediante distribución gaussiana
Se aplica la máscara de segmentación

Google destaca que el modelo es tan ligero que puede funcionar a tiempo real a 26 FPS en un móvil de gama alta, en concreto, con la Adreno 650 (la GPU del reciente Snapdragon 865).

La nueva solución ya está disponible para quien quiera probarla, con el fin de que se desarrollen nuevos casos de uso y aplicaciones.

Es relevante esta nueva propuesta, máxime teniendo en cuenta que a día de hoy hay potentes plataformas de realidad aumentada como AR Core en el caso de Google y AR Kit en lo que alude a Apple.

Videojuegos, aplicaciones, fotografía, video y demás pueden beneficiarse del reconocimiento de objetos.

Fuente: Xataca

Editor PDM

Siguiente Descubren material capaz de almacenar tanta energía como una batería y de recargarse en segundos »

Anterior « Descubrimiento accidental nos acerca a la computación cuántica que usa microchips estándar

Deja un comentario

Publicado por

Editor PDM

Etiquetas: 3Dinteligencia artificialreconocimiento de imágenes

5 years hace

Herramienta de detección de sesgos de IA para combatir la discriminación en los modelos

Los modelos de IA generativa como ChatGPT se entrenan con grandes cantidades de datos obtenidos…

14 hours hace

Tecnología

NVIDIA presenta su supercomputador compacto de IA generativa

El kit para desarrolladores NVIDIA Jetson Orin Nano Super está diseñado tanto para aficionados como…

14 hours hace

Tecnología

Google presenta una IA que genera videos 4K de hasta 2 minutos

Google ha presentado Veo 2, una IA que supera a Sora al generar videos realistas…

14 hours hace

Tecnología

Whisk, la nueva IA de Google para crear imágenes a partir de otras imágenes

La nueva IA de Google es capaz de generar diseños de cualquier tipo sin necesidad…

14 hours hace

Tecnología

El buscador con IA SearchGPT ahora es gratuito y busca competir con el de Google

Han pasado casi cinco meses desde el lanzamiento de SearchGPT. La prometedora función de búsqueda…

14 hours hace

Tecnología

Desarrollan dispositivo que fusiona funciones de detección y computación

En los últimos años, los ingenieros han intentado crear sistemas de hardware que soporten mejor…

2 days hace

Inteligencia artificial de Google permite a los celulares detectar objetos 3D en tiempo real

Artículos relacionados:

Entrada Relacionada

Entradas recientes

Herramienta de detección de sesgos de IA para combatir la discriminación en los modelos

NVIDIA presenta su supercomputador compacto de IA generativa

Google presenta una IA que genera videos 4K de hasta 2 minutos

Whisk, la nueva IA de Google para crear imágenes a partir de otras imágenes

El buscador con IA SearchGPT ahora es gratuito y busca competir con el de Google

Desarrollan dispositivo que fusiona funciones de detección y computación