Categorías: Tecnología

Software de reconocimiento de imágenes que describe escenas completas

Comparta este Artículo en:

El reconocimiento de imágenes ya es bueno, pero se está haciendo mucho, mucho mejor. Una investigación entre Google y la Universidad de Stanford está produciendo software que describe cada vez más toda la escena retratada en una imagen, no sólo los objetos individuales.

Los algoritmos escritos por el equipo intentan explicar lo que está sucediendo en las imágenes, en un lenguaje que en realidad tenga sentido.

Así que entrega frases como “un grupo de jóvenes que juegan frisbee” o “una persona que monta una motocicleta en un camino de tierra.”

Lo hace utilizando dos redes neuronales: una se ocupa del reconocimiento de imágenes, la otra del procesamiento del lenguaje natural.

El sistema utiliza aprendizaje de computador, por lo que se ha alimentado con una serie de imágenes con subtítulos y aprende poco a poco cómo las oraciones se refieren a lo que muestra la imagen.

El software resultante es, según el equipo, alrededor de dos veces más preciso que  cualquier otro software de reconocimiento de imágenes.

No es, sin embargo, perfecto. Compruebe, por ejemplo, la imagen de arriba: a menudo comete pequeños errores y, de vez en cuando, se equivoca completamente.

Pero no son los únicos trabajando en reconocimiento de imágenes.

Otro sistema usa datos de pixeles en imágenes, y potencialmente en video, en vez de solo texto, para localizar documentos.

Aprende a reconocer los pixeles asociados con una frase de búsqueda mediante el estudio de los resultados de motores de búsqueda de imágenes basados en texto.
Impotence or erectile dysfunction is the inability to maintain erection which viagra from india online is the most important in men for having a pleasurable experience in lovemaking. So each time she was single and started seeking a new relationship, sub-consciously her viagra samples brain was drawn to the familiar, “known” territory. These days, there is actually a large number of wholesale generic cialis substances contained in drugs that are regarded to be harmful for you. generic levitra online http://opacc.cv/opacc/wp-content/uploads/2010/08/documentos_contabilistas_Modelo%2039.pdf Counselling is the best solution for the psychological condition- Change in appetite Lacking of nutrition Exposure to chemicals Alcohols and cigarette Increase in body-weight Problems in the glands Ovulation disorders Chronic health condition Anxiety disorder Lack of exercise Sleeping problems Symptoms of male hormonal inequity- Hormonal imbalance is quite common, but it turns into a big problem but the website is such very.
El conocimiento obtenido de estos resultados puede ser entonces aplicado a otras fotos sin etiquetas o descripciones, produciendo resultados de búsqueda de documentos más precisos.

Sergio Rodríguez Vaamonde de Tecnalia, en Zamudio, Bizkaia, País Vasco, España, Lorenzo Torresani, del Dartmouth College en Hanover, New Hampshire, Estados Unidos, y Andrew Fitzgibbon, de Microsoft Research Cambridge en el Reino Unido, diseñaron y probaron este sistema que extrae información semántica de los pixeles de las fotos en las páginas Web.

Esta información se utiliza para enriquecer la descripción de la página HTML usada por los motores de búsqueda para la obtención de documentos.

Los investigadores probaron su metodología usando más de 600 solicitudes de búsqueda en una base de datos de 50 millones de páginas web.

Seleccionaron el motor de búsqueda para obtención de texto con el mejor rendimiento y lo modificaron para que hiciera uso de la información semántica adicional extraída por su método a partir de las imágenes de las páginas web.

Constataron que esto producía una mejora del 30 por ciento en la precisión, en comparación con el motor de búsqueda original basado exclusivamente en texto.

Fuentes:

Gizmodo

Noticias de la CIencia

Editor PDM

Entradas recientes

NVIDIA le permite crear su propio ChatGPT y ejecutarlo desde el PC

NVIDIA ha lanzado ‘Chat with RTX’, una app que permite crear un chatbot al estilo…

18 hours hace

Desarrollan pegatina de ultrasonido que ayuda a identificar signos de enfermedad

Esta pegatina del tamaño de un sello postal, desarrollada en el MIT, se puede llevar…

18 hours hace

Control del tráfico urbano con inteligencia artificial

Históricamente, las ciudades han sido puntos álgidos de tránsito, demoras y congestión vehicular. (more…)

18 hours hace

Mano protésica que transmite la sensación táctil de temperatura

Gracias a una mano protésica dotada con un sensor que proporciona información térmica de manera…

18 hours hace

Crean vasos sanguíneos mediante impresión 3D de hielo

Mucha gente en el mundo necesita trasplantes de órganos; solo en Estados Unidos la cifra…

18 hours hace

Fabrican en China las palas de turbina eólica terrestre más grandes del mundo

Una empresa china está construyendo turbinas eólicas con palas de 131 metros de largo, las…

2 days hace
Click to listen highlighted text!