Motor neuronal de Inteligencia Artificial de Microsoft para reconocimiento de imágenes

Motor neural de Inteligencia Artificial de Microsoft para reconocimiento de imágenes

Comparta este Artículo en:

Aunque muchos de nosotros todavía confíamos en los motores de búsqueda como Google para proporcionarnos respuestas a una amplia gama de cuestiones, Microsoft Research acaba de dar una mirada a un futuro en el que las redes neuronales ofrecen el tipo de respuestas de reconocimiento visual que antes solo confiábamos en que los humanos puedieran proporcionar.

El vicepresidente ejecutivo de Microsoft Research de la tecnología y la investigación, Harry Shum, mostró un poco de ese poder de computación a través de un sistema de inteligencia artificial que reconoce con éxito varias razas de perros con solo una fotografía.

El sistema se llama Proyecto Adam, y tomó más de 18 meses de trabajo para crear la red neuronal, que cuenta con más de dos mil millones de conexiones, un sistema que trata de imitar la forma jerárquica en la que los procesos del cerebro humano identifican la información visual.

Analizando más de 14 millones de imágenes tomadas de IMAGEnet, una base de datos de búsqueda de imágenes elaborada por la Universidad de Stanford, la Universidad de Princeton y la Universidad de Stony Brook, Proyecto Adam utiliza su arquitectura de red neural profunda (DNN) para identificar con precisión los objetos que aparecen en las fotos.

Del mismo modo, al preguntársele a Proyecto Adam qué raza de perro se estaba mostrando cuando, en realidad, se le mostraba una foto de un ser humano, el sistema era capaz de notar la diferencia entre un humano y un perro, declarando, a través de la interfase Cortana: “creo que esto no es un perro.”

“Imagínese poder ayudar a los ciegos, usando un teléfono celular en una escena para que la describa para ellos”, dijo el líder del equipo de Trishul Chilimbi, indicando cómo este sistema podría llegar a ser de utilidad para los usuarios finales.

“Podríamos hacer cosas como tomar una fotografía de los alimentos que comemos y hacer que nos proporcione información nutricional. Podemos usar eso para tomar decisiones más inteligentes.”

El equipo afirma que Proyecto Adam es 50 veces más rápido y dos veces más preciso que el sistema de reconocimiento de imágenes de red neural impulsada por 16.000 computadoras que Google introdujo hace un par de años.

Chilimbi cree que el sistema es mejor que la competencia debido a la forma única en la que se encarga de que los datos sean procesados ​​a través de sus servidores.

“Una de las innovaciones fue hacer que el sistema sea asíncrono, y que no fuese sincrónico de ninguna manera”, dijo Chilimbi.

Asincronía es el proceso que divide los datos en fragmentos discretos para tratamiento individual y no en la manera típicamente sincrónica en la que algunos algoritmos fundamentales de entrenamiento en aprendizaje de máquinas operan.

El equipo del proyecto Adam también trabaja en el mismo tipo de red neural de reconocimiento para texto y música.

Pero tambien están interesados ​​en la búsqueda de aprendizaje multimodal donde se aprende en conjunto en todas estas modalidades.

Por ejemplo, si nunca ha visto la Estatua de la Libertad antes, pero alguien se la ha descrito, entonces puede aún reconocerla la primera vez que la vea gracias a la descripción textual.

Fuente: Mashable

 

Print Friendly, PDF & Email

Artículos relacionados: