Categorías: Tecnología

Robot chef con inteligencia artificial aprende cómo hacer ensaladas viendo un video

Comparta este Artículo en:

Investigadores de la Universidad de Cambridge han construido un robot impulsado por inteligencia artificial que aprendió a hacer ocho recetas de ensaladas al ver un video de un ser humano haciéndolas.

Grzegorz Sochacki, candidato a doctorado, y sus colegas filmaron ocho recetas de ensaladas simples y luego usaron una red neuronal pública para entrenar a su robot chef.

Esta red neuronal ya estaba programada para identificar una variedad de objetos diferentes, incluidas las frutas y verduras utilizadas en las recetas de ensaladas.

Luego, el robot analizó cada cuadro de video utilizando técnicas de visión por computadora e identificó varios objetos, así como características como un cuchillo o ingredientes.

La identificación correcta de los ingredientes y las acciones del chef humano permitieron al robot determinar cuál de las recetas se estaba preparando.

“Es sorprendente la cantidad de matices que el robot pudo detectar.

Estas recetas no son complejas: son esencialmente frutas y verduras picadas, pero fue realmente efectivo al reconocer, por ejemplo, que dos manzanas picadas y dos zanahorias picadas es la misma receta que tres manzanas picadas y tres zanahorias picadas”, dijo Grzegorz Sochacki, candidato a doctorado del Departamento de Ingeniería de Cambridge, primer autor del artículo.

Fuente: University of Cambridge

Editor PDM

Entradas recientes

Mano robótica capaz de manipular objetos

Recientemente, Sanctuary AI presentó su mano robótica que ahora es capaz de manipular objetos. (more…)

2 days hace

Robots atraviesan entornos complejos sin sensores adicionales ni entrenamiento previo en terrenos difíciles

Especialistas en robótica de la Universidad de Leeds y el University College de Londres han…

2 days hace

Rompiendo barreras: IA para interpretar el lenguaje de señas americano en tiempo real

El lenguaje de señas es un medio de comunicación sofisticado y vital para las personas…

2 days hace

Dispositivo ayuda a personas con discapacidad visual a realizar tareas de localización tan bien como las personas videntes

Según un nuevo estudio dirigido por el Imperial College, una tecnología de navegación que utiliza…

2 days hace

Google lanza una versión de Gemini 2.0 capaz de razonar

Gemini 2.0 Flash Thinking Experimental es una nueva versión de la IA de Google que…

2 days hace

El siguiente paso de la computación cuántica: un nuevo algoritmo potencia la multitarea

Las computadoras cuánticas difieren fundamentalmente de las clásicas. En lugar de utilizar bits (0 y…

3 days hace
Click to listen highlighted text!