La clasificación de imágenes es una de las tareas más comunes de la IA, en la que se requiere que un sistema reconozca un objeto a partir de una imagen dada.
Sin embargo, la vida real requiere que reconozcamos no un solo objeto independiente, sino varios objetos que aparecen juntos en una imagen dada.
Esta realidad plantea la pregunta: ¿cuál es la mejor estrategia para abordar la clasificación de múltiples objetos?
El enfoque común es detectar cada objeto individualmente y luego clasificarlos.
Pero una nueva investigación desafía este enfoque habitual para las tareas de clasificación de múltiples objetos.
Investigadores de la Universidad Bar-Ilan en Israel muestran cómo la clasificación de objetos en conjunto, a través de un proceso conocido como Clasificación de múltiples etiquetas (MLC), puede superar la clasificación común basada en la detección.
“La detección requiere reconocer cada objeto individualmente y luego realizar la clasificación de cada uno de estos objetos individualmente”, dijo el profesor Ido Kanter, del Departamento de Física de Bar-Ilan y del Centro de Investigación Cerebral Multidisciplinario Gonda (Goldschmied), quien dirigió la investigación.
“Incluso suponiendo una identificación perfecta, la red necesitará clasificar correctamente cada objeto de forma independiente, mientras que con MLC las combinaciones de objetos se clasifican juntas y no por separado”.
“Este nuevo método permite a la red aprender correlaciones entre objetos que aparecen juntos, lo que los hace más reconocibles“, dijo la estudiante de doctorado Ronit Gross, una colaboradora clave de esta investigación.
“Aprender combinaciones, en lugar de solo objetos individuales, puede producir mejores resultados cuando se requiere que la red reconozca múltiples objetos.
Esta nueva comprensión puede allanar el camino para la IA que puede reconocer mejor las combinaciones de objetos en una sola imagen”.
Estos resultados cuestionan la comprensión actual de cómo se reconocen múltiples objetos y pueden mejorar las aplicaciones de la vida real, como los vehículos autónomos que requieren analizar muchos objetos presentados juntos en un momento dado.
Fuente: ScienceDirect