¿Cómo puede la IA hacer frente a los cambios de categoría?

El mundo real presenta muchos desafíos para las misiones de IA. Uno de esos desafíos es el requisito de que las máquinas puedan reconocer y aprender rápidamente nuevos objetos que no han visto antes. Una IA robusta a los cambios será de gran utilidad para adaptarse rápidamente a una realidad dinámica, ya sea un robot que reconoce nuevos productos en una tienda de comestibles o un automóvil autónomo que interactúa con nuevas señales de tráfico u objetos a su alrededor.

Investigadores de la Universidad de Bar-Ilan han descubierto una nueva ley universal que detalla cómo las redes neuronales artificiales manejan un número cada vez mayor de categorías para la identificación. Esta ley demuestra cómo la tasa de error de identificación de dichas redes aumenta con el número de objetos reconocibles requeridos.

Se descubrió que esta ley gobierna tanto las arquitecturas de redes neuronales superficiales como las profundas, lo que indica que las redes superficiales, similares a la del cerebro, pueden imitar la funcionalidad de las más profundas. Una arquitectura ancha y poco profunda puede funcionar tan bien como una estrecha y profunda, al igual que un edificio ancho y de poca altura puede albergar el mismo número de habitantes que un rascacielos estrecho.

La nueva ley, conocida como ley de escalamiento, fue revelada en un estudio publicado hoy en Physica A por un equipo de investigadores dirigido por el profesor Ido Kanter del Departamento de Física de la Universidad de Bar-Ilan y el Centro Multidisciplinario de Investigación del Cerebro de Gonda (Goldschmied).

Ella Koresh, estudiante de pregrado y colaboradora clave de la investigación, destaca las implicaciones prácticas de este hallazgo. «Este es un avance significativo porque uno de los aspectos más críticos del aprendizaje profundo es la latencia, el tiempo que tarda la red en procesar e identificar un objeto. A medida que las redes se vuelven más profundas, la latencia aumenta, lo que provoca retrasos en la respuesta del modelo, mientras que las redes poco profundas inspiradas en el cerebro tienen una latencia más baja y una respuesta más rápida», explica.

La reducción de la latencia de los sistemas de IA tiene profundas implicaciones en los procesos de toma de decisiones en tiempo real. Además, la ley de escalamiento introducida en esta investigación es vital para escenarios de aprendizaje donde el número de etiquetas es dinámico.

Un video que profundiza en esta investigación se puede ver aquí.