← Volver al mapa

Inferencia activa y agentes artificiales

Karl Friston, Thomas Parr
ÉpocaSiglo XXI · 2015
RegiónEuropa · Reino Unido
DisciplinaComputación/IA

Explicación

La inferencia activa (active inference) es el marco teórico desarrollado principalmente por Karl Friston, del University College London, desde los 2000. Aunque se originó como teoría neurocientífica (para entender el cerebro), se ha extendido como principio general de agencia aplicable tanto a sistemas biológicos como a agentes artificiales. Su base matemática es el «principio de energía libre» (Free Energy Principle), que Friston propone como principio organizador universal de los sistemas auto-organizados.

La idea central: todo sistema auto-organizado debe mantener sus estados dentro de un rango limitado (homeostasis, viabilidad). Esto requiere minimizar una cantidad matemática llamada «energía libre variacional», que es una cota superior de la «sorpresa» (improbabilidad de las observaciones dado el modelo interno del agente). Minimizar energía libre equivale a mejorar el modelo interno del mundo para que las observaciones sean menos sorprendentes.

Hay dos modos de minimizar energía libre: (1) percepción: actualizar el modelo interno para que explique mejor las observaciones (inferencia perceptual tradicional); (2) acción: cambiar el mundo para que coincida con las predicciones del modelo (inferencia activa propiamente). Así, percepción y acción son las dos caras de un mismo proceso de minimización de energía libre. El cerebro/agente es una máquina que activamente busca confirmaciones de sus modelos mediante acción dirigida.

Este marco explica muchas cosas: por qué el cerebro hace predicciones (para minimizar sorpresa), por qué exploramos (reducir incertidumbre mejora modelo), por qué tenemos curiosidad, por qué evitamos estados catastróficos, por qué la atención se dirige donde las predicciones son más inciertas. Puede formularse en diversos niveles: cuántico-termodinámico, biofísico, neuronal, cognitivo, social.

En IA, la inferencia activa ofrece un marco para diseñar agentes con múltiples ventajas sobre el aprendizaje por refuerzo tradicional: combina percepción, acción y aprendizaje en un principio unificado; promueve exploración intrínseca (curiosidad, reducción de incertidumbre) sin necesidad de recompensas externas elaboradas; favorece robustez y generalización; permite planificación prospectiva («imaginar» consecuencias de acciones para minimizar energía libre esperada futura). Iniciativas como VERSES Research Lab trabajan en IA basada en active inference.

Para la teoría de la consciencia, la inferencia activa tiene implicaciones interesantes. Friston ha conectado el marco con cuestiones de self y consciencia: el self sería un modelo jerárquico que minimiza energía libre incluyendo predicciones sobre el propio cuerpo e interacciones; la consciencia podría estar asociada a ciertos niveles jerárquicos altos que mantienen «global precision weighting» sobre el sistema. Autores como Anil Seth, Thomas Metzinger han articulado teorías de la consciencia basadas en inferencia activa. Aunque el marco no resuelve el hard problem por sí solo, ofrece vocabulario matemáticamente riguroso para muchas cuestiones sobre percepción, acción, autocontrol, y promete ser una de las bases para una ciencia unificada de mentes biológicas y artificiales. Su influencia en los próximos años será probablemente creciente.

Puntos fuertes

  • Marco matemático unificado para percepción, acción y aprendizaje.
  • Integra exploración y explotación en un único principio.
  • Interpretabilidad superior a RL clásico.
  • Conexión natural con neurociencia, fenomenología y enactivismo.
  • Aplicable a robótica y IA embodiment-first.

Principales críticas

  • Costes computacionales altos en implementaciones plenas.
  • Versión amplia del FEP acusada de inefalsificable.
  • Interpretación fenoménica del self como modelo sigue abierta.
  • Distancia práctica con frameworks de deep learning mainstream.

Conexiones con otras teorías