EA demuestra en vídeo el aprendizaje de una IA entrenada sobre Battlefield 1

David Rodriguez
EA ha mostrado por primera vez los resultados del trabajo de su división SEED, un grupo de trabajo dentro de la compañía que explora las posibilidades del futuro del entretenimiento interactivo en aspectos relacionados con la inteligencia artificial.

El grupo dirigido por Magnus Nordin fue creado con el objetivo de fijar metas para apartados de los videojuegos que avanzan a un ritmo menos obvio que los gráficos o la profundidad de contenido. En particular, SEED busca vías para que el comportamiento de la IA trascienda los habituales límites de la programación de respuesta a eventos actual.

Nordin explica que comenzaron a trabajar en este proyecto después de ver la demostración de la red neuronal de Google Deepmind en la que aprendía a jugar a clásicos arcade de Atari sin que previamente se le proporcionase contexto alguno. Desde entonces esta avanzada IA ha ampliado sus capacidades hacia títulos mucho más complejos como StarCraft II y emplea similares patrones de aprendizaje en base a información visual para entrenar algoritmos de conducción autónoma sobre juegos como GTA V.

La reciente demostración de la más sencilla red neuronal MarI/O aprendiendo a jugar a Super Mario World incluye una accesible explicación del concepto de "evolución neuronal"

En el caso de EA y SEED, y debido a la experiencia de Nordin con el equipo de DICE, el proyecto se enfocó a que una serie de "agentes" de la IA aprendiesen a jugar a un título de disparos en primera persona de cero (sin la programación habitual de un bot). Después de probar su teoría sobre un motor simplificado, el equipo comenzó a trabajar con el estudio responsable de Battlefield 1 para trasladar sus agentes al desarrollo de una partida normal.

El mecanismo de aprendizaje se basa en la observación y análisis de un vídeo de 30 minutos de jugadores reales y la posterior práctica sobre el juego en varias instancias paralelas durante el equivalente a 300 horas. Como únicas concesiones con respecto a una partida real, el mapeado empleado incluye un conjunto de cubos que representan recargas de salud y munición.


Después de ejecutar su entrenamiento, los agentes fueron capaces de buscar y reconocer objetivos en el mapa (manejados también por la IA), perseguirlos o descartarlos en función de sus posibilidades percibidas de abatirlos y salvar sin problemas los obstáculos del terreno. El mecanismo reconoce el contador de bajas como un incentivo, por lo que trabaja continuamente hacia su incremento.

En su estado actual de aprendizaje, los agentes giran sobre sí mismos al no detectar objetivos porque todavía no han desarrollado la capacidad de explorar el escenario de forma autónoma o de buscar una posición privilegiada. Sin embargo, desde SEED creen que en vista de sus progresos pronto podrán realizar tareas más complejas e incluso trabajar en equipo.

La aplicación práctica de la tecnología a día de hoy se limita al perfeccionamiento (y probable abaratamiento) de los mecanismos de control de calidad del juego, pero Nordin cree que pronto podrán emplearse redes neuronales similares para dar mayor autonomía a PNJs y enemigos. En cuanto al enfrentamiento contra humanos, señala que en las pruebas realizadas algunos usuarios llegaron a confundir a los agentes con otros jugadores, pero que no espera que la tecnología llegue al nivel de un jugador profesional al menos en los próximos dos años.

El investigador señala que en todo caso este no es el objetivo principal del proyecto, dado que aplastar al jugador con una IA superior no encaja con el propósito último de SEED: hacer que los juegos sean más inmersivos y divertidos.