Gran parte de la discusión inicial sobre la revolución de la IA generativa en los juegos se ha centrado en cómo las herramientas de IA pueden mejorar la eficiencia de los creadores de juegos, permitiendo que los juegos se produzcan más rápido y a mayor escala que antes. A la larga, creemos que la IA no solo cambiará la forma en que se crean los juegos, sino también la naturaleza misma de los juegos.
Todo el tiempo, la IA está ayudando a generar nuevas formas de juegos. Desde mazmorras generadas por procedimientos en Rogue (1980), hasta máquinas de estados finitos en Half-Life (1998) y directores de juegos de IA en Left 4 Dead (2008). Más recientemente, los avances en la tecnología de aprendizaje profundo han cambiado aún más el juego al permitir que las computadoras generen contenido nuevo en función de las indicaciones del usuario y grandes conjuntos de datos.
Todavía es pronto, pero ya estamos viendo algunas áreas interesantes de los juegos impulsados por IA, incluidos los agentes generativos, la personalización, la narración de historias de IA, los mundos dinámicos y los copilotos de IA. Si tienen éxito, estos sistemas podrían combinarse para crear juegos emergentes de IA que retengan cuadros de jugadores leales.
Agente generativo
Iniciado por SimCity de Maxis en 1989, el juego de simulación permite a los jugadores construir y administrar una ciudad virtual. Hoy en día, el juego de simulación más popular es Los Sims, donde más de 70 millones de jugadores en todo el mundo manejan personas virtuales conocidas como "sims" y les permiten seguir con su vida diaria. El diseñador Will Wright una vez describió a Los Sims como una "casa de muñecas interactiva".
La IA generativa puede avanzar en gran medida en el desarrollo de juegos de simulación al hacer que los agentes sean más realistas a través de comportamientos sociales emergentes impulsados por modelos de lenguaje extenso (LLM).
A principios de este año, un equipo de investigación de la Universidad de Stanford y Google publicaron un artículo que mostraba cómo aplicar LLM a los agentes en los juegos. Dirigido por el estudiante de doctorado Joon Sung Park, el equipo de investigación incorporó a 25 agentes similares a Sims en un mundo de sandbox de arte de píxeles cuyo comportamiento fue determinado por ChatGPT y una arquitectura que extiende LLM para usar lenguaje natural para almacenar un registro completo de la experiencia de un agente, sintetizar estos recuerdos en una reflexión de nivel superior y recuperarlos dinámicamente para planificar el comportamiento.
Estos resultados son una excelente vista previa del futuro potencial de los juegos de simulación. Comenzando con una sugerencia especificada por el usuario de que un agente desea organizar una fiesta del Día de San Valentín, los agentes distribuyen de forma independiente invitaciones a la fiesta, forman nuevas amistades, se invitan entre sí y se coordinan para llegar a tiempo a la fiesta dos días después.
Este comportamiento es posible porque los LLM están capacitados en datos de redes sociales, por lo que sus modelos incluyen los fundamentos de cómo los humanos hablan entre sí y se comportan en diversos contextos sociales. Y en entornos digitales interactivos como los juegos analógicos, estas respuestas pueden activarse para crear un comportamiento realista.
Desde la perspectiva del jugador, el resultado final es una experiencia de juego más inmersiva. Gran parte de la diversión de jugar a Los Sims o al simulador de colonias RimWorld proviene de los sucesos inesperados. Con el comportamiento de los agentes en las redes sociales, podemos ver juegos de simulación que no solo muestren la imaginación de los diseñadores de juegos, sino que también reflejen la imprevisibilidad de la sociedad humana. Ver estos sims puede proporcionar tanto entretenimiento como ver la próxima generación de The Truman Show de una manera que no es posible con la televisión o las películas preproducidas de hoy.
Los propios agentes también se pueden personalizar, basándose en nuestras aspiraciones imaginativas para un juego de "Casa de muñecas". Los jugadores pueden diseñar un agente ideal basado en ellos mismos o en personajes ficticios. "Ready Player Me" permite a los usuarios generar su propio avatar 3D al tomar una selfie e importar el avatar a más de 9000 juegos/aplicaciones. Las plataformas de personajes de IA Character.ai, InWorld y Convai pueden crear NPC personalizados con sus propias historias, personalidades y controles de comportamiento.
Con capacidades de lenguaje natural, también se ha ampliado la forma en que interactuamos con los agentes. Hoy, los desarrolladores pueden usar los modelos de texto a voz de Eleven Labs para generar voces realistas para sus agentes. Convai se asoció recientemente con Nvidia para una demostración muy publicitada en la que los jugadores podían entablar una conversación de voz natural con un NPC chef de ramen de IA, con el diálogo y las expresiones faciales correspondientes generadas en tiempo real. La aplicación complementaria de IA Replika ya permite a los usuarios chatear con sus compañeros a través de voz, video y AR/VR. En el futuro, uno puede imaginar un juego de simulación en el que los jugadores puedan mantenerse en contacto con sus agentes por teléfono o chat de video mientras viajan, y luego hacer clic en un juego más inmersivo cuando regresen a su computadora.
Sin embargo, todavía quedan muchos desafíos por resolver antes de que podamos ver una versión completamente generada de Los Sims. Los datos de entrenamiento para LLM tienen sesgos inherentes que pueden reflejarse en el comportamiento del agente. Juegos de servicio en tiempo real 24 horas al día, 7 días a la semana El costo de ejecutar simulaciones a gran escala puede no ser económicamente viable; ejecutar 25 agentes en 2 días le costaría al equipo de investigación miles de dólares en computación. Los esfuerzos para descargar las cargas de trabajo del modelo a los dispositivos son prometedores, pero aún son relativamente tempranos. También es posible que necesitemos desarrollar nuevas normas en torno a las relaciones cuasisociales con los agentes.
Pero una cosa está clara, hay una gran demanda de agentes generativos en este momento. En nuestra encuesta reciente, el 61% de los estudios de juegos planean experimentar con NPC de IA. Creemos que los compañeros de IA pronto se convertirán en algo común a medida que los agentes ingresen a nuestras esferas sociales cotidianas. Los juegos de simulación proporcionan una caja de arena digital en la que podemos interactuar con nuestros compañeros de IA favoritos de formas divertidas e impredecibles. A la larga, es probable que cambie la naturaleza de los juegos de simulación, con estos agentes no solo juguetes, sino posibles amigos, familiares, colegas, asesores e incluso amantes.
Personalización
El objetivo final de un juego personalizado es proporcionar a cada jugador una experiencia de juego única. Por ejemplo, comencemos con la creación de personajes: desde el juego de mesa Dungeons & Dragons original hasta Genshin Impact de Mihoyo, la creación de personajes es la columna vertebral de casi todos los juegos de rol (RPG). La mayoría de los juegos de rol permiten al jugador elegir entre opciones preestablecidas para personalizar la apariencia, el género, la clase, etc. Entonces, ¿cómo vas más allá de los ajustes preestablecidos para generar un personaje único para cada jugador y modo de juego? Un creador de personajes personalizado que combina LLM con un modelo de difusión de texto a imagen lo permite.
Spellbrush's Arrowmancer es un juego de rol impulsado por el modelo de animación personalizado basado en GAN de la compañía. En Arrowmancer, los jugadores pueden generar un conjunto completo de personajes de anime únicos, que incluyen arte y habilidades de combate. Esta personalización también es parte de su sistema de monetización, ya que los jugadores importan personajes creados por IA en pancartas de gacha personalizadas, donde pueden ganar personajes duplicados para fortalecer sus filas.
La personalización también se extiende a los elementos del juego. Por ejemplo, la IA puede ayudar a generar armas y armaduras únicas que solo están disponibles para los jugadores que completan ciertas tareas. Azra Games creó una canalización de activos impulsada por IA para idear y generar rápidamente una amplia biblioteca de elementos del mundo y del juego, allanando el camino para una experiencia de juego más diversa. El renombrado desarrollador de AAA, Activision Blizzard, construyó el sistema Blizzard Diffusion, una réplica del generador de imágenes Stable Diffusion, para ayudar a generar arte conceptual para varios personajes y atuendos.
El texto y el diálogo del juego también se pueden personalizar. Los emblemas en el mundo pueden reflejar algún tipo de título o estatus que el jugador haya logrado. Los NPC se pueden configurar como agentes LLM con personalidades únicas que se adaptan al comportamiento del jugador. Por ejemplo, el diálogo puede cambiar según el comportamiento anterior del jugador con el agente. Hemos visto este concepto implementado con éxito en un juego triple A, y Shadow of Mordor de Monolith tiene un sistema de venganza que crea dinámicamente historias de fondo interesantes para los villanos en función de las acciones del jugador. Estos elementos de personalización hacen que cada experiencia de juego sea única.
El editor de juegos Ubisoft reveló recientemente Ghostwriter, una herramienta de conversación impulsada por LLM. Hoy en día, los editores usan la herramienta para generar automáticamente un diálogo que ayuda a simular el mundo vivo que rodea a los jugadores.
Desde el punto de vista del jugador, la IA se suma a la inmersión y la jugabilidad del juego. La perdurable popularidad de las modificaciones de rol en juegos inmersivos de mundo abierto como Skyrim y Grand Theft Auto V demuestra una necesidad latente de historias personalizadas. Incluso hoy, GTA V tiene constantemente un mayor número de jugadores en los servidores de juegos de rol que el juego original. Creemos que en el futuro, los sistemas de personalización se convertirán en una herramienta operativa integral en tiempo real para atraer y retener jugadores en todos los juegos.
Narrativa de IA
Por supuesto, hay más en un buen juego que personajes y diálogos. Otro escenario interesante es aprovechar la IA generativa para contar historias mejores y más personales.
Dungeons & Dragons es el abuelo de la narración personalizada en los juegos, en los que una persona conocida como "maestro de la mazmorra" se prepara para contar una historia a un grupo de amigos, cada uno de los cuales juega un papel en la historia. La historia resultante es en parte drama de improvisación, en parte juego de rol, lo que significa que cada partida es única. Como una señal de la necesidad de contar historias personalizadas, Dungeons & Dragons es más popular que nunca hoy en día, con ventas digitales y analógicas que alcanzan niveles récord.
Hoy en día, muchas empresas están aplicando LLM al modo historia de Dungeons & Dragons. La oportunidad aquí es que los jugadores pasen su tiempo en sus universos IP o creados por jugadores favoritos, guiados por un narrador de IA infinitamente paciente. Lanzado en 2019, AI Dungeon de Latitude es un juego de aventuras abierto basado en texto en el que la IA juega el papel de maestro de mazmorras. Los usuarios también han perfeccionado la versión GPT-4 de OpenAI para jugar a Dungeons & Dragons con resultados prometedores. El juego de aventuras de texto de Character.AI es uno de los modos más populares de la aplicación.
Hidden Door va un paso más allá al entrenar un modelo de aprendizaje automático en un conjunto específico de material de origen (como El mago de Oz) y permitir que los jugadores se aventuren dentro de un universo IP determinado. De esta manera, Hidden Door trabajó con el propietario de la propiedad intelectual para habilitar una nueva forma interactiva de extensión de marca. Tan pronto como los fanáticos terminan de ver una película o un libro, pueden continuar sus aventuras en sus mundos favoritos a través de eventos personalizados similares a Dungeons & Dragons. La demanda de la experiencia de los fanáticos está en auge, con Archiveofourown.org y Wattpad, los dos repositorios de ficción de fanáticos en línea más grandes, que recibieron más de 354 millones y 146 millones de visitas al sitio web, respectivamente, solo en mayo.
NovelAI desarrolló su propio LLM Clio, usándolo para contar historias en un modo de espacio aislado para ayudar a los escritores humanos a superar los problemas de bloqueo de escritura. Para los escritores más exigentes, NovelAI permite a los usuarios ajustar Clio en función de su propio trabajo, o incluso el de autores famosos como HP Lovecraft o Jules Verne.
Vale la pena señalar que hay muchos obstáculos antes de que la producción de historias de IA esté completamente lista. Construir un buen narrador de IA hoy requiere mucho establecimiento de reglas humanas para crear las líneas narrativas que definen una buena historia. La memoria y la coherencia son muy importantes, el narrador necesita recordar lo que sucedió antes en la historia y ser consistente en hechos y estilo. La interpretabilidad sigue siendo un desafío para gran parte del código de fuente cerrada que funciona como una caja negra, y los diseñadores de juegos deben comprender cómo se comportan los sistemas para mejorar la experiencia de juego.
Sin embargo, al superar estos obstáculos, la IA se ha convertido en el copiloto de los narradores humanos. Hoy, millones de escritores usan ChatGPT para inspirar sus historias. El estudio de entretenimiento ic reunió a DALL-E, ChatGPT, Midjourney, Eleven Labs y Runway con un equipo editorial humano para crear un programa interactivo de aventuras que puedes elegir, que ahora se transmite en Netflix.
Construcción de un mundo dinámico
Si bien las historias basadas en texto son populares, muchos jugadores también están ansiosos por ver cómo sus historias cobran vida visualmente. Quizás una de las mayores oportunidades para la IA generativa en los juegos es ayudar a crear mundos vivos en los que los jugadores pasan incontables horas sumergidos.
La última visión es poder generar niveles y contenido en tiempo real a medida que el jugador avanza en el juego. El “Mind Game” de la novela de ciencia ficción “Ender's Game” (Juego de Ender) es un ejemplo típico de este tipo de juego. The Mind Game es un juego guiado por IA que se adapta en tiempo real a los intereses de cada estudiante, con el mundo del juego cambiando constantemente según el comportamiento del estudiante y cualquier otra información mental que infiera la IA.
Probablemente lo más parecido a un "juego mental" hoy en día es la serie Left 4 Dead de Valve, que utiliza la guía de IA para ajustar dinámicamente el ritmo y la dificultad del juego. El director de IA no fijó el punto de generación del enemigo (zombi), sino que colocó a los zombis en diferentes posiciones según el estado, las habilidades y la posición de cada jugador, creando así una experiencia única en cada juego. El director también creó la atmósfera del juego a través de efectos visuales dinámicos y música. El fundador de Valve, Gabe Newell, llama a este sistema "narración programada". El remake de Dead Space de EA, aclamado por la crítica, utiliza una variante del sistema de dirección de IA para llevar el horror al extremo.
Aunque esto pueda parecer una trama de ciencia ficción hoy en día, un día, con la mejora de los modelos generativos y la adquisición de suficientes cálculos y datos, podemos crear un director de IA que no solo puede crear sustos, sino también crear el mundo mismo.
Vale la pena señalar que el concepto de niveles generados por máquinas en los juegos no es nuevo. Desde Supergiant's Hades hasta Blizzard's Diablo y Mojang's Minecraft, muchos de los juegos más populares de la actualidad utilizan la generación de procedimientos, que utiliza ecuaciones y conjuntos de reglas ejecutados por diseñadores humanos para crear aleatoriamente niveles que son diferentes cada vez. Se ha establecido un conjunto completo de bibliotecas de software para ayudar a la generación de programas. SpeedTree de Unity ayuda a los desarrolladores a generar el follaje virtual que quizás hayas visto en los bosques de Pandora en Avatar o en los paisajes de Elden Ring.
Un juego podría combinar un generador de activos de procedimiento con LLM en la interfaz de usuario. El juego "Townscaper" utiliza un sistema de procedimiento que solo necesita que el jugador ingrese dos datos (la posición y el color de los bloques), y puede transformarse rápidamente en un hermoso paisaje urbano. Imagine agregar Townscaper de LLM a la interfaz de usuario para ayudar a los jugadores a iterar trabajos más refinados y exquisitos a través de indicaciones de lenguaje natural.
Muchos desarrolladores también están entusiasmados con el potencial de usar el aprendizaje automático para mejorar la generación de programas. Algún día, los diseñadores podrían generar iterativamente primeros borradores viables de niveles usando modelos entrenados en niveles existentes con estilos similares. A principios de este año, Shyam Sudhakaran dirigió un equipo de la Universidad de Copenhague que creó MarioGPT, una herramienta GPT2 que genera niveles de Super Mario usando un modelo entrenado en los niveles originales de Super Mario 1 y 2. La investigación académica en esta área ha estado ocurriendo durante algún tiempo, incluido un proyecto de 2018 que utiliza redes generativas antagónicas (GAN) para diseñar niveles para el juego de disparos en primera persona DOOM.
Los modelos generativos, utilizados junto con los sistemas de procedimiento, pueden acelerar en gran medida la creación de activos. Los artistas ya están utilizando modelos de difusión de texto a imagen para el arte conceptual y el guión gráfico asistidos por IA. En esta publicación de blog, el supervisor de efectos visuales de mainframe, Jussi Kemppainen, describe cómo creó el mundo y los personajes para un juego de aventuras en 2.5D con la ayuda de Midjourney y Adobe Firefly.
Las técnicas generativas 3D también se han investigado mucho. Luma aprovecha los campos de radiación neuronal (NeRF) para permitir a los consumidores crear activos 3D fotorrealistas a partir de imágenes 2D capturadas en un iPhone. Kaedim utiliza una combinación de IA y control de calidad humano para crear mallas 3D listas para producción y actualmente lo utilizan más de 225 desarrolladores de juegos. CSM lanzó recientemente un modelo patentado que puede generar modelos 3D a partir de videos e imágenes.
La construcción del mundo en tiempo real con modelos de IA es lo que importa a largo plazo. En nuestra opinión, en el futuro, ya no será necesario renderizar todo el juego, sino que se generará en tiempo de ejecución mediante redes neuronales. La tecnología DLSS de Nvidia ya puede generar nuevos marcos de juego de alta resolución sobre la marcha utilizando GPU de nivel de consumidor. Tal vez algún día puedas presionar el botón "interactuar" en una película de Netflix y entrar en un mundo donde cada escena se genera sobre la marcha y se adapta al reproductor. En el futuro, los juegos no serán diferentes a las películas.
Vale la pena señalar que un mundo generado dinámicamente por sí solo no es suficiente para hacer un buen juego, como lo demuestra la reseña de No Man's Sky. La promesa de los mundos dinámicos radica en su combinación con otros sistemas de juego (personalización, agentes generativos, etc.) para abrir nuevas formas de narración. Después de todo, la parte más convincente de "Mind Games" es cómo se moldea a sí mismo para Ed, no el mundo en sí.
IA "copiloto"
Si bien hemos cubierto anteriormente el uso de agentes generativos en juegos simulados, hay otro caso de uso emergente en el que la IA actúa como copiloto de juegos, guiándonos a través del juego y, en algunos casos, incluso luchando junto a nosotros.
Para los jugadores que se inician en juegos complejos, el papel del copiloto de IA es inconmensurable. Por ejemplo, un juego de sandbox UGC como Minecraft, Roblox o Rec Room es un entorno rico en el que los jugadores pueden construir casi cualquier cosa que puedan imaginar con los materiales y las habilidades adecuadas. Pero el umbral de aprendizaje es muy alto y no es fácil para la mayoría de los jugadores encontrar la forma de empezar.
El copiloto de IA puede convertir a cualquier jugador en un maestro constructor en los juegos UGC, brindando orientación paso a paso basada en indicaciones de texto o imágenes, y guiando a los jugadores para superar los errores. Un buen punto de referencia es el concepto de "maestros constructores" en el mundo Lego, estos raros seres que tienen el don de poder ver los planos de cualquier creación que puedan imaginar cuando sea necesario.
Microsoft ha comenzado a desarrollar un sistema asistido por IA para Minecraft que utiliza DALL-E y Github Copilot para permitir a los jugadores inyectar activos y lógica en las sesiones de Minecraft a través de indicaciones en lenguaje natural. Roblox está integrando activamente herramientas de generación de inteligencia artificial en la plataforma Roblox con la misión de permitir que "cada usuario sea un creador". Desde la codificación con Github Copilot hasta la escritura con ChatGPT, la eficacia de los copilotos de IA en la creación conjunta se ha demostrado en muchos campos.
Además de la coautoría, un LLM capacitado en datos de juegos humanos debería poder comprender cómo comportarse en varios juegos. Con una integración adecuada, el agente puede actuar como socio cuando los amigos del jugador no pueden participar, o como el otro lado en juegos cara a cara como FIFA y NBA 2k. Tal agente puede participar en el juego en cualquier momento, ya sea que gane o pierda, es amable y no culpará al jugador. Ajustados en función de nuestros historiales de juego individuales, estos agentes podrían superar con creces a los bots existentes, jugando exactamente como lo hacemos nosotros o jugando de formas complementarias.
Se han ejecutado con éxito proyectos similares en entornos limitados. El popular juego de carreras Forza ha desarrollado un sistema "Drivatar" que utiliza el aprendizaje automático para crear un controlador de IA para cada jugador humano que imita su comportamiento de conducción. Los Drivatars se cargan en la nube y, cuando el compañero humano está desconectado, se pueden invocar los Drivatars para competir contra otros jugadores e incluso ganar puntos de victoria. AlphaStar de DeepMind de Google se entrenó en un conjunto de datos del juego StarCraft II de "200 años" para crear un agente que pueda jugar contra profesionales de los deportes electrónicos y vencerlos.
Como mecanismo de juego, el copiloto de IA puede incluso crear un nuevo modo de juego. Imagina Fortnite, pero cada jugador tiene una varita de "maestro constructor" que puede construir instantáneamente torres de francotirador o rocas en llamas con indicaciones. En este modo de juego, el resultado puede depender más de lo que haga la varita (pista) que de la habilidad para apuntar con el arma.
El "compañero" perfecto de IA en los juegos ha sido una parte memorable de muchas franquicias de juegos populares. Los ejemplos incluyen Cortana en el universo Halo, Elle en The Last of Us o Elizabeth en BioShock Infinite. Golpear a los bots de la computadora nunca pasa de moda en los juegos competitivos, desde freír alienígenas en Space Invaders hasta combatir pisoteando en StarCraft, que eventualmente se transformó en su propio modo de juego, Co-op Commander.
A medida que los juegos evolucionan hacia la próxima generación de redes sociales, esperamos que el copiloto de IA desempeñe un papel social cada vez más importante. Está bien documentado que agregar funciones sociales aumenta la adherencia del juego, con tasas de retención hasta 5 veces más altas para jugadores con amigos. En nuestra opinión, todos los juegos del futuro tendrán un copiloto de IA.
en conclusión
Todavía estamos en los primeros días cuando se trata de aplicar IA a los juegos, y se deben resolver muchos obstáculos legales, éticos y técnicos antes de que estas ideas puedan cobrar vida. Actualmente, la propiedad legal y la protección de los derechos de autor de los juegos que utilizan activos generados por IA no están claras en gran medida, a menos que los desarrolladores puedan demostrar la propiedad de todos los datos utilizados para entrenar modelos. Esto dificulta que los propietarios de propiedad intelectual con licencia existente utilicen modelos de IA de terceros en sus procesos de producción.
Cómo compensar a los autores, artistas y creadores originales detrás de los datos de capacitación también es un problema importante. El desafío es que la mayoría de los modelos de IA se entrenan con datos públicos en Internet, la mayoría de los cuales son obras con derechos de autor. En algunos casos, los usuarios incluso han podido reproducir el estilo de un artista utilizando modelos generativos. Todavía es pronto, y el problema de la compensación para los creadores de contenido debe resolverse adecuadamente.
Actualmente, la mayoría de los modelos generativos son demasiado costosos para ejecutarse en la nube a escala global las 24 horas del día, los 7 días de la semana, lo cual es necesario para las operaciones de juegos modernas. Para mantener bajos los costos, es posible que los desarrolladores de aplicaciones deban encontrar formas de descargar las cargas de trabajo del modelo a los dispositivos de los usuarios finales, pero esto llevará tiempo.
Sin embargo, ahora está claro que los desarrolladores de juegos y los jugadores tienen mucho interés en la IA generativa para juegos. Si bien también hay mucha expectación, estamos muy emocionados de ver muchos equipos talentosos en este espacio trabajando horas extra para crear productos innovadores.
La oportunidad no es solo hacer que los juegos existentes sean más rápidos y baratos, sino crear un tipo completamente nuevo de juego de IA que antes no era posible. Todavía no sabemos qué forma tomarán estos juegos, pero sabemos que la historia de la industria de los juegos ha sido una de tecnología que permite nuevas formas de juego. Con sistemas como agentes generativos, personalización, narración de historias de IA, construcción de mundos dinámicos y copilotos de IA, es posible que estemos a punto de ver los primeros juegos "sin fin" creados por desarrolladores de IA.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Análisis en profundidad de a16z: ¿Qué nueva jugabilidad creará la IA?
fuente/a16z
Compilar/Nick
Gran parte de la discusión inicial sobre la revolución de la IA generativa en los juegos se ha centrado en cómo las herramientas de IA pueden mejorar la eficiencia de los creadores de juegos, permitiendo que los juegos se produzcan más rápido y a mayor escala que antes. A la larga, creemos que la IA no solo cambiará la forma en que se crean los juegos, sino también la naturaleza misma de los juegos.
Todo el tiempo, la IA está ayudando a generar nuevas formas de juegos. Desde mazmorras generadas por procedimientos en Rogue (1980), hasta máquinas de estados finitos en Half-Life (1998) y directores de juegos de IA en Left 4 Dead (2008). Más recientemente, los avances en la tecnología de aprendizaje profundo han cambiado aún más el juego al permitir que las computadoras generen contenido nuevo en función de las indicaciones del usuario y grandes conjuntos de datos.
Todavía es pronto, pero ya estamos viendo algunas áreas interesantes de los juegos impulsados por IA, incluidos los agentes generativos, la personalización, la narración de historias de IA, los mundos dinámicos y los copilotos de IA. Si tienen éxito, estos sistemas podrían combinarse para crear juegos emergentes de IA que retengan cuadros de jugadores leales.
Agente generativo
Iniciado por SimCity de Maxis en 1989, el juego de simulación permite a los jugadores construir y administrar una ciudad virtual. Hoy en día, el juego de simulación más popular es Los Sims, donde más de 70 millones de jugadores en todo el mundo manejan personas virtuales conocidas como "sims" y les permiten seguir con su vida diaria. El diseñador Will Wright una vez describió a Los Sims como una "casa de muñecas interactiva".
La IA generativa puede avanzar en gran medida en el desarrollo de juegos de simulación al hacer que los agentes sean más realistas a través de comportamientos sociales emergentes impulsados por modelos de lenguaje extenso (LLM).
A principios de este año, un equipo de investigación de la Universidad de Stanford y Google publicaron un artículo que mostraba cómo aplicar LLM a los agentes en los juegos. Dirigido por el estudiante de doctorado Joon Sung Park, el equipo de investigación incorporó a 25 agentes similares a Sims en un mundo de sandbox de arte de píxeles cuyo comportamiento fue determinado por ChatGPT y una arquitectura que extiende LLM para usar lenguaje natural para almacenar un registro completo de la experiencia de un agente, sintetizar estos recuerdos en una reflexión de nivel superior y recuperarlos dinámicamente para planificar el comportamiento.
Estos resultados son una excelente vista previa del futuro potencial de los juegos de simulación. Comenzando con una sugerencia especificada por el usuario de que un agente desea organizar una fiesta del Día de San Valentín, los agentes distribuyen de forma independiente invitaciones a la fiesta, forman nuevas amistades, se invitan entre sí y se coordinan para llegar a tiempo a la fiesta dos días después.
Este comportamiento es posible porque los LLM están capacitados en datos de redes sociales, por lo que sus modelos incluyen los fundamentos de cómo los humanos hablan entre sí y se comportan en diversos contextos sociales. Y en entornos digitales interactivos como los juegos analógicos, estas respuestas pueden activarse para crear un comportamiento realista.
Desde la perspectiva del jugador, el resultado final es una experiencia de juego más inmersiva. Gran parte de la diversión de jugar a Los Sims o al simulador de colonias RimWorld proviene de los sucesos inesperados. Con el comportamiento de los agentes en las redes sociales, podemos ver juegos de simulación que no solo muestren la imaginación de los diseñadores de juegos, sino que también reflejen la imprevisibilidad de la sociedad humana. Ver estos sims puede proporcionar tanto entretenimiento como ver la próxima generación de The Truman Show de una manera que no es posible con la televisión o las películas preproducidas de hoy.
Los propios agentes también se pueden personalizar, basándose en nuestras aspiraciones imaginativas para un juego de "Casa de muñecas". Los jugadores pueden diseñar un agente ideal basado en ellos mismos o en personajes ficticios. "Ready Player Me" permite a los usuarios generar su propio avatar 3D al tomar una selfie e importar el avatar a más de 9000 juegos/aplicaciones. Las plataformas de personajes de IA Character.ai, InWorld y Convai pueden crear NPC personalizados con sus propias historias, personalidades y controles de comportamiento.
Con capacidades de lenguaje natural, también se ha ampliado la forma en que interactuamos con los agentes. Hoy, los desarrolladores pueden usar los modelos de texto a voz de Eleven Labs para generar voces realistas para sus agentes. Convai se asoció recientemente con Nvidia para una demostración muy publicitada en la que los jugadores podían entablar una conversación de voz natural con un NPC chef de ramen de IA, con el diálogo y las expresiones faciales correspondientes generadas en tiempo real. La aplicación complementaria de IA Replika ya permite a los usuarios chatear con sus compañeros a través de voz, video y AR/VR. En el futuro, uno puede imaginar un juego de simulación en el que los jugadores puedan mantenerse en contacto con sus agentes por teléfono o chat de video mientras viajan, y luego hacer clic en un juego más inmersivo cuando regresen a su computadora.
Sin embargo, todavía quedan muchos desafíos por resolver antes de que podamos ver una versión completamente generada de Los Sims. Los datos de entrenamiento para LLM tienen sesgos inherentes que pueden reflejarse en el comportamiento del agente. Juegos de servicio en tiempo real 24 horas al día, 7 días a la semana El costo de ejecutar simulaciones a gran escala puede no ser económicamente viable; ejecutar 25 agentes en 2 días le costaría al equipo de investigación miles de dólares en computación. Los esfuerzos para descargar las cargas de trabajo del modelo a los dispositivos son prometedores, pero aún son relativamente tempranos. También es posible que necesitemos desarrollar nuevas normas en torno a las relaciones cuasisociales con los agentes.
Pero una cosa está clara, hay una gran demanda de agentes generativos en este momento. En nuestra encuesta reciente, el 61% de los estudios de juegos planean experimentar con NPC de IA. Creemos que los compañeros de IA pronto se convertirán en algo común a medida que los agentes ingresen a nuestras esferas sociales cotidianas. Los juegos de simulación proporcionan una caja de arena digital en la que podemos interactuar con nuestros compañeros de IA favoritos de formas divertidas e impredecibles. A la larga, es probable que cambie la naturaleza de los juegos de simulación, con estos agentes no solo juguetes, sino posibles amigos, familiares, colegas, asesores e incluso amantes.
Personalización
El objetivo final de un juego personalizado es proporcionar a cada jugador una experiencia de juego única. Por ejemplo, comencemos con la creación de personajes: desde el juego de mesa Dungeons & Dragons original hasta Genshin Impact de Mihoyo, la creación de personajes es la columna vertebral de casi todos los juegos de rol (RPG). La mayoría de los juegos de rol permiten al jugador elegir entre opciones preestablecidas para personalizar la apariencia, el género, la clase, etc. Entonces, ¿cómo vas más allá de los ajustes preestablecidos para generar un personaje único para cada jugador y modo de juego? Un creador de personajes personalizado que combina LLM con un modelo de difusión de texto a imagen lo permite.
Spellbrush's Arrowmancer es un juego de rol impulsado por el modelo de animación personalizado basado en GAN de la compañía. En Arrowmancer, los jugadores pueden generar un conjunto completo de personajes de anime únicos, que incluyen arte y habilidades de combate. Esta personalización también es parte de su sistema de monetización, ya que los jugadores importan personajes creados por IA en pancartas de gacha personalizadas, donde pueden ganar personajes duplicados para fortalecer sus filas.
La personalización también se extiende a los elementos del juego. Por ejemplo, la IA puede ayudar a generar armas y armaduras únicas que solo están disponibles para los jugadores que completan ciertas tareas. Azra Games creó una canalización de activos impulsada por IA para idear y generar rápidamente una amplia biblioteca de elementos del mundo y del juego, allanando el camino para una experiencia de juego más diversa. El renombrado desarrollador de AAA, Activision Blizzard, construyó el sistema Blizzard Diffusion, una réplica del generador de imágenes Stable Diffusion, para ayudar a generar arte conceptual para varios personajes y atuendos.
El texto y el diálogo del juego también se pueden personalizar. Los emblemas en el mundo pueden reflejar algún tipo de título o estatus que el jugador haya logrado. Los NPC se pueden configurar como agentes LLM con personalidades únicas que se adaptan al comportamiento del jugador. Por ejemplo, el diálogo puede cambiar según el comportamiento anterior del jugador con el agente. Hemos visto este concepto implementado con éxito en un juego triple A, y Shadow of Mordor de Monolith tiene un sistema de venganza que crea dinámicamente historias de fondo interesantes para los villanos en función de las acciones del jugador. Estos elementos de personalización hacen que cada experiencia de juego sea única.
El editor de juegos Ubisoft reveló recientemente Ghostwriter, una herramienta de conversación impulsada por LLM. Hoy en día, los editores usan la herramienta para generar automáticamente un diálogo que ayuda a simular el mundo vivo que rodea a los jugadores.
Desde el punto de vista del jugador, la IA se suma a la inmersión y la jugabilidad del juego. La perdurable popularidad de las modificaciones de rol en juegos inmersivos de mundo abierto como Skyrim y Grand Theft Auto V demuestra una necesidad latente de historias personalizadas. Incluso hoy, GTA V tiene constantemente un mayor número de jugadores en los servidores de juegos de rol que el juego original. Creemos que en el futuro, los sistemas de personalización se convertirán en una herramienta operativa integral en tiempo real para atraer y retener jugadores en todos los juegos.
Narrativa de IA
Por supuesto, hay más en un buen juego que personajes y diálogos. Otro escenario interesante es aprovechar la IA generativa para contar historias mejores y más personales.
Dungeons & Dragons es el abuelo de la narración personalizada en los juegos, en los que una persona conocida como "maestro de la mazmorra" se prepara para contar una historia a un grupo de amigos, cada uno de los cuales juega un papel en la historia. La historia resultante es en parte drama de improvisación, en parte juego de rol, lo que significa que cada partida es única. Como una señal de la necesidad de contar historias personalizadas, Dungeons & Dragons es más popular que nunca hoy en día, con ventas digitales y analógicas que alcanzan niveles récord.
Hoy en día, muchas empresas están aplicando LLM al modo historia de Dungeons & Dragons. La oportunidad aquí es que los jugadores pasen su tiempo en sus universos IP o creados por jugadores favoritos, guiados por un narrador de IA infinitamente paciente. Lanzado en 2019, AI Dungeon de Latitude es un juego de aventuras abierto basado en texto en el que la IA juega el papel de maestro de mazmorras. Los usuarios también han perfeccionado la versión GPT-4 de OpenAI para jugar a Dungeons & Dragons con resultados prometedores. El juego de aventuras de texto de Character.AI es uno de los modos más populares de la aplicación.
Hidden Door va un paso más allá al entrenar un modelo de aprendizaje automático en un conjunto específico de material de origen (como El mago de Oz) y permitir que los jugadores se aventuren dentro de un universo IP determinado. De esta manera, Hidden Door trabajó con el propietario de la propiedad intelectual para habilitar una nueva forma interactiva de extensión de marca. Tan pronto como los fanáticos terminan de ver una película o un libro, pueden continuar sus aventuras en sus mundos favoritos a través de eventos personalizados similares a Dungeons & Dragons. La demanda de la experiencia de los fanáticos está en auge, con Archiveofourown.org y Wattpad, los dos repositorios de ficción de fanáticos en línea más grandes, que recibieron más de 354 millones y 146 millones de visitas al sitio web, respectivamente, solo en mayo.
NovelAI desarrolló su propio LLM Clio, usándolo para contar historias en un modo de espacio aislado para ayudar a los escritores humanos a superar los problemas de bloqueo de escritura. Para los escritores más exigentes, NovelAI permite a los usuarios ajustar Clio en función de su propio trabajo, o incluso el de autores famosos como HP Lovecraft o Jules Verne.
Vale la pena señalar que hay muchos obstáculos antes de que la producción de historias de IA esté completamente lista. Construir un buen narrador de IA hoy requiere mucho establecimiento de reglas humanas para crear las líneas narrativas que definen una buena historia. La memoria y la coherencia son muy importantes, el narrador necesita recordar lo que sucedió antes en la historia y ser consistente en hechos y estilo. La interpretabilidad sigue siendo un desafío para gran parte del código de fuente cerrada que funciona como una caja negra, y los diseñadores de juegos deben comprender cómo se comportan los sistemas para mejorar la experiencia de juego.
Sin embargo, al superar estos obstáculos, la IA se ha convertido en el copiloto de los narradores humanos. Hoy, millones de escritores usan ChatGPT para inspirar sus historias. El estudio de entretenimiento ic reunió a DALL-E, ChatGPT, Midjourney, Eleven Labs y Runway con un equipo editorial humano para crear un programa interactivo de aventuras que puedes elegir, que ahora se transmite en Netflix.
Construcción de un mundo dinámico
Si bien las historias basadas en texto son populares, muchos jugadores también están ansiosos por ver cómo sus historias cobran vida visualmente. Quizás una de las mayores oportunidades para la IA generativa en los juegos es ayudar a crear mundos vivos en los que los jugadores pasan incontables horas sumergidos.
La última visión es poder generar niveles y contenido en tiempo real a medida que el jugador avanza en el juego. El “Mind Game” de la novela de ciencia ficción “Ender's Game” (Juego de Ender) es un ejemplo típico de este tipo de juego. The Mind Game es un juego guiado por IA que se adapta en tiempo real a los intereses de cada estudiante, con el mundo del juego cambiando constantemente según el comportamiento del estudiante y cualquier otra información mental que infiera la IA.
Probablemente lo más parecido a un "juego mental" hoy en día es la serie Left 4 Dead de Valve, que utiliza la guía de IA para ajustar dinámicamente el ritmo y la dificultad del juego. El director de IA no fijó el punto de generación del enemigo (zombi), sino que colocó a los zombis en diferentes posiciones según el estado, las habilidades y la posición de cada jugador, creando así una experiencia única en cada juego. El director también creó la atmósfera del juego a través de efectos visuales dinámicos y música. El fundador de Valve, Gabe Newell, llama a este sistema "narración programada". El remake de Dead Space de EA, aclamado por la crítica, utiliza una variante del sistema de dirección de IA para llevar el horror al extremo.
Aunque esto pueda parecer una trama de ciencia ficción hoy en día, un día, con la mejora de los modelos generativos y la adquisición de suficientes cálculos y datos, podemos crear un director de IA que no solo puede crear sustos, sino también crear el mundo mismo.
Vale la pena señalar que el concepto de niveles generados por máquinas en los juegos no es nuevo. Desde Supergiant's Hades hasta Blizzard's Diablo y Mojang's Minecraft, muchos de los juegos más populares de la actualidad utilizan la generación de procedimientos, que utiliza ecuaciones y conjuntos de reglas ejecutados por diseñadores humanos para crear aleatoriamente niveles que son diferentes cada vez. Se ha establecido un conjunto completo de bibliotecas de software para ayudar a la generación de programas. SpeedTree de Unity ayuda a los desarrolladores a generar el follaje virtual que quizás hayas visto en los bosques de Pandora en Avatar o en los paisajes de Elden Ring.
Un juego podría combinar un generador de activos de procedimiento con LLM en la interfaz de usuario. El juego "Townscaper" utiliza un sistema de procedimiento que solo necesita que el jugador ingrese dos datos (la posición y el color de los bloques), y puede transformarse rápidamente en un hermoso paisaje urbano. Imagine agregar Townscaper de LLM a la interfaz de usuario para ayudar a los jugadores a iterar trabajos más refinados y exquisitos a través de indicaciones de lenguaje natural.
Muchos desarrolladores también están entusiasmados con el potencial de usar el aprendizaje automático para mejorar la generación de programas. Algún día, los diseñadores podrían generar iterativamente primeros borradores viables de niveles usando modelos entrenados en niveles existentes con estilos similares. A principios de este año, Shyam Sudhakaran dirigió un equipo de la Universidad de Copenhague que creó MarioGPT, una herramienta GPT2 que genera niveles de Super Mario usando un modelo entrenado en los niveles originales de Super Mario 1 y 2. La investigación académica en esta área ha estado ocurriendo durante algún tiempo, incluido un proyecto de 2018 que utiliza redes generativas antagónicas (GAN) para diseñar niveles para el juego de disparos en primera persona DOOM.
Los modelos generativos, utilizados junto con los sistemas de procedimiento, pueden acelerar en gran medida la creación de activos. Los artistas ya están utilizando modelos de difusión de texto a imagen para el arte conceptual y el guión gráfico asistidos por IA. En esta publicación de blog, el supervisor de efectos visuales de mainframe, Jussi Kemppainen, describe cómo creó el mundo y los personajes para un juego de aventuras en 2.5D con la ayuda de Midjourney y Adobe Firefly.
Las técnicas generativas 3D también se han investigado mucho. Luma aprovecha los campos de radiación neuronal (NeRF) para permitir a los consumidores crear activos 3D fotorrealistas a partir de imágenes 2D capturadas en un iPhone. Kaedim utiliza una combinación de IA y control de calidad humano para crear mallas 3D listas para producción y actualmente lo utilizan más de 225 desarrolladores de juegos. CSM lanzó recientemente un modelo patentado que puede generar modelos 3D a partir de videos e imágenes.
La construcción del mundo en tiempo real con modelos de IA es lo que importa a largo plazo. En nuestra opinión, en el futuro, ya no será necesario renderizar todo el juego, sino que se generará en tiempo de ejecución mediante redes neuronales. La tecnología DLSS de Nvidia ya puede generar nuevos marcos de juego de alta resolución sobre la marcha utilizando GPU de nivel de consumidor. Tal vez algún día puedas presionar el botón "interactuar" en una película de Netflix y entrar en un mundo donde cada escena se genera sobre la marcha y se adapta al reproductor. En el futuro, los juegos no serán diferentes a las películas.
Vale la pena señalar que un mundo generado dinámicamente por sí solo no es suficiente para hacer un buen juego, como lo demuestra la reseña de No Man's Sky. La promesa de los mundos dinámicos radica en su combinación con otros sistemas de juego (personalización, agentes generativos, etc.) para abrir nuevas formas de narración. Después de todo, la parte más convincente de "Mind Games" es cómo se moldea a sí mismo para Ed, no el mundo en sí.
IA "copiloto"
Si bien hemos cubierto anteriormente el uso de agentes generativos en juegos simulados, hay otro caso de uso emergente en el que la IA actúa como copiloto de juegos, guiándonos a través del juego y, en algunos casos, incluso luchando junto a nosotros.
Para los jugadores que se inician en juegos complejos, el papel del copiloto de IA es inconmensurable. Por ejemplo, un juego de sandbox UGC como Minecraft, Roblox o Rec Room es un entorno rico en el que los jugadores pueden construir casi cualquier cosa que puedan imaginar con los materiales y las habilidades adecuadas. Pero el umbral de aprendizaje es muy alto y no es fácil para la mayoría de los jugadores encontrar la forma de empezar.
El copiloto de IA puede convertir a cualquier jugador en un maestro constructor en los juegos UGC, brindando orientación paso a paso basada en indicaciones de texto o imágenes, y guiando a los jugadores para superar los errores. Un buen punto de referencia es el concepto de "maestros constructores" en el mundo Lego, estos raros seres que tienen el don de poder ver los planos de cualquier creación que puedan imaginar cuando sea necesario.
Microsoft ha comenzado a desarrollar un sistema asistido por IA para Minecraft que utiliza DALL-E y Github Copilot para permitir a los jugadores inyectar activos y lógica en las sesiones de Minecraft a través de indicaciones en lenguaje natural. Roblox está integrando activamente herramientas de generación de inteligencia artificial en la plataforma Roblox con la misión de permitir que "cada usuario sea un creador". Desde la codificación con Github Copilot hasta la escritura con ChatGPT, la eficacia de los copilotos de IA en la creación conjunta se ha demostrado en muchos campos.
Además de la coautoría, un LLM capacitado en datos de juegos humanos debería poder comprender cómo comportarse en varios juegos. Con una integración adecuada, el agente puede actuar como socio cuando los amigos del jugador no pueden participar, o como el otro lado en juegos cara a cara como FIFA y NBA 2k. Tal agente puede participar en el juego en cualquier momento, ya sea que gane o pierda, es amable y no culpará al jugador. Ajustados en función de nuestros historiales de juego individuales, estos agentes podrían superar con creces a los bots existentes, jugando exactamente como lo hacemos nosotros o jugando de formas complementarias.
Se han ejecutado con éxito proyectos similares en entornos limitados. El popular juego de carreras Forza ha desarrollado un sistema "Drivatar" que utiliza el aprendizaje automático para crear un controlador de IA para cada jugador humano que imita su comportamiento de conducción. Los Drivatars se cargan en la nube y, cuando el compañero humano está desconectado, se pueden invocar los Drivatars para competir contra otros jugadores e incluso ganar puntos de victoria. AlphaStar de DeepMind de Google se entrenó en un conjunto de datos del juego StarCraft II de "200 años" para crear un agente que pueda jugar contra profesionales de los deportes electrónicos y vencerlos.
Como mecanismo de juego, el copiloto de IA puede incluso crear un nuevo modo de juego. Imagina Fortnite, pero cada jugador tiene una varita de "maestro constructor" que puede construir instantáneamente torres de francotirador o rocas en llamas con indicaciones. En este modo de juego, el resultado puede depender más de lo que haga la varita (pista) que de la habilidad para apuntar con el arma.
El "compañero" perfecto de IA en los juegos ha sido una parte memorable de muchas franquicias de juegos populares. Los ejemplos incluyen Cortana en el universo Halo, Elle en The Last of Us o Elizabeth en BioShock Infinite. Golpear a los bots de la computadora nunca pasa de moda en los juegos competitivos, desde freír alienígenas en Space Invaders hasta combatir pisoteando en StarCraft, que eventualmente se transformó en su propio modo de juego, Co-op Commander.
A medida que los juegos evolucionan hacia la próxima generación de redes sociales, esperamos que el copiloto de IA desempeñe un papel social cada vez más importante. Está bien documentado que agregar funciones sociales aumenta la adherencia del juego, con tasas de retención hasta 5 veces más altas para jugadores con amigos. En nuestra opinión, todos los juegos del futuro tendrán un copiloto de IA.
en conclusión
Todavía estamos en los primeros días cuando se trata de aplicar IA a los juegos, y se deben resolver muchos obstáculos legales, éticos y técnicos antes de que estas ideas puedan cobrar vida. Actualmente, la propiedad legal y la protección de los derechos de autor de los juegos que utilizan activos generados por IA no están claras en gran medida, a menos que los desarrolladores puedan demostrar la propiedad de todos los datos utilizados para entrenar modelos. Esto dificulta que los propietarios de propiedad intelectual con licencia existente utilicen modelos de IA de terceros en sus procesos de producción.
Cómo compensar a los autores, artistas y creadores originales detrás de los datos de capacitación también es un problema importante. El desafío es que la mayoría de los modelos de IA se entrenan con datos públicos en Internet, la mayoría de los cuales son obras con derechos de autor. En algunos casos, los usuarios incluso han podido reproducir el estilo de un artista utilizando modelos generativos. Todavía es pronto, y el problema de la compensación para los creadores de contenido debe resolverse adecuadamente.
Actualmente, la mayoría de los modelos generativos son demasiado costosos para ejecutarse en la nube a escala global las 24 horas del día, los 7 días de la semana, lo cual es necesario para las operaciones de juegos modernas. Para mantener bajos los costos, es posible que los desarrolladores de aplicaciones deban encontrar formas de descargar las cargas de trabajo del modelo a los dispositivos de los usuarios finales, pero esto llevará tiempo.
Sin embargo, ahora está claro que los desarrolladores de juegos y los jugadores tienen mucho interés en la IA generativa para juegos. Si bien también hay mucha expectación, estamos muy emocionados de ver muchos equipos talentosos en este espacio trabajando horas extra para crear productos innovadores.
La oportunidad no es solo hacer que los juegos existentes sean más rápidos y baratos, sino crear un tipo completamente nuevo de juego de IA que antes no era posible. Todavía no sabemos qué forma tomarán estos juegos, pero sabemos que la historia de la industria de los juegos ha sido una de tecnología que permite nuevas formas de juego. Con sistemas como agentes generativos, personalización, narración de historias de IA, construcción de mundos dinámicos y copilotos de IA, es posible que estemos a punto de ver los primeros juegos "sin fin" creados por desarrolladores de IA.