Hace un mes, una IA empezó una partida de Pokémon Amarillo. Hoy, tras miles de horas, sigue sin cruzar el Monte Moon

Hace un mes, una IA empezó una partida de Pokémon Amarillo. Hoy, tras miles de horas, sigue sin cruzar el Monte Moon

El experimento de Anthropic en Twitch está teniendo más problemas de lo esperado

2 comentarios Facebook Twitter Flipboard E-mail
Pokemon Ia
abelardo-gonzalez

Abelardo González

Editor - Tech

Alcanzar la Inteligencia Artificial General (o AGI) se ha convertido en el principal desafío de las grandes tecnológicas. Como consecuencia directa de ello, figuras como Sam Altman han analizado cuándo podríamos llegar a ver estas herramientas, asegurando que podríamos convivir con las mismas dentro de "unos pocos miles de días". Sin embargo, aspectos como la teoría del pico de datos que relató Elon Musk juegan en contra de esta condición, dado que la falta de datos humanos para entrenar a la IA está frenando la evolución de la misma. Por ello, como hemos podido comprobar en las últimas semanas, uno de los modelos de inteligencia artificial más avanzado del mundo no puede terminar Pokémon.

A finales de febrero, Anthropic anunció que su modelo Claude jugaría en directo a uno de los títulos originales de Pokémon. Desde entonces, a pesar de que ya ha pasado más de un mes, todos los espectadores que han seguido las peripecias de la IA en su canal de Twitch han comprobado que no consigue finalizar la aventura. Así, a pesar de la expectativa en torno a una IA capaz de superar las capacidades humanas, así como la intención de gigantes como Google u OpenAI de acceder a más datos para seguir alimentando sus servicios, los modelos de inteligencia artificial son incapaces de finalizar un juego que vio la luz hace más de dos décadas.

La IA no puede con los Pokémon de Game Boy

Como señala Ars Technica, el experimento "Claude Plays Pokémon" no ha sido tan exitoso como Anthropic esperaba. A pesar de que Claude 3.7 Sonnet logró obtener múltiples medallas de gimnasio y, con ellas, demostrar avances en el razonamiento de sus modelos de IA, sigue teniendo dificultades para jugar de forma consistente y eficiente. Así, aquellos que hayan visto el directo habrán comprobado que comete errores como deambular sin rumbo, hablar con NPC inútiles o chocar contra paredes durante horas. Sin embargo, hay que tener en cuenta que Claude no fue entrenada para jugar a Pokémon y, por ello, utiliza su conocimiento general, un aspecto que choca de forma directa con aquellas IA que sí han sido perfeccionadas para destacar en determinados juegos.

De esta forma, la capacidad para interpretar imágenes de Claude es limitada y, por ello, dificulta aún más que pueda entender de forma correcta los gráficos pixelados del título. De hecho, la IA de Anthropic supera las expectativas cuando se trata de interpretar las partes del juego basadas en texto, ya que destaca en campos como las estrategias de batallas o la planificación de equipos. Además, puede aprender de los diferentes mensajes que aparecen en pantalla y, con ello, mejorar sus prestaciones al tener en cuenta la efectividad de determinados movimientos. Sin embargo, tiene un problema con una condición que no consigue mejorar: la memoria a largo plazo.

Tal y como indica la noticia original, su ventana de contexto es limitada y, por ende, necesita resumir información de forma constante. Por ello, cuando comete un error relacionado con su base de conocimiento, puede llegar a tardar mucho en corregirlo. Así, ello da pie a que la IA quede atrapada en estrategias fallidas, dado que su capacidad de razonamiento aún está en desarrollo. Sin embargo, como sucede con otras IA con esta condición, ya es capaz de demostrar signos de adaptación y, a su vez, de mejora con el paso del tiempo.

Anthropic sigue evolucionando sus modelos de IA

De esta forma, igual que sucede con la robótica y la comprensión del entorno, la publicación original señala que un mejor reconocimiento visual sumado a una memoria expandida podría llevarle a completar el juego en un futuro. Así, aunque no estamos ante una inteligencia superhumana, los avances de Claude indican que cada vez estamos más cerca de ver a una IA que sea capaz de exprimir las virtudes del razonamiento sólido. De hecho, Anthropic ya trabaja en potenciar este campo a través del uso de navegadores como Brave.

Como señala TechCrunch, la firma norteamericana ha integrado una función de búsqueda web en su chatbot Claude. Sin embargo, muchos sospechan que la función de búsqueda utiliza Brave Search, la herramienta del popular navegador. De hecho, existen evidencias como la inclusión de Brave en la documentación de Anthropic y, a su vez, coincidencias en los resultados de búsqueda. Sin embargo, ni Anthropic ni otros gigantes como OpenAI detallan sus asociaciones con motores de búsqueda, razón por la que la firma tendría que revisar las costuras de sus modelos de IA.

Sea como fuere, aunque finalizar Pokémon es una de las mayores preocupaciones de Claude, Anthropic también tendrá que lidiar con dos problemas que podrían marcar el futuro de la IA: por un lado, la negativa de diferentes modelos a desarrollar determinadas tareas; por otro, buscar una solución para la teoría que ya atemoriza a todos los gigantes del sector. Por el momento, mientras la empresa matriz busca solución a estas situaciones, Claude 3.7 Sonnet sigue enfocado en terminar su partida de Pokémon, ya que después de un mes aún no ha logrado obtener todas las medallas.

Imagen principal de 3DJuegos

En 3DJuegos | Si has visto un círculo azul en WhatsApp, se llama Meta AI y solo hay dos formas de desactivarlo

En 3DJuegos | Aunque nadie hace sombra a los padres de ChatGPT, su futuro dependerá de lo que suceda en 1.376 días

VÍDEO ESPECIAL

204 visualizaciones

100 DETALLES OCULTOS de GOD OF WAR 3

God of War 3 llegó a PlayStation 3 en 2010 para cerrar de forma épica la saga griega que había comenzado en 2005. Fue la conclusión de un arco narrativo cargado de dolor, tragedia y drama (porque siempre la vida de Kratos tiene un buen toque dramático). Su desarrollo fue tan p...

×

Utilizamos cookies de terceros para generar estadísticas de audiencia y mostrar publicidad personalizada analizando tu navegación. Si sigues navegando estarás aceptando su uso. Más información