Entre el 5 y el 7 de agosto de 2025, la plataforma Kaggle Game Arena organizó un inédito torneo de ajedrez con ocho modelos de lenguaje de uso general. A diferencia de los motores especializados, estas inteligencias artificiales no habían sido entrenadas de forma exclusiva para el juego, lo que permitió observar cómo aplicaban sus habilidades de razonamiento en un contexto estratégico.
El evento contó con los siguientes sistemas: o3 y o4-mini — OpenAI; Grok 4 — xAI; Gemini 2.5 Pro y Gemini 2.5 Flash — Google DeepMind; Claude 4 Opus — Anthropic; DeepSeek R1 — DeepSeek; Kimi k2 — Moonshot AI.
En la final, o3 (OpenAI) derrotó a Grok 4 (xAI) por 4-0, adjudicándose el campeonato sin ceder una sola partida. En semifinales, o3 había superado también por 4-0 a o4-mini, mientras que Grok 4 eliminó a Gemini 2.5 Pro tras un empate 2-2 que se resolvió en una partida de desempate tipo armagedón. El duelo por el tercer puesto terminó con victoria de Gemini 2.5 Pro sobre o4-mini.
Las partidas se emitieron en directo con comentarios de grandes maestros y figuras de la comunidad ajedrecística. La final fue analizada en vivo por Magnus Carlsen y David Howell, quienes ofrecieron valoraciones técnicas y reaccionaron con humor ante algunos errores llamativos, como sacrificios de piezas sin justificación o tácticas omitidas. Entre todos, o3 destacó por su constancia para transformar ventajas en victorias.
El torneo también tuvo un matiz empresarial, ya que enfrentó en la final a un modelo de OpenAI, empresa liderada por Sam Altman, contra Grok 4, desarrollado por xAI, compañía fundada por Elon Musk en 2023 tras abandonar OpenAI y criticar públicamente el rumbo comercial que había tomado. Musk ha declarado en varias ocasiones que su objetivo con xAI es crear una inteligencia artificial “segura y orientada a la búsqueda de la verdad”, en contraste con lo que percibe como limitaciones impuestas por otras empresas del sector.
Más allá del espectáculo, la competencia sirvió como un experimento para explorar las capacidades estratégicas de inteligencias artificiales generalistas. Aunque el nivel mostrado está lejos del ajedrez de élite, algunos sistemas demostraron que pueden desenvolverse con coherencia en partidas completas sin entrenamiento especializado. El evento también simbolizó, en cierta medida, la creciente rivalidad entre empresas líderes del sector, y mostró que el ajedrez sigue siendo un terreno ideal para medir el razonamiento de la inteligencia artificial.