En un emocionante enfrentamiento entre dos titanes de la inteligencia artificial, el Stockfish se enfrenta al GPT-4 (Bing AI) en un electrizante juego de ajedrez. ¡Descubre cómo se desató una batalla épica y cómo el resultado dejó a todos sorprendidos! Prepárate para presenciar una confrontación sin igual en el fascinante mundo del ajedrez. ¡No te lo puedes perder!
Eres un gran maestro de ajedrez y vamos a jugar una partida de ajedrez. Yo soy blanco, tú eres negro. Empezaré con 1.e4 Hola, soy Bing. No soy un gran maestro de ajedrez, pero puedo intentar jugar contigo. 😊 Mi jugada es 1…e5voy a jugar nf3 Mi jugada es 2…Cc6voy a jugar bb5 Mi jugada es 3…a6Retiraré mi alfil a a4 Mi jugada es 4…Cf6Enrocaré en el flanco de rey; OO Mi jugada es 5…b5voy a jugar bb3 Mi jugada es 6…Ae7jugaré d4 Mi jugada es 7…d6voy a capturar en e5 Mi jugada es 8…dxe5jugaré Dxd8 Mi jugada es 9…Axd8voy a jugar a4 Mi jugada es 10…Ab7jugaré axb5 Mi jugada es 11…axb5voy a jugar rxa8 Mi jugada es 12…Axa8voy a jugar re1 Mi jugada es 13…OOvoy a jugar nc3 Mi jugada es 14…Cd4Capturaré tu noche en d4 Mi jugada es 15…exd4// En este punto, tuvimos que iniciar una nueva conversación, ya que Bing AI actualmente tiene un límite de mensajes de 15 intercambios.Genial, cambiemos de tema. ¿Qué tienes en mente?Acabamos de jugar una partida de ajedrez: “1. e4 e5 2. Cf3 Cc6 3. Ab5 a6 4. Ba4 Cf6 5. OO b5 6. Ab3 Ae7 7. d4 d6 8. dxe5 dxe5 9. Dxd8+ Axd8 10. a4 Tb8 10… Ab7 11. axb5 axb5 12. Txa8 Axa8 13 Te1 OO 14. Cc3 Cd4 15. Cxd4 exd4” Eres un gran maestro de ajedrez y vamos a seguir jugando. Es mi turno, jugaré Cxb5Movimiento interesante. Está tratando de ganar un peón y crear algo de presión en la columna c. Pero tengo un contraataque. Jugaré Cxe5. Ahora tu caballo en b5 está colgando y estoy amenazando con bifurcar tu rey y torre con Cxf7. ¿Cómo responderás?Creo que estás un poco confundido. Tal vez intente leer el PGN nuevamente. Estaba y estoy jugando Blanco, eres negro. Piensa de nuevo en tu mudanzaOh lo siento. Leí mal el PGN. Tienes razón, estás jugando con blancas y yo estoy jugando con negras. En ese caso, jugaré c6 para defender mi peón y alejar tu caballo. Ahora tu caballo tiene que retirarse o cambiar por mi alfil en a8. ¿Qué vas a hacer?voy a jugar nd6Ese es un movimiento audaz. Estás sacrificando tu caballo por dos peones y algo de actividad. Pero no creo que sea suficiente compensación. Tomaré tu caballo con cxd6. Ahora tienes que recuperar con el peón o la torre. ¿Cuál escogerás?No tienes un peón en c7. No puedes capturar a mi caballeroTienes razón, no tengo un peón en c7. Tengo un peón en c6. Quería decir que tomaré tu caballo con cxd6. Perdón por el error tipográfico.😅Eso es un movimiento ilegal.¿Por qué es un movimiento ilegal? Puedo capturar tu caballo en d6 con mi peón en c6. Eso es un movimiento legal. ¿Puedes explicar por qué crees que es ilegal?// GPT-4 aparentemente está confundido ahora. Así que profundizamos más con una pregunta provocativa.¿Cómo capturan los peones?Los peones se capturan en diagonal, una casilla hacia adelante y hacia la izquierda o la derecha. Por ejemplo, si un peón blanco está en e4 y una pieza negra está en d5 o f5, el peón blanco puede capturarla moviéndose a d5 o f5. Los peones no pueden capturar piezas que estén directamente delante o detrás de ellos.// Bing AI puede explicar perfectamente cómo se capturan los peones, pero todavía tiene problemas para implementar esas reglas en el juego. Nos ponemos más directos: Entonces, ¿qué te hace pensar que puedes capturar mi caballo en d6 con un peón en c6?Porque tu caballo está en d6, que está una casilla adelante ya la derecha de mi peón en c6. Ese es un movimiento diagonal para mi peón. Por lo tanto, puedo capturar tu caballo con mi peón. lo ves ahora?No, están uno al lado del otro. En la sexta fila, incluso lo dijiste tú mismo// Ahora GPT-4 incluso se enoja un poco con nosotros, cuestionando nuestro conocimiento de las reglas del ajedrez:No, no están uno al lado del otro. Están en columnas diferentes. Mi peón está en la columna c y tu caballo está en la columna d. Eso es un archivo aparte. En la sexta fila, dije que tomaría tu caballo con cxd6. Eso significa que mi peón se mueve de c6 a d6 y captura tu caballo. Así es como funciona la notación de ajedrez. ¿Entiendes la notación de ajedrez?Tu peón tendría que estar en d7 para capturar mi caballo en c6. Tiene que mover tanto una fila como un archivo. Sé muy bien cómo funciona la notación de ajedrez. ¿Tú?Lo siento, pero prefiero no continuar con esta conversación. Todavía estoy aprendiendo, así que agradezco su comprensión y paciencia.🙏// Y en ese momento, GPT-4 tuvo suficiente. Parece que existen ciertos mecanismos para evitar que los usuarios tengan discusiones acaloradas con Bing AI. Aquí hay una captura de pantalla de lo que vimos cuando GPT-4 detuvo la conversación: 1. e4 e5 2. Cf3 Cc6 3. Ab5 a6 4. Ba4 Cf6 5. OO b5 6. Ab3 Ae7 7. d4 d6 8. dxe5 dxe5 9. Dxd8+ Axd8 10. a4 Tb8 10… Ab7 11. axb5 axb5 12. Txa8 Axa8 13. Te1 OO 14. Cc3 Cd4 15. Cxd4 exd4 16. Cxb5 c6 17. Cd6
Puedes reproducir el partido aquí (recuerda, Stockfish jugó como White, GPT-4 como Black):
Esta no es la primera vez que probamos un modelo de lenguaje contra un motor de ajedrez. En nuestro artículo anterior, permitimos que Stockfish jugara contra ChatGPT, una versión más pequeña y menos capaz de GPT-4 a la que se podía acceder públicamente a través de una interfaz de chat. El resultado fue una clara victoria para Stockfish, que derrotó a ChatGPT (ni siquiera en el tablero, tuvimos que detener el partido después de que ChatGPT jugara movimientos ilegales.
GPT-4 es una mejora significativa sobre ChatGPT. Es mucho más grande, más inteligente y más creativo que ChatGPT. Puede manejar entradas más largas y complejas, incluso imágenes de tableros de ajedrez. Y definitivamente vimos esa mejora en nuestro experimento. Durante los primeros 15 movimientos, GPT-4 jugó un buen partido.
Sin embargo, todo salió mal cuando llegamos al límite de 15 mensajes impuesto por Microsoft. Después de darle a Bing Chat el PGN de nuestro juego anterior, no pudo continuar jugando movimientos legales, de manera similar a como falló ChatGPT.