GPT-4 hace historia y consigue superar el test de Turing con unos números muy superiores a los de la competencia

Hace un mes, OpenAI revolucionó el sector de la inteligencia artificial con la presentación de GPT-4o, la versión más ambiciosa de ChatGPT hasta la fecha. Aunque este anuncio estuvo rodeado de polémica a raíz de la revelación de la intérprete Scarlett Johansson, aquellos que han probado las virtudes del modelo de lenguaje coinciden en su análisis: es el salto más potente de OpenAI hasta la fecha. Y, de hecho, una buena prueba de ello es su resultado en el test de Turing, una prueba que determina hasta qué punto una IA es capaz de hacerse pasar por un humano.

En 3D Juegos

¿Debo pagar para crear una página web o es gratis? Te contamos qué es un host y por qué es mejor una opción de pago que una gratuita

Como señala el portal Geise en una reciente publicación, GPT-4 ha conseguido superar exitosamente el citado test. En diciembre del año pasado, el bot ya había conseguido buenos resultados, pero no todos los modelos de lenguaje de OpenAI habían conseguido quedar por delante de ELIZA (una inteligencia artificial nacida en la década de los 60). Sin embargo, para fortuna tanto de la compañía como de los desarrolladores que han entrenado al citado bot, el resultado ha dado un giro de 180º poco más de medio año después.

Nadie está a la altura de ChatGPT

Según recoge la noticia original, GPT-4 pasó la prueba con un total de 54% considerándolo humano. En esencia, el test de Turing consiste en poner a un humano hablando con una IA para determinar si los primeros son capaces de averiguar que están hablando con una máquina. Tras GPT-4 se situó GPT-3.5, el segundo modelo de lenguaje más avanzado de la compañía que logró un 50% de éxito. ELIZA, por su parte, disfrutó de un modesto 22%, una cifra muy meritoria si tenemos en cuenta que se trata de una inteligencia artificial que cuenta con 60 años de existencia a sus espaldas.

La muestra consistió en 101 juegos con humanos y GPT-3.5 y 100 rondas con GPT-4 y ELIZA. La edad promedio de los participantes, como curiosidad, fue de 35 años. Además, el 36% de los interrogadores preguntó por aspectos como detalles personales o actividades diarias para saber si eran capaces de “pillar” a la IA. Sin embargo, esta superó con éxito más de la mitad de las pruebas, un aspecto sorprendente si tenemos en cuenta que los interrogadores basaron sus decisiones en aspectos como el estilo de lenguaje (un 43%) o factores socioemocionales (24%).

En 3DJuegos | ¿Es peligroso aceptar las cookies? Te contamos qué tipos hay y cómo puedes proteger tus datos gracias a las VPN

En 3DJuegos | Square Enix ha cambiado de opinión. Antes decía que iban a ser agresivos para implementar en sus juegos la IA, ahora están en alerta sobre su uso

Imagen principal de Solen Feyissa (Unsplash)

GPT-4 hace historia y consigue superar el test de Turing con unos números muy superiores a los de la competencia

El modelo de lenguaje de OpenAI supera también a GPT-3.5, el otro LLM de la compañía

Nadie está a la altura de ChatGPT

20 JEFES CONTRA LOS QUE ES IMPOSIBLE PERDER