Si crees que ChatGPT no puede crecer más, no podrías estar más equivocado. De hecho, OpenAI sólo está calentando motores.

Después de que el lanzamiento de ChatGPT causara un gran revuelo en Internet (y puedes comprobar que esta tendencia sigue vigente), surgió una nueva moda que despertó la curiosidad y el interés de la comunidad de AI .

Podríamos decir que la gente aún no se ha adaptado a las capacidades de la GPT-3 y la GPT-3.5 o no las ha comprendido del todo, pero han circulado rumores por Internet de que la GPT-4 está en el horizonte.

Y también hay buenas noticias.

En este artículo hablaremos de qué es la GPT-4, resumiremos lo que se sabe actualmente sobre ella y presentaremos nueva información sobre cuándo y cómo obtener este potente modelo AI .

No se pierdan la oportunidad.

¿Qué es la GPT-4?

gpt-4-homepage-open-ai

En su informe técnico, OpenAI describe GPT-4 como un gran modelo multimodal que puede tomar texto e imágenes y convertirlos en texto. 

Además, argumentaron que el estudio de dichos modelos es crucial debido a la gran variedad de aplicaciones que encuentran en el mundo real, como:

  • Sistemas de diálogo
  • Resumen de texto
  • Traducción automática

Por eso estos modelos han recibido tanta atención y se han desarrollado tan rápidamente en los últimos años.

casa-de-web-3-informe-twitter-post

Para explicarlo mejor, OpenAI afirma que la mejora de la comprensión y producción del lenguaje natural es una de las principales motivaciones para desarrollar esos modelos.

Sobre todo en situaciones más matizadas y complejas.

¿Cómo funciona la GPT-4?

Para predecir el siguiente token en un documento, GPT-4 es un modelo de tipo Transformador que tiene en cuenta ambos:

  • Información de libre acceso al público, como los datos que se encuentran en Internet, y
  • Información licenciada de fuentes externas.

A continuación, el modelo se afinó con la aportación humana y el aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF).

Y, dado el alto nivel de competencia y los riesgos inherentes a la explotación de un gran modelo como el GPT-4, es comprensible que el informe no profundice en la arquitectura.

En otras palabras, los siguientes detalles no están disponibles en el informe de OpenAI:

  • El tamaño del modelo
  • Hardware
  • Cálculo de entrenamiento
  • Construcción del conjunto de datos
  • Método de entrenamiento, etc.

Sin embargo, hay datos clave que pueden arrojar luz sobre las capacidades del GPT-4 con mayor detalle.

Por ejemplo, OpenAI revela que GPT-4 se sometió a una serie de pruebas desarrolladas para humanos para determinar cómo se desenvolvería en escenarios similares.

Curiosamente, la GPT-4 sale razonablemente bien parada en estas pruebas, a veces incluso "haciendo un mejor trabajo" que la inmensa mayoría de las personas.

GPT-4, por ejemplo, se sitúa en el 10% de los mejores examinados porque obtuvo una puntuación perfecta en su simulacro de examen de abogacía.

Por otra parte, GPT-3.5 se sitúa en el 10% inferior.

Pero exploremos un poco más las capacidades de la GPT-4.

Capacidades del GPT-4

En esta sección cubriremos los 3 aspectos críticos de las capacidades de GPT-4 que se demostraron a través de diferentes conjuntos de pruebas.

Vamos a sumergirnos.

1. GPT-4 frente a las pruebas en humanos

Pruebas humanas simuladas de OpenAI para GPT-4: pruebas de origen público con preguntas de examen de opción múltiple y de respuesta libre.

Algunas sugerencias de categorías específicas incluían también elementos visuales.

Además, los resultados se basaban en exámenes prácticos no publicados y en las puntuaciones de los participantes en los exámenes de validación.

La puntuación total de cada prueba se calculó sumando los resultados de las opciones múltiples y las respuestas libres.

La mayoría de estas pruebas estandarizadas son lo bastante sencillas como para que un humano las supere.

Pero, sorpresa, sorpresa: el GPT-4 se sitúa en el 10% superior de todos los presentados a una versión práctica del Examen Uniforme de la Abogacía.

Impresionante, ¿verdad?

Además, parece que la destreza del modelo en la realización de pruebas es en gran medida producto de la fase de preentrenamiento y que el RLHF apenas influye en ella.

De hecho, el modelo RLHF tiene un rendimiento similar en las preguntas de opción múltiple que el modelo básico GPT-4 en todos nuestros exámenes de prueba.

Pero ahora las cosas empiezan a ponerse interesantes.

2. GPT-4 frente a GPT3.5

Utilizando las mismas métricas estándar del sector para evaluar los modelos lingüísticos, OpenAI también probó el modelo de referencia GPT-4.

Para determinar si los datos de prueba estaban incluidos en el conjunto de entrenamiento, utilizaron indicaciones de pocos disparos para todos los puntos de referencia GPT-4 y comprobaron si cada punto de referencia notificado estaba contaminado.

En su mayor parte GPT-4 supera tanto los modelos lingüísticos actuales como los sistemas históricos de vanguardia (SOTA), que normalmente se han escrito o entrenado según puntos de referencia específicos.

Además, la GPT-4 ha mejorado mucho respecto a sus predecesoras en cuanto a la comprensión de la intención del usuario.

gpt-4-vs-gpt-3-5

Es más, GPT-4 superó a GPT-3. 5 por un margen significativo(70,2% puntos) en un conjunto de 5.214 preguntas enviadas a través de ChatGPT y la OpenAI API.

Y para evaluar modelos como el GPT-4, OpenAI está desarrollando Evals7, un marco para crear y ejecutar puntos de referencia que examinan el rendimiento de los modelos muestra a muestra.

Evals es compatible con los puntos de referencia actuales, lo que permite controlar el rendimiento del modelo en el mundo real.

La buena noticia es que OpenAI pretende aumentar gradualmente la variedad de estos puntos de referencia para representar mejor una gama más amplia de problemas potenciales y un conjunto de tareas más desafiantes.

3. GPT-4 vs Entradas visuales

Además de la opción de sólo texto, GPT-4 puede ser instruido para realizar cualquier tarea imaginable de lenguaje o visión mediante indicaciones de imagen.

El modelo crea salidas textuales basadas en entradas que pueden incluir cualquier combinación de texto e imágenes.

En otras palabras, GPT-4 muestra las mismas capacidades en múltiples dominios que en entradas de sólo texto.

Eso incluye los documentos mixtos que contienen texto e imágenes, como texto y fotografías, diagramas o capturas de pantalla.

gpt-4-visual

Los métodos en tiempo de prueba, como el estímulo de pocos disparos y la cadena de pensamiento, desarrollados originalmente para modelos lingüísticos, son igual de eficaces cuando se emplean imágenes y texto.

Pero, a pesar de sus puntos fuertes, GPT-4 comparte las mismas debilidades que las versiones anteriores de GPT

Una de esas debilidades es que no es completamente fiable ("alucina" con los hechos y comete errores de razonamiento). 

Sin embargo, en comparación con los modelos GPT-3.5, la GPT-4 reduce en gran medida las alucinaciones: puntúa 19% puntos más que la última GPT-3.5 en las evaluaciones de factualidad internas de OpenAI, diseñadas de forma adversaria.

GPT-4 Métricas y limitaciones de seguridad

OpenAI introdujo mejoras significativas en muchas de las funciones de seguridad de la GPT-4, entre ellas:

  • GPT-4 tiene un 82% menos de probabilidades de responder a solicitudes de contenidos no permitidos que GPT-3.5. 
  • De acuerdo con las normas de OpenAI, es un 29% más probable que GPT-4 responda a preguntas delicadas como "cómo hacerse daño" o "cómo obtener ayuda médica". 
  • En el conjunto de datos RealToxicityPrompts, GPT-4 sólo hace contenido tóxico el 0,73% de las veces, mientras que GPT-3.5 lo hace el 6,48% de las veces.
gpt-4-prompt-ejemplos

Aunque OpenAI hace más difícil influir en las personas para que se porten mal, sigue siendo posible hacerlo. 

En el informe ponían el ejemplo de los "jailbreaks" como mensaje del sistema adversario, que aún puede utilizarse para crear contenidos que infrinjan sus normas. 

Sin embargo, señalan que es crucial combinar estas limitaciones con medidas de seguridad en tiempo de despliegue, como la supervisión de los abusos y una canalización para la rápida mejora iterativa del modelo.

Puntos clave de OpenAI en la GPT-4

Y, por último, el informe técnico de OpenAI para la GPT-4 destacó varios puntos clave que debes recordar cuando establezcas objetivos para este potente modelo. 

Algunos ejemplos son los siguientes:

✔️ El GPT-4 es un modelo grande y multimodal que rinde tan bien como los humanos en rígidas pruebas de referencia profesionales y académicas.

✔️ GPT-4 supera a los grandes modelos lingüísticos y a la mayoría de los sistemas más avanzados en varias tareas de NLP (que suelen incluir un ajuste fino específico de la tarea).

✔️ Aunque se mide en inglés, la mejora de las habilidades GPT-4 puede demostrarse en muchos idiomas.

✔️ El escalado predecible puede predecir con exactitud la pérdida y las acciones de GPT-4.

✔️ Las capacidades de la GPT-4 aumentan sus riesgos.

✔️ Proporcionaron métodos y resultados para mejorar su seguridad y alineación.

✔️ GPT-4 es un paso importante hacia sistemas AI seguros y generalizados.

Y, por último, no olvidemos la información más importante: la fecha de lanzamiento de la GPT-4.

GPT-4 Fecha de publicación

OpenAI declaró el lanzamiento de su modelo masivo multimodal GPT-4 el 14 de marzo

Los usuarios declararon haber creado versiones casi perfectas de Tetris, Conecta Cuatro, Snake y Pong en las primeras horas tras el lanzamiento, simplemente pidiendo al chatbot que generara código.

javi-lopez-twitter-post

Sin embargo, la GPT-4 sólo está disponible para quienes pagan 20 $ al mes por una suscripción ChatGPT Plus, que concede a los usuarios acceso exclusivo al modelo lingüístico de OpenAI. 

Asimismo, debes saber que incluso con esta suscripción, habrá un límite de 100 mensajes por usuario cada 4 horas, por lo que es posible que tengas un acceso limitado.

La última palabra

Aunque aquí sólo se trata una pequeña parte del informe de OpenAI sobre la GPT-4, esperamos que sea suficiente para que sigas el camino correcto (al menos hasta nuevas actualizaciones).

La GPT-4 seguirá avanzando, y veremos hazañas aún más notables en el futuro.

Sin embargo, aunque el potencial de este módulo AI es incuestionablemente vasto, también es difícil negar que de vez en cuando da miedo.

También es importante reconocer las herramientas disponibles actualmente en AI que, a pesar de los cambios inevitables que conllevan estos avances, se atreven a mantenerse al día sin dejar de ser fieles a sus intenciones originales.

Una de estas herramientas es el complementoTextCortex .

¿Qué es TextCortex?

TextCortex es una herramienta de redacción de inteligencia artificial (AI) construida sobre el concepto de módulos de casos de uso para ayudar a los redactores a generar ideas y producir contenidos de alta calidad.

Su objetivo principal es ayudar a los escritores a superar el bloqueo del escritor ofreciéndoles herramientas como:

✒️ Herramienta de reescritura - Proporciona ayuda para reescribir, resumir, alterar el tono, traducir y otros aspectos de la paráfrasis.

✒️ Función de formato largo - Te permite generar un blog post de hasta 300 palabras a partir de una sola idea de cinco palabras.

✒️ Viñetas a correo electrónico - Te permite convertir fácilmente tus viñetas en mensajes de correo electrónico formateados.

✒️ Modo Zeno - A partir de tu borrador inicial, producirá los resultados más pertinentes.

✒️ Funciones de lluvia de ideas - Categoría de funciones diseñadas para que empieces a escribir.

✒️ AI templates - Crea fácilmente cualquier contenido a partir de palabras clave y predefinidas templates.

✒️ Zeno chat - Chatea con nuestro redactor de IA y obtén los resultados que deseas.

¿Por qué planteárselo?

👍 Ofrecemos una cuenta freemium con 10 creaciones diarias gratuitas.

👍 No necesitas proporcionar información de tu tarjeta de crédito para registrarte.

👍 Nuestras soluciones ya dan servicio con éxito a más de 10.000 usuarios.

👍 Prometemos planes premium asequibles para las actualizaciones.

¿Te interesa que te lleven gratis?

Descarga nuestro Chrome extension para ver cómo TextCortex puede transformar fácilmente tus escritos en contenidos convincentes y eficaces en más de 2000 plataformas, a partir de hoy.