OpenAI, que ha hecho una gran contribución al desarrollo de chatbots de IA y grandes modelos lingüísticos, anunció su modelo más avanzado y nuevo, el GPT-4o, el 13 de mayo de 2024. El modelo GPT-4o tiene mayor rendimiento y velocidad que sus predecesores y una mayor variedad de usos. El modelo GPT-4o proporciona una respuesta mucho más rápida al resolver el problema de la velocidad, que era el mayor inconveniente de sus predecesores.
En este artículo examinaremos el modelo GPT-4o y lo compararemos con el GPT-4.
Si estás preparado, ¡empecemos!
TL; DR
- El modelo GPT-4o fue anunciado por OpenAI el 13 de mayo de 2024, y es una IA multimodal.
- Con GPT-4o, puedes procesar rápidamente entradas textuales, visuales y de audio y generar salidas.
- El modelo GPT-4o es más rápido y más económico que su predecesor, el modelo GPT-4.
- El modelo GPT-4o superó al modelo GPT-4 en pruebas de referencia como MMLU y HumanEval.
- A diferencia del modelo GPT-4, el modelo GPT-4o tiene capacidad de visión.
- El modelo GPT-4o se entrenó con datos en línea hasta octubre de 2023 y, a diferencia del GPT-4, no tiene función de acceso web.
- Si buscas un asistente de IA multifuncional que te permita experimentar el modelo GPT-4o, ZenoChat de TextCortex está diseñado para ti.
¿Qué es la GPT-4o?
El modelo GPT-4o es el último y más avanzado modelo de IA de OpenAI, basado en el modelo GPT-4 Turbo y anunciado el 13 de mayo de 2024. El modelo GPT-4o también tiene un mayor rendimiento en áreas como la velocidad de salida, la calidad de las respuestas y los idiomas admitidos, de los que carecía su predecesor. El modelo GPT-4o puede generar resultados de mayor calidad, gramaticalmente correctos y concisos, no sólo en inglés, sino también en idiomas distintos del inglés.
¿Qué hay de nuevo en GPT-4o?
La mayor diferencia del modelo GPT-4o respecto a sus predecesores es que utiliza una sola red neuronal en lugar de redes neuronales separadas para procesar distintos tipos de datos de entrada. De este modo, a diferencia de sus predecesores, el modelo GPT-4o puede detectar ruidos de fondo, multiparlantes y tonos emocionales en las entradas y añadirlos al proceso de generación de salidas.
¿Cómo acceder a GPT-4o?
Si tienes una cuenta ChatGPT, puedes acceder libremente al modelo GPT-4o. Para garantizar que el modelo GPT-4o pueda ser experimentado por todos los usuarios, OpenAI lo ha puesto a disposición tanto de los usuarios Gratuitos como de los Plus. Sin embargo, si tienes una cuenta ChatGPT Plus, podrás experimentar el modelo GPT-4o 5 veces más.
La forma personalizable y sofisticada de acceder al modelo GPT-4o es experimentarlo a través de ZenoChat. ZenoChat es una IA conversacional desarrollada por TextCortex que ofrece a sus usuarios funciones avanzadas de IA, templates, y diferentes grandes modelos lingüísticos. Con ZenoChat, puedes experimentar tanto el modelo GPT-4o como modelos como Claude 3 Opus y Sophos-2.
GPT-4o Precios (API)
No necesitas pagar ninguna cuota para acceder y experimentar el modelo GPT-4o. ChatGPT ofrece un modelo GPT-4o con creación limitada como modelo por defecto. Sin embargo, si quieres utilizar el modelo GPT-4o 5 veces más, necesitas adquirir su suscripción Plus, que cobra 20 $ al mes.
Si quieres utilizar el modelo GPT-4o como API, pagarás la mitad que por el anterior modelo más avanzado de OpenAI, el GPT-4T. Además, el modelo GPT-4o es 2 veces más rápido que el GPT-4T. Mientras que el modelo GPT-4o cobra 5$ por cada 1 millón de tokens de entrada, cobra 15$ por cada 1 millón de tokens de salida.
Comparación GPT-4 vs. GPT-4o de OpenAI
El modelo GPT-4o de OpenAI se anunció con interesantes características y consiguió superar a su predecesor, el GPT-4, en la mayoría de los benchmarks. Comparemos los modelos GPT-4 y GPT-4o y descubramos sus similitudes y diferencias.
Rendimiento
Según el artículo de OpenAI sobre el GPT-4o, el modelo GPT-4o es compatible con los modelos GPT-4 y GPT-4T con MMLU (88,7%), GPQA (53,6%), MATH (76,6%), HumanEval (90,2%), MGSM (90,5%) consiguiendo superar sus puntos de referencia. Por ejemplo, el modelo GPT-4o tiene una puntuación del 53,6% en la prueba de referencia GPQA, mientras que su predecesor, el modelo GPT-4, tiene una puntuación del 35,7%.
Además, aunque el modelo GPT-4o consiguió superar a su predecesor, el modelo GPT-4, con una puntuación del 83,4% en la prueba de referencia DROP, quedó por detrás del modelo GPT-4 Turbo, con una puntuación del 86,0%. En otras palabras, el modelo GPT-4T tiene mayor rendimiento que el GPT-4o en tareas avanzadas de codificación y razonamiento.
Tareas multilingües
Otro punto en el que el modelo GPT-4o supera a su predecesor, el GPT-4, y compensa sus deficiencias es en las tareas multilingües. El modelo GPT-4o ha sido entrenado por OpenAI para tener un mayor rendimiento y una generación de resultados más concisa en tareas que no sean en inglés. El modelo GPT-4o tiene un mayor rendimiento tanto en tareas multilingües como de visión, especialmente en afrikáans, chino, italiano, javanés y portugués. En otras palabras, el modelo GPT-4o puede procesar lenguas no inglesas, tanto en texto como en imágenes, con mayor rendimiento que GPT-4.
Capacidades de visión
Como el modelo GPT-4 no tiene capacidades de Visión, el modelo GPT-4o es una mejor opción para las tareas visuales que el GPT-4. Sin embargo, GPT-4o tiene un mayor rendimiento de comprensión, procesamiento y análisis de la visión que GPT-4T, que es el gran modelo lingüístico de OpenAI con capacidades de visión. Además, el modelo GPT-4o puede procesar entradas visuales mucho más rápido y generar salidas relacionadas que el modelo GPT-4 Turbo.
Límites de velocidad y tasa de salida
El mayor problema del modelo GPT-4 es su menor velocidad de salida en comparación con los modelos Claude 3 Opus y Gemini Ultra. El modelo GPT-4o consiguió superar a los dos modelos rivales y al modelo GPT-4 generando una respuesta de 488 palabras en 12 segundos. El modelo GPT-4 necesita aproximadamente 1 minuto y 10 segundos para generar una respuesta de 488 palabras. Además, el modelo GPT-4 Turbo, que destaca por su gran velocidad, necesita 24 segundos para generar una salida de 488 palabras.
El modelo GPT-4o es una nueva referencia no sólo en velocidad de salida de texto, sino también de voz. El modelo GPT-4o proporciona salida de audio en 320 segundos. Una persona normal hace una pausa de 250 milisegundos para responder en inglés. Eso convierte al modelo GPT-4o en una inteligencia artificial que habla más rápido y con más fluidez que los humanos.
Datos de entrenamiento y acceso web
Uno de los únicos puntos en los que el modelo GPT-4 es mejor que el GPT-4o es su acceso web. El modelo GPT-4o tiene actualmente una ventana de contexto de 128K y datos en línea accesibles públicamente hasta octubre de 2023. En otras palabras, el modelo GPT-4o no puede generar resultados sobre cuestiones actuales. Eso hace que GPT-4o sea inútil para tareas relacionadas con el marketing, el SEO y la investigación.
Una forma mejor de utilizar GPT-4o: ZenoChat
Si buscas un asistente de IA que pueda acceder al modelo GPT-4o y combinarlo con funciones avanzadas de IA, ZenoChat de TextCortex está diseñado para ti. Con sus funciones avanzadas de IA, varios grandes modelos lingüísticos (incluido el GPT-4o) y la IA templates, ZenoChat pretende reducir la carga de trabajo de sus usuarios tanto en las tareas cotidianas como en las profesionales y aumentar su eficacia. ZenoChat está disponible como aplicación web y navegador extension. El navegador TextCortex extension está integrado con más de 30.000 sitios web y aplicaciones para ser tu soporte de bolsillo con potentes LLM bajo el capó.
¿Cómo utilizar GPT-4o a través de ZenoChat?
Acceder al modelo GPT-4o con ZenoChat es un proceso sencillo y directo. Sólo tienes que crear tu cuenta gratuita en TextCortex , dirigirte a la aplicación web TextCortex , hacer clic en ZenoChat en el menú de la izquierda y seleccionar GPT-4o como LLM en la configuración del chat. Además, los grandes modelos lingüísticos que puedes utilizar a través de ZenoChat son;
- GPT-4o
- Claude 3 Opus
- Soneto Claude 3
- Claude 3 Haiku
- GPT-4
- Sophos 2
- Llama 3
- Mixtral