Meta AI lanzó Llama 3, la versión más avanzada del gran modelo lingüístico que desarrollaron, el 18 de abril de 2024. Llama 3 es un gran modelo lingüístico que tiene un alto rendimiento en comparación con sus competidores y se entrena con un conjunto de datos seleccionados con métodos especiales de filtrado. El modelo Llama 3 está disponible en dos tamaños diferentes: 8B y 70B. Ambos modelos Llama 3 son adecuados para diferentes casos de uso. Si sientes curiosidad por el modelo Llama 3 y te preguntas cómo puedes acceder a él, ¡te lo explicamos!

En este artículo examinaremos qué es el modelo Llama 3 y cómo puedes acceder a él.

¿Preparados? ¡Vamos a sumergirnos!

TL; DR

  • La Llama 3 es un gran modelo lingüístico desarrollado por Meta AI y anunciado el 18 de abril de 2024.
  • Llama viene en dos tamaños diferentes adaptados a tres casos de uso distintos: 8B y 70B.
  • Llama 3 utiliza tecnologías como el procesamiento del lenguaje natural (NLP), el aprendizaje automático y el aprendizaje profundo para generar resultados.
  • Como el modelo Llama 3 es de código abierto, su uso es gratuito.
  • El modelo Llama 3 tiene un rendimiento superior en la mayoría de los puntos de referencia que sus modelos rivales, como GPT-3.5 y Claude 3 Sonnet.
  • El modelo Llama 3 se entrenó utilizando datos de alta calidad de más de 30 idiomas.
  • Para acceder al modelo Llama 3, debes conectarte a tu cuenta Meta AI desde el país donde esté disponible.

¿Qué es Llama 3?

Llama 3 es un Gran Modelo Lingüístico (LLM) desarrollado por Meta AI con un rendimiento superior al de su predecesor. Al anunciar Llama 3, Meta AI declaró que había sido entrenado con parámetros afinados. El modelo Llama 3 ha mejorado el razonamiento, la comprensión del lenguaje, la lectura rápida y las habilidades de codificación en comparación con su predecesor. Meta AI pretende iniciar la próxima ola de innovación en inteligencia artificial con el modelo Llama 3.

Cómo acceder a Llama 3

Tamaños de modelo de Llama 3

El modelo Llama 3 está disponible en dos tamaños, adaptados a diferentes casos de uso. El modelo 8B es ideal para completar tareas sencillas con rapidez y precisión, mientras que el modelo 70B está diseñado para manejar tareas más grandes y complejas con resultados de alta calidad. Ambos modelos se han entrenado con más de 15T de tokens, es decir, 7 veces más que los tokens utilizados para entrenar el modelo Llama 2. Además, los modelos Llama 3 tienen capacidades multilingües, gracias a que han sido entrenados con datos de alta calidad en otros idiomas.

llama 3 tamaños de modelo

¿Cómo funciona Llama 3?

El modelo Llama 3 genera salidas utilizando tecnologías de IA como el Procesamiento del Lenguaje Natural (NLP), el aprendizaje profundo y el aprendizaje automático. El modelo Llama 3 analiza las entradas introducidas por el usuario con sus datos y parámetros entrenados, comprende la intención del usuario y genera las salidas que necesita.

El modelo Llama 3 se ha entrenado utilizando datos que han pasado por sistemas de filtrado especiales para garantizar un resultado seguro y adecuado. Esto incluye el uso de un filtro NFSW, un filtro heurístico, un enfoque semántico deduplicado y un clasificador de texto. Además, el modelo Llama 2, que precedió al modelo Llama 3, se utilizó para seleccionar los datos utilizados en el entrenamiento del modelo Llama 3, debido a su éxito en la identificación de datos de alta calidad.

¿Usar Llama 3 es gratis?

Meta AI siempre ha anunciado su serie de modelos Llama como de código abierto y uso gratuito, y Llama 3 no es una excepción. Dado que los modelos Llama 3 8B y 70B actualmente publicados son de código abierto, cualquiera puede experimentar con estos modelos. Sin embargo, aún no está claro si la Llama 3 400B, que aún está en proceso de formación y es el miembro más avanzado de la serie Llama 3, es de uso libre.

Llama 3 Características

Llama 3 se lanzó con dos modelos diferentes que tienen un rendimiento superior al de sus competidores. La razón por la que estos dos modelos tienen un rendimiento superior al de sus competidores es que han sido entrenados con datos identificados mediante un filtrado especial. El modelo Llama 3 tiene características únicas en comparación con otros LLM del mercado. Veamos con más detalle las características de Llama 3.

Rendimiento y puntos de referencia

Tanto el modelo Llama 3 8B como el Llama 3 70B obtienen puntuaciones más altas en pruebas comparativas como HumanEval, MMLU y DROP en comparación con sus competidores. Por ejemplo, el modelo Llama 3 70B tiene un rendimiento ligeramente superior en el punto de referencia MMLU en comparación con sus modelos equivalentes Gemini Pro 1,5 y Claude 3 Sonnet. El modelo Llama 3 8B tiene un rendimiento global superior al de sus competidores, los modelos Gemma 7B y Mistral 7B.

rendimiento y pruebas comparativas de la llama 3

Al desarrollar el modelo Llama 3, se pretendía demostrar un alto rendimiento en casos de uso de la vida real, más que en pruebas en entornos de laboratorio. Por esta razón, el equipo de Meta AI ha desarrollado un nuevo conjunto de evaluación humana de alta calidad. Este conjunto de evaluación consta de 1.800 preguntas que cubren 12 casos de uso clave. Las preguntas incluyen tareas como pedir consejo, codificación, lluvia de ideas, escritura creativa, preguntas y respuestas, razonamiento, reescritura y resumen. El modelo LLama 3 de Meta AI mostró un rendimiento superior en estas pruebas en comparación con sus rivales Claude Sonnet, GPT-3.5 y Mistral Medium.

Actuación de Meta llama 3

Promover la comprensión

Como el modelo Llama 3 se entrena utilizando el ajuste fino supervisado (SFT) y el aprendizaje por refuerzo con retroalimentación humana (RLHF), es un modelo más exitoso en el seguimiento de indicaciones que su predecesor. Al entrenar el modelo Llama 3, se dio prioridad a generar resultados útiles y seguros.

El 5% de los datos entrenados del modelo Llama 3 abarca gramática, estructura de frases y escritura creativa de alta calidad en más de 30 idiomas. Por eso, el modelo Llama 3 puede analizar las indicaciones del usuario en otras lenguas y comprender las indicaciones de los usuarios en otras lenguas.

Arquitectura Modelo

En el entrenamiento del modelo Llama 3 se utilizó una arquitectura de transformador de sólo decodificador. Según el artículo de Meta AI, Llama 3 utiliza un tokenizador con un vocabulario de 128K tokens que codifica el lenguaje de forma mucho más eficiente, lo que mejora sustancialmente el rendimiento del modelo. Tanto el tamaño de 8B como el de 70B del modelo Llama 3 se entrenaron con secuencias de 8.192 tokens.

Arquitectura del modelo LLAMA 3

Meta AI utiliza una combinación de paralelización de datos, paralelización de modelos y paralelización de canalizaciones para entrenar el modelo Llama 3. Por tanto, su objetivo es reducir la carga de trabajo al tiempo que aumenta la velocidad de procesamiento del modelo Llama 3 en las GPU. El sistema en el que el modelo Llama 3 funciona con mayor eficacia es de 400 TFLOPS por GPU. El modelo Llama 3 utiliza sistemas de detección, tratamiento y mantenimiento de errores para maximizar la velocidad de la GPU mientras se ejecuta.

¿Cómo acceder a Llama 3?

El modelo Llama 3 es una solución eficaz para realizar tareas a pequeña escala. Sus principales ventajas son que supera a los modelos Claude Sonnet y GPT-3.5 y que es de código abierto. Veamos más detenidamente cómo acceder a Llama 3.

Experimenta Llama 3 en Meta AI 

Puedes acceder al modelo Llama 3 a través de Meta AI. Todo lo que tienes que hacer es dirigirte al sitio web oficial de Meta AI, crear una cuenta y solicitar permiso de acceso. Sin embargo, el modelo Llama 3 sólo está disponible fuera de EE.UU. en Australia, Canadá, Ghana, Jamaica, Malawi, Nueva Zelanda, Nigeria, Pakistán, Singapur, Sudáfrica, Uganda, Zambia y Zimbabue. Si no eres uno de los países mencionados, verás el mensaje "Meta AI aún no está disponible en tu país".

Un círculo azul y blanco con texto negroDescripción generada automáticamente