Meta AI heeft op 18 april 2024 Llama 3 uitgebracht, de meest geavanceerde versie van het door hen ontwikkelde grote taalmodel. Llama 3 is een groot taalmodel dat hoge prestaties levert in vergelijking met zijn concurrenten en is getraind met een dataset die is geselecteerd met speciale filtermethoden. Het Llama 3 model is er in twee verschillende groottes: 8B en 70B. Beide Llama 3 modellen zijn geschikt voor verschillende gebruikssituaties. Als je nieuwsgierig bent naar het Llama 3 model en je afvraagt hoe je er toegang toe kunt krijgen, dan hebben we dat voor je geregeld!

In dit artikel zullen we onderzoeken wat het Llama 3 model is en hoe je er toegang toe kunt krijgen.

Klaar? Laten we erin duiken!

TL; DR

  • De Llama 3 is een groot taalmodel ontwikkeld door Meta AI en aangekondigd op 18 april 2024.
  • Llama is verkrijgbaar in twee verschillende maten, aangepast aan drie verschillende gebruikssituaties: 8B en 70B.
  • Llama 3 gebruikt technologieën zoals natuurlijke taalverwerking (NLP), machinaal leren en diep leren om uitvoer te genereren.
  • Omdat het Llama 3 model open-source is, is het gratis te gebruiken.
  • Het Llama 3 model presteert in de meeste benchmarks beter dan concurrerende modellen zoals GPT-3.5 en Claude 3 Sonnet.
  • Het Llama 3 model is getraind met gegevens van hoge kwaliteit uit meer dan 30 talen.
  • Om toegang te krijgen tot het Llama 3 model moet je inloggen op je Meta AI account vanuit het land waar het beschikbaar is.

Wat is Llama 3?

Llama 3 is een Large Language Model (LLM) ontwikkeld door Meta AI met hogere prestaties dan zijn voorganger. Bij de aankondiging van Llama 3 verklaarde Meta AI dat het was getraind met verfijnde parameters. Het Llama 3 model is beter in redeneren, taalbegrip, snel lezen en coderen dan zijn voorganger. Meta AI wil met het Llama 3 model de volgende innovatiegolf in kunstmatige intelligentie starten.

Hoe toegang te krijgen tot Lama 3

Lama 3 Model Maten

Het Llama 3 model is verkrijgbaar in twee maten, aangepast aan verschillende gebruikssituaties. Het 8B model is ideaal om eenvoudige taken snel en nauwkeurig uit te voeren, terwijl het 70B model ontworpen is om grotere, complexere taken uit te voeren met resultaten van hoge kwaliteit. Beide modellen zijn getraind met meer dan 15T tokens, wat 7 keer meer is dan de tokens die gebruikt zijn om het Llama 2 model te trainen. Daarnaast hebben de Llama 3 modellen meertalige mogelijkheden, dankzij de training met niet-Engelse data van hoge kwaliteit.

lama 3 modelmaten

Hoe werkt Llama 3?

Het Llama 3 model genereert output met behulp van AI technologieën zoals Natural Language Processing (NLP), deep learning en machine learning. Het LLama 3 model analyseert de invoer die de gebruiker invoert met de getrainde gegevens en parameters, begrijpt de intentie van de gebruiker en genereert de uitvoer die het nodig heeft.

Het Llama 3 model is getraind met gegevens die door speciale filtersystemen zijn gegaan om veilige en geschikte uitvoer te garanderen. Dit omvat het gebruik van een NFSW filter, heuristisch filter, semantische ontdubbeling en tekstclassificator. Bovendien werd het Llama 2 model, dat voorafging aan het Llama 3 model, gebruikt bij het selecteren van de gegevens die gebruikt werden bij het trainen van het Llama 3 model, vanwege het succes bij het identificeren van gegevens van hoge kwaliteit.

Is Llama 3 gratis te gebruiken?

Meta AI heeft haar Llama modelseries altijd aangeprezen als open-source en gratis te gebruiken, en Llama 3 is daarop geen uitzondering. Aangezien de momenteel uitgebrachte Llama 3 8B en 70B modellen open-source zijn, kan iedereen deze modellen ervaren. Het is echter nog niet duidelijk of de Llama 3 400B, die zich nog in het trainingsproces bevindt en het meest geavanceerde lid van de Llama 3 serie is, vrij te gebruiken is.

Llama 3 Kenmerken

Llama 3 is uitgebracht met twee verschillende modellen die beter presteren dan hun concurrenten. De reden waarom deze twee modellen beter presteren dan hun concurrenten is dat ze zijn getraind met gegevens die zijn geïdentificeerd door middel van speciale filtering. Het Llama 3 model heeft unieke eigenschappen vergeleken met andere LLM's op de markt. Laten we de kenmerken van Llama 3 eens nader bekijken.

Prestaties en benchmarks

Zowel de Llama 3 8B als de Llama 3 70B hebben hogere scores in benchmarks zoals HumanEval, MMLU en DROP in vergelijking met hun concurrenten. Het Llama 3 70B model presteert bijvoorbeeld iets beter in de MMLU benchmark in vergelijking met de gelijkwaardige modellen Gemini Pro 1.5 en Claude 3 Sonnet. Het Llama 3 8B model presteert over het geheel genomen beter dan zijn concurrenten, de Gemma 7B en Mistral 7B modellen.

llama 3 prestaties en benchmarks

Bij de ontwikkeling van het Llama 3 model was het de bedoeling om hoge prestaties te laten zien in echte gebruikssituaties in plaats van laboratoriumtesten. Om deze reden heeft het Meta AI team een nieuwe menselijke evaluatieset van hoge kwaliteit ontwikkeld. Deze evaluatieset bestaat uit 1800 prompts voor 12 belangrijke gebruikssituaties. De prompts omvatten taken zoals advies vragen, coderen, brainstormen, creatief schrijven, vragen stellen, redeneren, herschrijven en samenvatten. Het LLama 3 model van Meta AI presteerde in deze tests beter dan zijn rivalen Claude Sonnet, GPT-3.5 en Mistral Medium.

Meta lama 3 voorstelling

Begrip opwekken

Omdat het Llama 3 model is getraind met behulp van supervised fine-tuning (SFT) en reinforcement learning with human feedback (RLHF), is het een succesvoller model in het volgen van aanwijzingen dan zijn voorganger. Tijdens het trainen van het Llama 3 model werd prioriteit gegeven aan het genereren van nuttige en veilige output.

5% van de getrainde gegevens van het Llama 3 model omvat grammatica, zinsbouw en creatief schrijven van hoge kwaliteit in meer dan 30 talen. Daarom kan het Llama 3 model de prompts van gebruikers in andere talen analyseren en de prompts van gebruikers in andere talen begrijpen.

Modelarchitectuur

Bij het trainen van het Llama 3 model is gebruik gemaakt van een transformatorarchitectuur die alleen decodert. Volgens het artikel van Meta AI gebruikt Llama 3 een tokenizer met een vocabulaire van 128K tokens die taal veel efficiënter codeert, wat leidt tot aanzienlijk betere prestaties van het model. Zowel de 8B als de 70B grootte van het Llama 3 model werden getraind in reeksen van 8.192 tokens.

LLAMA 3 modelarchitectuur

Meta AI gebruikte een combinatie van dataparallellisatie, modelparallellisatie en pijplijnparallellisatie om het Llama 3 model te trainen. Daarom is het doel om de werklast te verminderen en tegelijkertijd de verwerkingssnelheid van het Llama 3 model op GPU's te verhogen. Het systeem waarop het Llama 3 model het meest effectief werkt is 400 TFLOPS per GPU. Het Llama 3 model maakt gebruik van foutdetectie-, afhandelings- en onderhoudssystemen om de GPU-snelheid tijdens het draaien te maximaliseren.

Hoe krijg ik toegang tot Llama 3?

Het Llama 3 model is een effectieve oplossing voor het uitvoeren van kleinschalige taken. De belangrijkste voordelen zijn dat het beter presteert dan de modellen Claude Sonnet en GPT-3.5 en dat het open-source is. Laten we eens kijken hoe je toegang krijgt tot Llama 3.

Ervaar Llama 3 op Meta AI 

Je kunt toegang krijgen tot het Llama 3 model via Meta AI. Je hoeft alleen maar naar de officiële website van Meta AI te gaan, een account aan te maken en toestemming voor toegang te vragen. Het Llama 3 model is buiten de VS echter alleen beschikbaar in Australië, Canada, Ghana, Jamaica, Malawi, Nieuw-Zeeland, Nigeria, Pakistan, Singapore, Zuid-Afrika, Oeganda, Zambia en Zimbabwe. Als je niet tot een van de genoemde landen behoort, zie je de melding "Meta AI is nog niet beschikbaar in jouw land".

Een blauw-witte cirkel met zwarte tekstBeschrijving automatisch gegenereerd