Als je denkt dat ChatGPT niet verder kan groeien, heb je het helemaal mis. In feite is OpenAI nog maar aan het opwarmen.

Nadat de release van ChatGPT online opschudding veroorzaakte (en je kunt zien dat deze trend nog steeds aanhoudt), ontstond er een nieuwe rage om de nieuwsgierigheid en belangstelling van de AI gemeenschap te wekken.

We zouden kunnen zeggen dat men zich nog niet heeft aangepast aan of de mogelijkheden van GPT-3 en GPT-3.5 nog niet volledig heeft begrepen, maar online doen geruchten de ronde dat GPT-4 in aantocht is.

En er is ook goed nieuws.

In dit artikel bespreken we wat GPT-4 is, vatten we samen wat er momenteel over bekend is, en presenteren we nieuwe informatie over wanneer en hoe je dit krachtige AI model kunt verkrijgen.

Blijf op de hoogte!

Wat is GPT-4?

gpt-4-homepage-open-ai

In hun technische rapport beschrijft OpenAI GPT-4 als een groot multimodaal model dat tekst en afbeeldingen kan opnemen en er tekst van kan maken. 

Verder betoogden ze dat het bestuderen van dergelijke modellen cruciaal is vanwege de grote verscheidenheid aan toepassingen die ze in de echte wereld vinden, zoals:

  • Dialoogsystemen
  • Tekstsamenvatting
  • Automatische vertaling

Daarom hebben deze modellen de afgelopen jaren zoveel aandacht gekregen en zich zo snel ontwikkeld.

huis-van-web-3-verslag-twitter-.post

Om het verder uit te werken, beweert OpenAI dat een beter begrip en productie van natuurlijke taal een primaire motivatie is voor de ontwikkeling van dergelijke modellen.

Vooral in meer genuanceerde en complexe scenario's.

Hoe werkt GPT-4?

Om het volgende token in een document te voorspellen, is GPT-4 een Transformer-achtig model dat met beide rekening houdt:

  • Informatie die vrij toegankelijk is voor het publiek, zoals online gevonden gegevens, en
  • Informatie in licentie uit externe bronnen.

Het model werd vervolgens verfijnd met menselijke input en reinforcement learning from human feedback (RLHF).

En gezien de grote concurrentie en de inherente risico's van een groot model als GPT-4, is het begrijpelijk dat het verslag niet dieper ingaat op de architectuur.

Met andere woorden, de volgende details zijn niet beschikbaar in het rapport van OpenAI:

  • De grootte van het model
  • Hardware
  • Training berekenen
  • Bouw van de dataset
  • Trainingsmethode, enz.

Er zijn echter belangrijke gegevens die de mogelijkheden van de GPT-4 nader kunnen belichten.

OpenAI onthult bijvoorbeeld dat GPT-4 een reeks tests onderging die voor mensen waren ontwikkeld om te bepalen hoe het zou gaan in soortgelijke scenario's.

Interessant is dat GPT-4 het redelijk goed doet op deze tests, soms zelfs "het beter doet" dan de overgrote meerderheid van de mensen.

GPT-4, bijvoorbeeld, staat in de top 10% van de proefpersonen omdat ze een perfecte score haalde op haar proefexamen.

GPT-3.5 staat daarentegen in de onderste 10%.

Maar laten we de mogelijkheden van de GPT-4 eens wat verder onderzoeken.

GPT-4 Mogelijkheden

In dit deel behandelen we de 3 kritische aspecten van de GPT-4 mogelijkheden die door verschillende testsets zijn aangetoond.

Laten we erin duiken!

1. GPT-4 versus menselijke testen

OpenAI gesimuleerde menselijke tests voor GPT-4 - openbaar gemaakte tests met multiple-choice en vrije-antwoord examenvragen.

Sommige categoriespecifieke suggesties bevatten ook visuele elementen.

Verder waren de resultaten gebaseerd op niet vrijgegeven oefenexamens en de scores van de validatietests van de deelnemers.

De totaalscore van elke test werd berekend door de resultaten van de meerkeuzevragen en de vrije antwoorden bij elkaar op te tellen .

De meeste van deze gestandaardiseerde tests zijn eenvoudig genoeg voor een mens om te slagen.

Maar, verrassing - GPT-4 staat in de top 10% van alle inzendingen voor een praktijkversie van het Uniform Bar Examen.

Behoorlijk indrukwekkend, toch?

Bovendien blijkt dat de toetsvaardigheid van het model grotendeels het product is van de voortrainingsfase en dat RLHF daar weinig tot geen invloed op heeft.

In feite presteert het RLHF-model op meerkeuzevragen even goed als het basismodel GPT-4 op al onze proefexamens.

Maar nu begint het interessant te worden.

2. GPT-4 vs GPT3.5

Met behulp van dezelfde industriestandaard metrieken voor het evalueren van taalmodellen testte OpenAI ook het GPT-4 basismodel.

Om te bepalen of testgegevens in de trainingsset waren opgenomen, gebruikten ze voor alle GPT-4 benchmarks few-shot prompts en controleerden ze elke gerapporteerde benchmark op vervuiling.

Voor het grootste deel, GPT-4 beter dan zowel de huidige taalmodellen als historische state-of-the-art (SOTA) systemen, die meestal geschreven of getraind zijn volgens specifieke benchmarks.

Bovendien is GPT-4 veel beter dan zijn voorgangers wat betreft het begrijpen van de bedoeling van de gebruiker.

gpt-4-vs-gpt-3-5

Bovendien presteerde GPT-4 aanzienlijk beter dan GPT-3.5(70,2% punten) op een reeks van 5.214 vragen die via ChatGPT en de OpenAI API werden ingediend.

En om modellen als GPT-4 te evalueren ontwikkelt OpenAI Evals7 - een raamwerk voor het maken en uitvoeren van benchmarks die de modelprestaties steekproefsgewijs onderzoeken.

Evals is compatibel met de huidige benchmarks, zodat de prestaties van het model in de praktijk kunnen worden gevolgd.

Het goede nieuws is dat OpenAI van plan is de verscheidenheid van deze benchmarks geleidelijk te vergroten om een breder scala aan potentiële problemen en een meer uitdagende reeks taken beter weer te geven.

3. GPT-4 vs Visuele ingangen

Naast de optie met alleen tekst kan de GPT-4 worden geïnstrueerd om elke denkbare taal- of kijktaak uit te voeren door middel van beeldaanwijzingen.

Het model maakt tekstuele outputs op basis van inputs die elke combinatie van tekst en afbeeldingen kunnen bevatten.

Met andere woorden, GPT-4 geeft in meerdere domeinen dezelfde mogelijkheden weer als bij invoer met alleen tekst.

Dat geldt ook voor documenten met een mix van tekst en afbeeldingen, zoals tekst en foto's, diagrammen of schermafbeeldingen.

gpt-4-visueel

Test-tijd methoden, zoals few-shot prompting en chain-of-thought, oorspronkelijk ontwikkeld voor taalmodellen, zijn net zo effectief bij het gebruik van afbeeldingen en tekst.

Maar ondanks zijn sterke punten heeft GPT-4 dezelfde zwakke punten als eerdere GPT-versies

Een van die zwakheden is dat het niet volledig betrouwbaar is (het "hallucineert" feiten en maakt redeneerfouten). 

Vergeleken met de GPT-3.5 modellen vermindert GPT-4 de hallucinaties echter sterk - het scoort 19% punten hoger dan de laatste GPT-3.5 op OpenAI's interne, door tegenstanders ontworpen feitelijkheidsevaluaties.

GPT-4 Veiligheidsgegevens en beperkingen

OpenAI heeft aanzienlijke verbeteringen aangebracht in veel van de veiligheidsfuncties van GPT-4, waaronder:

  • GPT-4 beantwoordt 82% minder vaak verzoeken om inhoud die niet is toegestaan dan GPT-3.5. 
  • In overeenstemming met de regels van OpenAI is GPT-4 29% meer geneigd gevoelige vragen te beantwoorden, zoals "hoe je jezelf pijn kunt doen" of "hoe je medische hulp kunt krijgen". 
  • Op de RealToxicityPrompts dataset maakt GPT-4 slechts 0,73% van de tijd toxische inhoud, terwijl GPT-3,5 dat 6,48% van de tijd doet.
gpt-4-prompt-voorbeelden

Hoewel OpenAI het moeilijker maakt om mensen te beïnvloeden om zich te misdragen, is dat nog steeds mogelijk. 

Ze gaven in het rapport het voorbeeld van "jailbreaks" als een tegenstrijdig systeembericht, dat nog steeds gebruikt kan worden om inhoud te maken die hun regels schendt. 

Wel merken ze op dat het combineren van deze beperkingen met veiligheidsmaatregelen in de uitroltijd, zoals controle op misbruik en een pijplijn voor snelle iteratieve modelverbetering, cruciaal is.

OpenAI's belangrijkste opmerkingen over GPT-4

En tenslotte belichtte OpenAI's technische rapport voor GPT-4 een aantal belangrijke aandachtspunten die je moet onthouden bij het vaststellen van doelen voor dit krachtige model. 

Enkele voorbeelden zijn de volgende:

✔️ GPT-4 is een groot, multimodaal model dat even goed presteert als mensen op strenge professionele en academische benchmarks.

✔️ GPT-4 presteert beter dan grote taalmodellen en de meeste state-of-the-art systemen op verschillende NLP taken (die vaak taakspecifieke fine-tuning omvatten).

✔️ Hoewel in het Engels gemeten, kunnen verbeterde GPT-4 vaardigheden in vele talen worden aangetoond.

✔️ Voorspelbare schaling kan het verlies en de acties van GPT-4 nauwkeurig voorspellen.

✔️ de mogelijkheden van GPT-4 vergroten de risico's ervan.

✔️ Zij leverden methoden en resultaten om de veiligheid en afstemming ervan te verbeteren.

✔️ GPT-4 is een belangrijke stap in de richting van veilige, wijdverspreide AI systemen.

En laten we tenslotte de belangrijkste informatie niet vergeten - de GPT-4 releasedatum.

GPT-4 Verschijningsdatum

OpenAI verklaarde op 14 maart de release van hun enorme multimodale model GPT-4

Gebruikers meldden in de eerste uren na de release bijna perfecte versies van Tetris, Connect Four, Snake en Pong te maken door de chatbot simpelweg te vragen code te genereren.

javi-lopez-twitter-post

GPT-4 is echter alleen beschikbaar voor degenen die maandelijks $20 betalen voor een ChatGPT Plus abonnement, waardoor gebruikers exclusieve toegang krijgen tot het taalmodel van OpenAI. 

Ook moet je weten dat zelfs met dit abonnement er een limiet is van 100 berichten per gebruiker per 4 uur, dus je kunt beperkte toegang hebben.

Het laatste woord

Hoewel slechts een klein deel van OpenAI's rapport over GPT-4 hier wordt behandeld, hopen we dat het genoeg is om je op het juiste spoor te houden (in ieder geval tot verdere updates).

GPT-4 zal zich blijven ontwikkelen, en we zullen in de toekomst nog meer opmerkelijke prestaties zien.

Maar hoewel het potentieel van deze AI module onbetwistbaar groot is, valt ook moeilijk te ontkennen dat het af en toe eng wordt.

Het is ook belangrijk om de momenteel beschikbare AI hulpmiddelen te erkennen die, ondanks de onvermijdelijke veranderingen die deze vooruitgang met zich meebrengt, met hun tijd mee durven gaan en toch trouw blijven aan hun oorspronkelijke bedoelingen.

Eén zo'n hulpmiddel is de TextCortex add-on.

Wat is TextCortex?

TextCortex is een kunstmatige intelligentie (AI) schrijftool gebouwd op het concept van use-case modules om schrijvers te helpen ideeën te genereren en inhoud van hoge kwaliteit te produceren.

Het voornaamste doel is om schrijvers te helpen hun writer's block te doorbreken door hulpmiddelen aan te bieden zoals:

✒️ Rewriting tool - Biedt hulp bij het herschrijven, samenvatten, veranderen van de toon, vertalen en andere aspecten van parafraseren.

✒️ Long-form functie - Hiermee kun je een blog post van maximaal 300 woorden genereren uit één idee van vijf woorden.

✒️ Bullet to email - Hiermee kun je gemakkelijk je bullet points omzetten in opgemaakte e-mailberichten.

✒️ Zeno-modus - Op basis van je eerste opzet zal het de meest relevante resultaten opleveren.

✒️ Brainstormfuncties - Categorie functies ontworpen om je aan het schrijven te krijgen.

✒️ AI templates - Creëer eenvoudig elke inhoud uit trefwoorden en voorgedefinieerde templates.

✒️ Zeno chat - Chat met onze AI schrijver en krijg de resultaten die je wilt.

Waarom erover nadenken?

👍 We bieden een freemium account met 10 gratis dagelijkse creaties.

👍 Je hoeft geen creditcardgegevens op te geven om je in te schrijven.

👍 Onze oplossingen bedienen al met succes 10k+ gebruikers.

👍 Wij beloven betaalbare premium plannen voor upgrades.

Interesse in een gratis ritje?

Download onze Chrome extension om te zien hoe TextCortex je schrijfsels gemakkelijk kan omzetten in boeiende en effectieve inhoud op 2000+ platforms, vanaf vandaag.