Om du tror att ChatGPT inte kan växa ytterligare kan du inte ha mer fel. OpenAI har faktiskt bara börjat värma upp.

Efter att ChatGPT:s lansering orsakade stor uppståndelse på nätet (och du kan se att trenden fortfarande är stark), uppstod en ny modefluga som väckte nyfikenhet och intresse hos AI -gemenskapen.

Man kan säga att folk inte har anpassat sig till eller helt förstått GPT-3 och GPT-3.5:s kapacitet ännu, men rykten har cirkulerat på nätet om att GPT-4 är på gång.

Det finns också goda nyheter.

I den här artikeln berättar vi vad GPT-4 är, sammanfattar vad vi vet om det och presenterar ny information om när och hur man kan få tag på denna potenta modell på AI .

Håll ögonen öppna!

Vad är GPT-4?

gpt-4-homepage-open-ai

I sin tekniska rapport beskriver OpenAI GPT-4 som en stor multimodal modell som kan ta emot text och bilder och omvandla dem till text. 

De hävdade vidare att det är viktigt att studera sådana modeller på grund av de många olika tillämpningar de har i verkligheten, t.ex:

  • System för dialog
  • Sammanfattning av text
  • Maskinell översättning

Det är därför som dessa modeller har fått så mycket uppmärksamhet och utvecklats så snabbt under de senaste åren.

house-of-web-3-report-twitter-post

OpenAI hävdar att en förbättrad förståelse och produktion av naturligt språk är en av de främsta orsakerna till att utveckla sådana modeller.

Särskilt i mer nyanserade och komplexa scenarier.

Hur fungerar GPT-4?

För att förutsäga följande token i ett dokument är GPT-4 en Transformer-modell som tar hänsyn till både:

  • Information som är fritt tillgänglig för allmänheten, t.ex. uppgifter som finns på nätet.
  • Licensierad information från externa källor.

Modellen finjusterades sedan med hjälp av mänsklig input och förstärkningsinlärning från mänsklig feedback (RLHF).

Med tanke på den höga konkurrensnivån och de inneboende risker som är förknippade med driften av en stor modell som GPT-4 är det förståeligt att rapporten inte går djupare in på arkitekturen.

Med andra ord finns följande uppgifter inte tillgängliga i OpenAI:s rapport:

  • Modellens storlek
  • Hårdvara
  • Utbildningsberäkning
  • Uppbyggnad av datamängder
  • Träningsmetod osv.

Det finns dock viktiga uppgifter som kan belysa GPT-4:s kapacitet mer i detalj.

OpenAI avslöjar till exempel att GPT-4 genomgick en rad tester som utvecklats för människor för att avgöra hur den skulle klara sig i liknande scenarier.

Intressant nog klarar sig GPT-4 ganska bra i dessa tester, ibland till och med bättre än de allra flesta människor.

GPT-4, till exempel, tillhör de 10 % bästa testdeltagarna eftersom hon fick ett perfekt resultat på sin simulerade advokatexamen.

GPT-3.5 ligger däremot på de 10 % lägsta nivåerna.

Låt oss dock utforska GPT-4:s kapacitet lite närmare.

GPT-4-funktioner

I det här avsnittet kommer vi att ta upp de tre kritiska aspekterna av GPT-4:s kapacitet som visades genom olika testuppsättningar.

Låt oss dyka in!

1. GPT-4 jämfört med tester på människor

OpenAI-simulerade mänskliga tester för GPT-4 - offentliga tester med flervalsfrågor och frågor med fritt svar.

Vissa kategorispecifika förslag innehöll även visuella element.

Dessutom baserades resultaten på icke offentliggjorda övningsprov och deltagarnas valideringsresultat.

Varje testets totala poäng beräknades genom att addera resultaten från flervalsfrågor och fria svar .

De flesta av dessa standardiserade tester är tillräckligt enkla för att en människa ska kunna klara av dem.

Men, överraskande nog - GPT-4 tillhör de 10 % bästa av alla inlämningar till en övningsversion av Uniform Bar Examination.

Ganska imponerande, eller hur?

Dessutom verkar det som om modellens förmåga att genomföra testerna till stor del är en produkt av förträningsfasen och att RLHF har liten eller ingen betydelse för detta.

Faktum är att RLHF-modellen har liknande resultat på flervalsfrågor som basmodellen GPT-4 har på alla våra testprov.

Men nu börjar det bli intressant.

2. GPT-4 jämfört med GPT3.5

OpenAI använde samma standardiserade mått för att utvärdera språkmodeller och testade även GPT-4:s basmodell.

För att avgöra om testdata ingick i träningsuppsättningen använde de några få uppmaningar för alla GPT-4-benchmarks och kontrollerade varje rapporterat benchmark för kontaminering.

För det mesta, GPT-4 bättre än både nuvarande språkmodeller och historiska toppmoderna system (SOTA), som vanligtvis har skrivits eller tränats i enlighet med specifika riktmärken.

Dessutom har GPT-4 förbättrat sina föregångare avsevärt när det gäller att förstå användarens avsikt.

gpt-4-vs-gpt-3-5

Dessutom överträffade GPT-4 GPT-3.5 med en betydande marginal(70,2 % poäng) på en uppsättning av 5 214 frågor som skickades in via ChatGPT och OpenAI API.

För att utvärdera modeller som GPT-4 utvecklar OpenAI Evals7 - ett ramverk för att skapa och köra riktmärken som undersöker modellens prestanda på provbasis.

Evals är kompatibelt med nuvarande riktmärken, vilket gör det möjligt att övervaka modellens prestanda i verkligheten.

Den goda nyheten är att OpenAI har för avsikt att gradvis öka variationen i dessa benchmarks för att bättre representera ett bredare spektrum av potentiella problem och en mer utmanande uppsättning uppgifter.

3. GPT-4 vs visuell input

Förutom alternativet med enbart text kan GPT-4 instrueras att utföra alla tänkbara språk- eller synuppgifter genom bildmeddelanden.

Modellen skapar textresultat baserat på indata som kan innehålla en kombination av text och bilder.

Med andra ord visar GPT-4 samma kapacitet i flera domäner som den gör på textinmatningar.

Detta inkluderar blandade dokument som innehåller text och bilder, t.ex. text och fotografier, diagram eller skärmdumpar.

gpt-4-visuell

Testtidsmetoder, t.ex. "few-shot prompting" och "chain-of-thought", som ursprungligen utvecklades för språkmodeller, är lika effektiva när man använder bilder och text.

Men trots sina styrkor har GPT-4 samma svagheter som tidigare GPT-versioner

En av dessa svagheter är att den inte är helt tillförlitlig (den "hallucinerar" fakta och begår argumentationsfel). 

Jämfört med GPT-3,5-modellerna minskar GPT-4 dock hallucinationerna avsevärt - den får följande poäng 19 procentenheter högre än den senaste GPT-3.5. i OpenAI:s interna, motståndsdesignade faktautvärderingar.

GPT-4 Säkerhetsmått och begränsningar

OpenAI har gjort betydande förbättringar av många av GPT-4:s säkerhetsfunktioner, bland annat:

  • GPT-4 har 82 % lägre sannolikhet att svara på förfrågningar om innehåll som inte är tillåtet än GPT-3.5. 
  • I linje med OpenAI:s regler är det 29 % mer sannolikt att GPT-4 svarar på känsliga frågor som "hur man skadar sig själv" eller "hur man får medicinsk hjälp". 
  • I datasetet RealToxicityPrompts skapar GPT-4 endast giftigt innehåll i 0,73 % av fallen, medan GPT-3.5 gör det i 6,48 % av fallen.
gpt-4-prompt-exempel

Även om OpenAI gör det svårare att påverka människor att bete sig illa är det fortfarande möjligt att göra det. 

I rapporten gav de exempel på "jailbreaks" som ett meddelande om ett motstridigt system, som fortfarande kan användas för att skapa innehåll som bryter mot deras regler. 

De påpekar dock att det är viktigt att kombinera dessa begränsningar med säkerhetsåtgärder under driftstiden, t.ex. övervakning av missbruk och en pipeline för snabb iterativ modellförbättring.

OpenAI:s viktigaste slutsatser från GPT-4

Och slutligen, OpenAI:s tekniska rapport för GPT-4 belyser flera viktiga saker som du bör komma ihåg när du sätter upp mål för den här kraftfulla modellen. 

Några exempel är följande:

✔️ GPT-4 är en stor, multimodal modell som presterar lika bra som människor på strikta yrkesmässiga och akademiska riktmärken.

✔️ GPT-4 presterar bättre än stora språkmodeller och de flesta av de senaste systemen på flera NLP uppgifter (som ofta omfattar uppgiftsspecifik finjustering).

✔️ Även om GPT-4-kunskaperna mäts på engelska kan de förbättras på många språk.

✔️ Förutsägbar skalning kan exakt förutsäga GPT-4:s förlust och åtgärder.

✔️ GPT-4:s förmåga ökar riskerna.

✔️ De tillhandahöll metoder och resultat för att förbättra säkerheten och anpassningen.

✔️ GPT-4 är ett viktigt steg mot säkra, utbredda AI -system.

Och slutligen får vi inte glömma den viktigaste informationen - datumet för lanseringen av GPT-4.

GPT-4 Utgivningsdatum

OpenAI tillkännagav att deras massiva multimodala modell GPT-4 släpptes den 14 mars

Användare rapporterade att de skapade nästan perfekta versioner av Tetris, Connect Four, Snake och Pong under de första timmarna efter lanseringen genom att helt enkelt be chattroboten generera kod.

javi-lopez-twitter-post

GPT-4 är dock endast tillgängligt för dem som betalar 20 dollar per månad för en ChatGPT Plus-prenumeration, vilket ger användarna exklusiv tillgång till OpenAI:s språkmodell. 

Du bör också veta att även med denna prenumeration finns det en gräns på 100 meddelanden per användare var fjärde timme, så du kan ha begränsad tillgång.

Det sista ordet

Även om vi här bara tar upp en liten del av OpenAI:s rapport om GPT-4 hoppas vi att det räcker för att hålla dig på rätt spår (åtminstone fram till ytterligare uppdateringar).

GPT-4 kommer att fortsätta att utvecklas och vi kommer att få se ännu fler anmärkningsvärda prestationer i framtiden.

Även om denna modul på AI utan tvekan har en enorm potential är det också svårt att förneka att den ibland är skrämmande.

Det är också viktigt att känna igen de verktyg som finns tillgängliga på AI och som trots de oundvikliga förändringar som dessa framsteg medför vågar följa med i tiden samtidigt som de förblir trogna sina ursprungliga intentioner.

Ett sådant verktyg är tilläggetTextCortex .

Vad är TextCortex?

TextCortex är ett skrivverktyg med artificiell intelligens (AI) som bygger på konceptet med användningsfallsmoduler för att hjälpa skribenter att generera idéer och producera högkvalitativt innehåll.

Dess främsta syfte är att hjälpa författare att bryta sin skrivkramp genom att erbjuda verktyg som:

✒️ Rewriting tool - ger hjälp med att skriva om, sammanfatta, ändra tonen, översätta och andra aspekter av parafrasering.

✒️ Långformsfunktion - gör det möjligt att skapa en blog post med upp till 300 ord från en enda idé med fem ord.

✒️ Bullet to email - Gör att du enkelt kan omvandla dina punkter till formaterade e-postmeddelanden.

✒️ Zeno-läge - Baserat på ditt första utkast kommer det att ge de mest relevanta resultaten.

✒️ Brainstorming-funktioner - Kategori av funktioner som är utformade för att få dig att börja skriva.

✒️ AI templates - Skapa enkelt innehåll från nyckelord och fördefinierade templates.

✒️ Zeno-chatt - Chatta med vår AI -skribent och få de resultat du vill ha.

Varför ska man tänka på det?

👍 Vi erbjuder ett freemiumkonto med 10 gratis dagliga skapelser.

👍 Du behöver inte ange kreditkortsinformation för att registrera dig.

👍 Våra lösningar är redan framgångsrika för över 10 000 användare.

👍 Vi lovar prisvärda premiumplaner för uppgraderingar.

Är du intresserad av att få en gratis resa?

Ladda ner vår Chrome extension för att se hur TextCortex enkelt kan omvandla dina texter till övertygande och effektivt innehåll på över 2000 plattformar, med start idag.