Se pensi che ChatGPT non possa crescere ulteriormente, non potresti sbagliarti di più. In effetti, OpenAI si sta solo scaldando.

Dopo che il rilascio di ChatGPT ha fatto scalpore online (e si può notare che questa tendenza è ancora in atto), è emersa una nuova moda che ha suscitato la curiosità e l'interesse della comunità di AI .

Potremmo dire che le persone non si sono ancora adattate o non hanno compreso appieno le capacità di GPT-3 e GPT-3.5, ma in rete circolano voci secondo cui GPT-4 è all'orizzonte.

E ci sono anche delle buone notizie.

In questo articolo parleremo di cos'è la GPT-4, riassumeremo ciò che si sa attualmente su di essa e presenteremo nuove informazioni su quando e come ottenere questo potente modello AI .

Restate sintonizzati!

Che cos'è il GPT-4?

gpt-4-homepage-open-ai

Nella relazione tecnica, OpenAI descrive il GPT-4 come un grande modello multimodale in grado di accogliere testi e immagini e di trasformarli in testo. 

Hanno inoltre sostenuto che lo studio di tali modelli è fondamentale per l'ampia varietà di applicazioni che trovano nel mondo reale, come ad esempio:

  • Sistemi di dialogo
  • Riassunto del testo
  • Traduzione automatica

Ecco perché questi modelli hanno ricevuto così tanta attenzione e si sono sviluppati così rapidamente negli ultimi anni.

house-of-web-3-report-twitter-post

Per approfondire, OpenAI sostiene che il miglioramento della comprensione e della produzione del linguaggio naturale è la motivazione principale per lo sviluppo di questi modelli.

Soprattutto in scenari più sfumati e complessi.

Come funziona il GPT-4?

Per prevedere il token successivo in un documento, GPT-4 è un modello di tipo Transformer che tiene conto di entrambi:

  • Informazioni liberamente accessibili al pubblico, come ad esempio dati reperiti online, e
  • Informazioni concesse in licenza da fonti esterne.

Il modello è stato poi messo a punto con l'input umano e l'apprendimento di rinforzo dal feedback umano (RLHF).

Inoltre, dato l'alto livello di concorrenza e i rischi intrinseci associati alla gestione di un modello di grandi dimensioni come il GPT-4, è comprensibile che il rapporto non approfondisca l'architettura.

In altre parole, i seguenti dettagli non sono disponibili nel report di OpenAI:

  • Le dimensioni del modello
  • Hardware
  • Calcolo della formazione
  • Costruzione del set di dati
  • Metodo di allenamento, ecc.

Esistono tuttavia dati fondamentali che possono far luce sulle capacità del GPT-4 in modo più dettagliato.

Ad esempio, OpenAI rivela che il GPT-4 è stato sottoposto a una serie di test sviluppati per gli esseri umani per determinare come si sarebbe comportato in scenari simili.

È interessante notare che la GPT-4 si comporta ragionevolmente bene in questi test, a volte addirittura "facendo un lavoro migliore" rispetto alla stragrande maggioranza delle persone.

GPT-4, ad esempio, si colloca nella top 10% dei partecipanti al test perché ha ottenuto un punteggio perfetto nel suo esame di simulazione.

D'altra parte, GPT-3.5 si colloca nel 10% inferiore.

Esploriamo però un po' più a fondo le capacità del GPT-4.

Capacità del GPT-4

In questa sezione tratteremo i 3 aspetti critici delle capacità del GPT-4 che sono stati dimostrati attraverso diverse serie di test.

Immergiamoci!

1. GPT-4 rispetto ai test sull'uomo

Test umani simulati OpenAI per GPT-4 - test di provenienza pubblica con domande a scelta multipla e a risposta libera.

Alcuni suggerimenti specifici per categoria includevano anche elementi visivi.

Inoltre, i risultati si basavano su esami pratici non pubblicati e sui punteggi dei test di validazione dei partecipanti.

Il punteggio totale di ogni test è stato calcolato sommando i risultati a scelta multipla e a risposta libera.

La maggior parte di questi test standardizzati sono abbastanza semplici da superare per un essere umano.

Ma, sorpresa delle sorprese, il GPT-4 si colloca nella top 10% di tutti gli invii alla versione pratica dell'Uniform Bar Examination.

Piuttosto impressionante, vero?

Inoltre, sembra che l'abilità del modello nell'affrontare i test sia in gran parte il prodotto della fase di pre-addestramento e che l'RLHF abbia un'influenza minima o nulla su questo aspetto.

In effetti, il modello RLHF ha prestazioni simili alle domande a scelta multipla rispetto al modello GPT-4 di base in tutti i nostri esami di prova.

Ma ora le cose iniziano a farsi interessanti.

2. GPT-4 vs GPT3.5

Utilizzando le stesse metriche standard del settore per la valutazione dei modelli linguistici, OpenAI ha testato anche il modello di base GPT-4.

Per determinare se i dati di prova erano inclusi nell'insieme di formazione, hanno utilizzato richieste di pochi colpi per tutti i benchmark GPT-4 e hanno controllato che ogni benchmark riportato non fosse contaminato.

Per la maggior parte, GPT-4 supera sia i modelli linguistici attuali che i sistemi storici all'avanguardia (SOTA), che in genere sono stati scritti o addestrati in base a specifici benchmark.

Inoltre, il GPT-4 ha migliorato notevolmente i suoi predecessori in termini di comprensione delle intenzioni dell'utente.

gpt-4-vs-gpt-3-5

Inoltre, il GPT-4 ha superato il GPT-3.5 con un margine significativo(70,2% di punti) su una serie di 5.214 domande inviate tramite ChatGPT e OpenAI API.

Per valutare modelli come il GPT-4, OpenAI sta sviluppando Evals7, un framework per la creazione e l'esecuzione di benchmark che esamina le prestazioni dei modelli campione per campione.

Evals è compatibile con i benchmark attuali e consente di monitorare le prestazioni dei modelli nel mondo reale.

La buona notizia è che OpenAI intende aumentare gradualmente la varietà di questi benchmark per rappresentare meglio una gamma più ampia di potenziali problemi e una serie di compiti più impegnativi.

3. GPT-4 vs input visivi

Oltre all'opzione di solo testo, il GPT-4 può essere istruito a svolgere qualsiasi attività linguistica o visiva immaginabile attraverso messaggi di immagini.

Il modello crea output testuali basati su input che possono includere qualsiasi combinazione di testo e immagini.

In altre parole, il GPT-4 mostra le stesse funzionalità su più domini come su input di solo testo.

Ciò include documenti a mediazione mista contenenti testo e immagini, come testo e fotografie, diagrammi o screenshot.

gpt-4-visual

I metodi di prova, come il prompt a pochi colpi e la catena di pensiero, originariamente sviluppati per i modelli linguistici, sono altrettanto efficaci quando si utilizzano immagini e testi.

Tuttavia, nonostante i suoi punti di forza, il GPT-4 presenta le stesse debolezze delle precedenti versioni del GPT

Una di queste debolezze è che non è completamente affidabile ("allucina" i fatti e commette errori di ragionamento). 

Tuttavia, rispetto ai modelli GPT-3.5, il GPT-4 riduce notevolmente le allucinazioni, ottenendo un punteggio del 19% di punti in più rispetto all'ultimo GPT-3.5 nelle valutazioni di fattualità interne di OpenAI, progettate da avversari.

GPT-4 Metriche di sicurezza e limitazioni

OpenAI ha apportato miglioramenti significativi a molte delle funzioni di sicurezza del GPT-4, tra cui:

gpt-4-prompt-esempi

Anche se OpenAI rende più difficile influenzare le persone a comportarsi male, è ancora possibile farlo. 

Nel rapporto si fa l'esempio del "jailbreak" come messaggio di sistema avverso, che può comunque essere utilizzato per creare contenuti che violano le loro regole. 

Tuttavia, i ricercatori sottolineano che è fondamentale combinare queste limitazioni con misure di sicurezza in fase di distribuzione, come il monitoraggio degli abusi e una pipeline per un rapido miglioramento iterativo del modello.

I punti chiave di OpenAI sul GPT-4

Infine, il rapporto tecnico di OpenAI per il GPT-4 ha messo in evidenza alcuni punti chiave che dovresti ricordare quando stabilisci gli obiettivi per questo potente modello. 

Alcuni esempi sono i seguenti:

✔️ GPT-4 è un modello multimodale di grandi dimensioni che ha prestazioni pari a quelle umane su rigidi benchmark professionali e accademici.

✔️ GPT-4 supera i modelli linguistici di grandi dimensioni e la maggior parte dei sistemi all'avanguardia in diversi compiti di NLP (che spesso includono una messa a punto specifica del compito).

✔️ Sebbene sia misurato in inglese, il miglioramento delle abilità GPT-4 può essere dimostrato in molte lingue.

✔️ Il Predictable Scaling è in grado di prevedere con precisione la perdita e le azioni del GPT-4.

✔️ capacità della GPT-4 aumentano i suoi rischi.

✔️ Hanno fornito metodi e risultati per migliorare la sicurezza e l'allineamento.

✔️ GPT-4 è un passo significativo verso la sicurezza e la diffusione dei sistemi AI .

Infine, non dimentichiamo l'informazione più importante: la data di uscita del GPT-4.

Data di uscita del GPT-4

OpenAI ha dichiarato il rilascio del suo modello multimodale massivo GPT-4 il 14 marzo

Gli utenti hanno riferito di aver creato versioni quasi perfette di Tetris, Connect Four, Snake e Pong nelle prime ore dopo il rilascio, semplicemente chiedendo al chatbot di generare codice.

javi-lopez-twitter-post

Tuttavia, il GPT-4 è disponibile solo per coloro che pagano 20 dollari al mese per un abbonamento ChatGPT Plus, che garantisce agli utenti l'accesso esclusivo al modello linguistico di OpenAI. 

Allo stesso modo, devi sapere che anche con questo abbonamento, ci sarà un limite di 100 messaggi per utente ogni 4 ore, quindi potresti avere un accesso limitato.

La parola finale

Anche se qui viene trattata solo una piccola parte del rapporto di OpenAI sul GPT-4, speriamo che sia sufficiente per metterti sulla strada giusta (almeno fino a nuovi aggiornamenti).

Il GPT-4 continuerà a progredire e in futuro vedremo imprese ancora più straordinarie.

Tuttavia, se il potenziale di questo modulo AI è indiscutibilmente vasto, è anche difficile negare che di tanto in tanto faccia paura.

È anche importante riconoscere gli strumenti attualmente disponibili su AI che, nonostante gli inevitabili cambiamenti apportati da questi progressi, osano stare al passo con i tempi rimanendo fedeli alle loro intenzioni originali.

Uno di questi strumenti è il componente aggiuntivoTextCortex .

Che cos'è TextCortex?

TextCortex è uno strumento di scrittura con intelligenza artificiale (AI) costruito sul concetto di moduli di casi d'uso per aiutare gli scrittori a generare idee e produrre contenuti di alta qualità.

Il suo scopo principale è quello di aiutare gli scrittori a superare il blocco dello scrittore offrendo strumenti quali:

✒️ Rewriting tool - Fornisce assistenza per riscrivere, riassumere, modificare il tono, tradurre e altri aspetti della parafrasi.

✒️ Funzione Long-form - Ti permette di generare un blog post di massimo 300 parole da una singola idea di cinque parole.

✒️ Bullet to email - Ti permette di convertire facilmente i tuoi punti elenco in messaggi e-mail formattati.

✒️ Modalità Zeno - In base alla tua bozza iniziale, produrrà i risultati più pertinenti.

✒️ Funzioni di Brainstorming - Categoria di funzioni pensate per farti iniziare a scrivere.

✒️ AI templates - Crea facilmente qualsiasi contenuto a partire da parole chiave e da templates predefiniti.

✒️ Zeno chat - Chatta con il nostro scrittore AI e ottieni i risultati che desideri.

Perché prendersi la briga di considerarlo?

👍 Offriamo un account freemium con 10 creazioni giornaliere gratuite.

👍 Non è necessario fornire i dati della carta di credito per iscriversi.

👍 Le nostre soluzioni servono già con successo oltre 10k utenti.

👍 Promettiamo piani premium convenienti per gli aggiornamenti.

Sei interessato a ricevere un passaggio gratuito?

Scarica il nostro Chrome extension per scoprire come TextCortex può trasformare facilmente i tuoi scritti in contenuti convincenti ed efficaci su oltre 2000 piattaforme, a partire da oggi.