La corsa all'oro dell'AI

Che cos'è GPT-4o mini, il nuovo modello lanciato da OpenAI

La società di intelligenza artificiale ha reso disponibile un nuovo sistema che promette di abbassare i costi per gli sviluppatori e di rendere più accessibile l'AI
OpenAI
Il logo di OpenAIJaque Silva/Getty Images

Giovedì OpenAI ha lanciato un nuovo modello AI di dimensioni ridotte che dovrebbe permettere a un maggior numero di aziende e programmi di sfruttare l'intelligenza artificiale della startup per costruire app a un costo minore. Il nuovo modello si chiama GPT-4o mini, è disponibile da ieri ed è il 60% più economico rispetto all'offerta base di OpenAI, pur offrendo prestazioni migliori.

Il nuovo prodotto di OpenAI

La società guidata da Sam Altman ha presentato la novità come parte dello sforzo per rendere l'intelligenza artificiale "il più accessibile possibile", ma riflette anche la crescente concorrenza tra i fornitori di servizi cloud per l'AI e l'aumentato interesse verso i modelli open source gratuiti e più contenuti. La prossima settimana Meta dovrebbe annunciare una versione più grande del suo potente sistema gratuito, Llama 3.

"L'obiettivo di OpenAI è costruire e distribuire l'intelligenza artificiale in modo sicuro e renderla ampiamente accessibile – spiega a Wired US Olivier Godement, il product manager dell'azienda responsabile del nuovo modello –. Mettere a disposizione l'intelligenza a un costo inferiore è uno dei modi più efficienti per farlo".

Godement aggiunge che OpenAI ha sviluppato la sua nuova offerta migliorando l'architettura del modello, oltre che perfezionando dati e addestramento. L'azienda riporta che GPT-4o mini ha capacità che superano quelle degli altri modelli di piccole dimensioni sul mercato in diversi benchmark comuni.

OpenAI si è conquistata una posizione di primo piano nel mercato delle AI in cloud grazie alle notevoli prestazioni del suo chatbot, ChatGPT, che ha debuttato alla fine del 2022. La startup consente di accedere a pagamento al modello linguistico di grandi dimensioni (Llm) che alimenta ChatGPT, chiamato GPT-4o, e offre anche un modello meno potente a circa un decimo del costo, GPT-3.5 Turbo.

L'interesse per i modelli linguistici suscitato dall'enorme successo di ChatGPT ha spinto i concorrenti di OpenAI a sviluppare offerte simili. Google, uno dei pionieri dell'AI, ha investito molto per realizzare e commercializzare un Llm e un chatbot, Gemini. Ma ci sono anche startup come Anthropic, Cohere e AI21, che hanno raccolto milioni per sviluppare e lanciare sul mercato i propri modelli linguistici di grandi dimensioni.

L'ascesa dei modelli open source

Nonostante la creazione di Llm più performanti richieda ingenti risorse finanziarie, alcune aziende hanno scelto di rendere open source i loro prodotti per attirare gli sviluppatori. Il modello di intelligenza artificiale open source più potente è appunto Llama di Meta, che può essere scaricato e utilizzato gratuitamente (seppur con dei limiti nel caso di sfruttamento commerciale).

Quando lo scorso aprile ha annunciato Llama 3, Meta ha distribuito due versioni del suo modello gratuito più potente: una più piccola con 8 miliardi di parametri (un misurata impiegata nel settore che corrisponde a grandi linee alla potenza di un modello) e una più potente di medie dimensioni, con 70 miliardi di parametri, che in termini di prestazioni si avvicina al servizio più avanzato di OpenAI in diversi benchmark.

Diverse fonti hanno confermato a Wired US che il 23 luglio Meta prevede di lanciare la versione più grande di Llama 3, dotata di 400 miliardi di parametri (sottolineando però che la data potrebbe cambiare). Anche se non è chiaro quanto questa versione dell'AI di Menlo Park si dimostrerà capace, alcune aziende hanno rivolto la loro attenzione ai modelli di intelligenza artificiale open source, che sono più economici e personalizzabili e offrono un maggiore controllo sul modello e sui dati che gli vengono forniti.

Godement ammette che le esigenze dei clienti stanno effettivamente evolvendo: “Quello che vediamo sempre più spesso sul mercato è che gli sviluppatori e le aziende combinano modelli piccoli e grandi per ottenere la migliore esperienza possibile in termini di prodotto, a un prezzo e una latenza che sia giusta per loro”.

Il product manager di OpenAI sottolinea che le offerte cloud dell'azienda offrono ai clienti modelli che sono stati sottoposti a maggiori test di sicurezza rispetto a quelli della concorrenza, e che in futuro OpenAI potrebbe sviluppare sistemi che i clienti possono eseguire sui propri dispositivi: "Se vedremo una grossa domanda massiccia, potremmo aprire questa porta", dichiara Godement.

Questo articolo è apparso originariamente su Wired US.