[ad_1]
ServiceNow, Hugging Face e NVIDIA hanno collaborato per rilasciare una nuova famiglia di LLM aperti chiamata StarCoder2 progettata per gli sviluppatori.
StarCoder2 è stato addestrato sulla programmazione 619 ed è destinato a fornire agli sviluppatori funzionalità come la generazione di codice, la generazione di flussi di lavoro e il riepilogo del testo, solo per citarne alcuni. Le aziende prevedono che i modelli StarCoder2 saranno utili sia agli ingegneri del software che agli sviluppatori cittadini.
È stato sviluppato all’interno del BigCode community, che è un gruppo dedito allo sviluppo responsabile di LLM. Il progetto è stato gestito sia da ServiceNow che da Hugging Face.
StarCoder 2 è disponibile in tre diverse dimensioni di modello: ServiceNow ha addestrato un modello da 3 miliardi di parametri, Hugging Face ha addestrato un modello da 7 miliardi di parametri e NVIDIA ha addestrato un modello da 15 miliardi di parametri.
I modelli più piccoli sono progettati per offrire prestazioni potenti utilizzando piccole quantità di potenza di elaborazione. Secondo le aziende, il modello da 3 miliardi di parametri corrisponde alle prestazioni del modello da 15 miliardi di parametri della versione originale di StarCoder.
Gli utenti saranno in grado di mettere a punto questi modelli per soddisfare le proprie esigenze specifiche, utilizzando strumenti open source come NVIDIA NeMo o Hugging Face TRL.
“StarCoder2 testimonia il potere combinato della collaborazione scientifica aperta e delle pratiche di intelligenza artificiale responsabili con una catena di fornitura di dati etica”, ha affermato Harm de Vries, a capo del team di sviluppo StarCoder2 di ServiceNow e co-responsabile di BigCode. “Il modello all’avanguardia ad accesso aperto migliora le precedenti prestazioni dell’intelligenza artificiale generativa per aumentare la produttività degli sviluppatori e fornisce agli sviluppatori pari accesso ai vantaggi dell’intelligenza artificiale per la generazione di codice, che a sua volta consente alle organizzazioni di qualsiasi dimensione di soddisfare più facilmente i propri obiettivi. potenziale commerciale”.
Leandro von Werra, ingegnere di machine learning presso Hugging Face e co-responsabile di BigCode, ha aggiunto: “Gli sforzi congiunti guidati da Hugging Face, ServiceNow e NVIDIA consentono il rilascio di potenti modelli base che consentono alla comunità di creare un’ampia gamma di applicazioni. in modo efficiente con piena trasparenza dei dati e della formazione. StarCoder2 è una testimonianza del potenziale dell’open source e della scienza aperta mentre lavoriamo verso la democratizzazione dell’IA responsabile”.
[ad_2]
Source link