Granite 3.1 IBM: scheda modello open source enterprise

Granite 3.1 (IBM): LLM open source enterprise multilingue

Famiglia di modelli linguistici open source di IBM per applicazioni aziendali, con contesto fino a 128K token e licenza Apache 2.0.

6 min di lettura

Cos'è

Granite 3.1 è una famiglia di modelli linguistici di fondazione sviluppata da IBM e rilasciata come open source. Si tratta di modelli pensati principalmente per l'uso aziendale: leggeri, personalizzabili e adatti a girare anche su risorse di calcolo contenute, dal cloud privato fino a deployment on-premise o edge. La famiglia è composta da quattro varianti principali, suddivise in due architetture:

Modelli densi: 2B e 8B di parametri, addestrati su 12 trilioni di token.
Modelli Mixture-of-Experts (MoE): 1B e 3B di parametri totali, con rispettivamente 400M e 800M di parametri attivi per token, addestrati su 10 trilioni di token.

Per ciascuna scala IBM mette a disposizione sia un modello base (checkpoint post pre-training) sia una versione instruct (affinitata per dialogo, istruzioni, sicurezza e utilità). I modelli base sono pensati per chi vuole fare fine-tuning su domini specifici o costruire varianti specializzate; i modelli instruct sono già pronti per essere usati come assistenti conversazionali e per task di ragionamento. Tutti i modelli sono rilasciati con licenza Apache 2.0, che ne permette l'uso commerciale e la modifica senza richiedere royalty.

A cosa serve

Granite 3.1 è progettato per compiti testuali complessi in ambito enterprise. I casi d'uso principali includono:

Retrieval Augmented Generation (RAG): generazione di risposte basate su knowledge base aziendali, riducendo le allucinazioni legate alla memoria parametrica del modello.
Agenti AI e function calling: esecuzione di chiamate a strumenti esterni, API, database e servizi interni, con formati strutturati per il dialogo tra modello e ambiente.
Analisi e riassunto di documenti lunghi: contratti, report finanziari, manuali tecnici, atti normativi, trascrizioni di call e log estesi.
Estrazione e classificazione di informazioni: identificazione di entità, relazioni, sentiment e attributi da testi non strutturati.
Coding e assistenza allo sviluppo: completamento, spiegazione, debugging e documentazione di codice in più linguaggi di programmazione.
Domande e risposte multilingue su documentazione interna o pubblica, con supporto diretto per l'italiano.

Accanto ai modelli generativi, IBM ha rilasciato anche i Granite Embedding, modelli di embedding ottimizzati per il retrieval, che supportano 12 lingue e dimensioni che vanno da 30M a 278M di parametri. Questi embedding sono progettati per essere veloci e compatti, favorendo la costruzione di motori di ricerca semantica su larga scala. Inoltre, la famiglia include , modelli specializzati nel rilevamento di allucinazioni, con particolare attenzione al function calling, per aumentare l'affidabilità e l'osservabilità degli agenti autonomi.

Granite 3.1 (IBM): LLM open source enterprise multilingue

Cos'è

A cosa serve

Come funziona

Perché conta per founder, PMI e agenzie italiane

Dove trovarlo