
Phi-4 (Microsoft): SLM 14B open source per reasoning e edge
Un modello di linguaggio compatto di Microsoft che compete con modelli molto più grandi su ragionamento, matematica e coding, rilasciato con licenza MIT.
Cos'è Phi-4
Phi-4 è un modello di linguaggio di piccole dimensioni (small language model, SLM) sviluppato da Microsoft. La versione principale conta circa 14 miliardi di parametri, un ordine di grandezza inferiore rispetto ai grandi modelli proprietari o aperti più diffusi. Nonostante le dimensioni compatte, Phi-4 è progettato per offrire prestazioni elevate in compiti che richiedono ragionamento, comprensione testuale avanzata, matematica e programmazione.
La famiglia Phi è nata con l'obiettivo di dimostrare che un addestramento curato su dati di alta qualità può produrre modelli più piccoli ma sorprendentemente capaci. Phi-4 rappresenta l'evoluzione di questo approccio: Microsoft ha combinato dati web filtrati con dati sintetici generati e verificati, concentrandosi in particolare su domini STEM (scienza, tecnologia, ingegneria e matematica) e su capacità di coding. Il risultato è un modello che, pur essendo tecnicamente uno SLM, riesce a competere con modelli molto più grandi su benchmark selettivi di ragionamento.
A cosa serve
Phi-4 si colloca in quella fascia di modelli che possono essere usati per attività cognitive complesse senza richiedere l'infrastruttura di un data center. È adatto a chatbot aziendali, assistenti interni, generazione e revisione di codice, tutoring matematico-scientifico, estrazione di informazioni strutturate da documenti e automazione di processi decisionali. La sua attitudine al ragionamento lo rende utile anche quando è necessario seguire una catena logica, risolvere problemi passo dopo passo o produrre spiegazioni strutturate.
La sua efficienza lo rende interessante anche per scenari edge e on-device: con quantizzazione appropriata, può girare su workstation dotate di GPU consumer o su hardware aziendale di fascia media. Le varianti della famiglia ampliano ulteriormente il campo d'azione. Phi-4 Mini conta 3,8 miliardi di parametri ed è pensato per dispositivi e applicazioni a bassa latenza. Phi-4 Reasoning è specializzato in compiti che richiedono ragionamento multi-step. Phi-4 Reasoning Vision estende queste capacità al ragionamento multimodale su testo e immagini. Phi-4 Multimodal integra invece audio, immagine e testo in un'unica architettura. Questa modularità permette di scegliere la variante più adatta al caso d'uso, senza dover ricorrere a un unico modello sovradimensionato.
Come funziona
Dal punto di vista architetturale, Phi-4 conserva la struttura decoder-only tipica dei transformer, con miglioramenti rispetto alla generazione precedente concentrati sui dati e sul curriculum di addestramento piuttosto che su un aumento massiccio dei parametri. Il modello è pre-addestrato su un corpus bilanciato di testi web filtrati, libri, codice e dati sintetici. La fase di post-training include tecniche di allineamento supervisionato e ottimizzazione basata su feedback, per rendere le risposte più utili, sicure e coerenti con le istruzioni dell'utente.
Il punto di forza di Phi-4 risiede nella qualità del dato più che nella quantità di parametri. Microsoft ha investito in pipeline di generazione e verifica sintetica che ampliano l'addestramento con esempi difficili, in particolare in matematica e logica. Nei benchmark standard di valutazione, Phi-4 ha raggiunto punteggi competitivi anche rispetto a modelli molto più grandi, specialmente sui compiti di reasoning e problem solving. La metrica MMLU, che misura la conoscenza su molteplici discipline, e i benchmark MATH e HumanEval, dedicati rispettivamente alla matematica e al coding, mostrano prestazioni elevate per una taglia così contenuta.