
Kimi K2.7 Code: modello open-weight da 1T parametri per il coding
Un Mixture-of-Experts specializzato nel codice, rilasciato da Moonshot AI con licenza Modified MIT e contesto fino a 256.000 token.
Cos'è
Kimi K2.7 Code è un grande modello linguistico specializzato nella generazione, comprensione e modifica di codice, sviluppato da Moonshot AI, l'azienda cinese dietro l'assistente Kimi. Annunciato e rilasciato il 12 giugno 2026, si colloca come evoluzione diretta della famiglia K2.6, con un tuning specifico per task di programmazione, ragionamento strutturato e uso di strumenti esterni. A differenza di molti modelli closed-source, K2.7 Code viene distribuito in forma di pesi aperti — tecnicamente open-weight — sotto una licenza Modified MIT, il che consente di scaricarlo, ispezionarlo e ospitarlo autonomamente, a patto di rispettare alcune clausole aggiuntive rispetto alla MIT standard.
Le specifiche tecniche lo collocano nella fascia alta dei modelli attuali: 1 trilione di parametri totali, con architettura Mixture-of-Experts (MoE) che attiva circa 32 miliardi di parametri per token durante l'inferenza. Il contesto massimo è di 256.000 token, una finestra ampia quanto basta per ingestire file di grandi dimensioni, intere cartelle di progetto o lunghe tracce di conversazione tecnica. Secondo le prime schede tecniche diffuse da Moonshot, il modello è composto da 61 livelli transformer, utilizza Multi-head Latent Attention (MLA) e attivazione SwiGLU, con un vocabolario di circa 160.000 token. Gli esperti sono 384, di cui 8 selezionati per token più uno condiviso. Un dettaglio rilevante è l'addestramento con quantizzazione nativa INT4, tecnica che permette di ridurre l'occupazione in memoria senza ricorrere a quantizzazioni post-hoc, preservando meglio la qualità dei pesi.
A cosa serve
Kimi K2.7 Code è pensato principalmente per l'assistenza alla programmazione in senso lato: scrittura di funzioni, refactoring, generazione di test, debugging, spiegazione di codebase legacy e conversione tra linguaggi. La sua specializzazione lo rende adatto a scenari in cui un modello generalista risulta troppo generico o incline a produrre codice tecnicamente plausibile ma difettoso.
Grazie al forte punteggio su benchmark come SWE-bench e derivati, il modello può essere impiegato anche per risolvere bug reali all'interno di repository pubblici o privati, tipicamente in configurazione agentica: il modello legge issue, esplora il codice, propone patch e le valida con test. L'integrazione con protocolli come MCP (Model Context Protocol) lo rende inoltre adatto a scenari di tool use, in cui l'agente può invocare strumenti esterni — terminali, database, ricerche semantiche, API — per portare a termine compiti complessi.
Il contesto di 256.000 token lo rende particolarmente utile per lavorare su codebase di grandi dimensioni, dove è necessario mantenere in memoria decine di file correlati, o per analizzare log, documentazione tecnica e specifiche di progetto in un'unica sessione. Per aziende, startup e agenzie italiane che gestiscono progetti software interni, questo si traduce in una riduzione del tempo speso a spezzare il codice in chunk più piccoli da passare al modello.