Ultime Notizie (IT)

Kimi K2.6 della startup cinese Moonshot AI supera i rivali nei benchmark di codici e agenti

Kimi
Kimi - site www.kimi.com

Il modello Kimi K2.6 di Moonshot AI è stato rilasciato il 21 aprile 2026. Il sistema ha un’architettura di mixaggio esperto con 1 trilione di parametri totali e ne attiva circa 32 miliardi per richiesta. Ele elabora il contesto per circa 260.000 token e include funzionalità multimodali per immagini e video.

Il lancio ha evidenziato le prestazioni nei test pratici. L’azienda ha riportato il 58,6% su SWE-Bench Pro, un parametro che valuta la reale modifica del codice. I risultati di Outros includono l’83,2% su SfogliaComp, un’attività che prevede la navigazione sul web. Moonshot AI ha confrontato questi numeri con modelli come GPT-5.4 di OpenAI e Claude Opus 4.6 di Anthropic.

Kimi K2.6 è stato rilasciato come open source. I pesi sono disponibili su piattaforme come Hugging Face. Suporte è già disponibile nei motori di inferenza come vLLM e OpenRouter.

Modelo si concentra sull’esecuzione autonoma delle attività

Il punto forte va oltre i benchmark. Il modello esegue lunghe sequenze di azioni senza intervento costante. L’Relatos dell’azienda riporta oltre 4.000 chiamate agli strumenti e un funzionamento continuo per oltre 12 ore. Un caso menzionato riguardava la gestione autonoma dell’infrastruttura per cinque giorni.

OpenAI ChatGPT
OpenAI ChatGPT – Foto: One Artist / Shutterstock.com

Operazione Nessa, il sistema ha rilevato, identificato, corretto e verificato gli errori del server e del cloud. Il processo normalmente richiede che un team umano lavori 24 ore al giorno per sette giorni. Aqui, Kimi K2.6 hanno agito da soli.

Il design consente l’esecuzione in parallelo di un massimo di 300 subagenti. Il framework Essa aiuta a scomporre attività complesse in parti più piccole che operano contemporaneamente. Moonshot AI chiama questa operazione ingegneria dell’integrazione, in cui l’attenzione si sposta dal modello isolato ai sistemi che combinano più agenti.

Startup basato su Pequim ha un background tecnico

Moonshot AI è stata fondata nel marzo 2023 presso Pequim. Il nome in cinese deriva dall’album The Dark Side degli Moon, della band Pink Floyd. Il fondatore e CEO Yang Zhilin ha scelto che la data di fondazione coincidesse con il 50° anniversario del record.

Yang Zhilin ha conseguito una laurea in informatica presso Universidade Tsinghua. Ele ha completato il suo dottorato di ricerca presso Carnegie Mellon University in meno di quattro anni. Durante ha studiato, ha svolto uno stage presso Google Brain ed è stato coautore di opere come Transformer-XL e XLNet, che hanno influenzato i modelli linguistici attuali.

I co-fondatori includono ex membri di un gruppo rock in cui Yang era un batterista. L’azienda gestisce sale riunioni che prendono il nome da band occidentali.

Antes da Kimi K2.6, Moonshot ha rilasciato le versioni precedenti della famiglia Kimi. Elas includeva un focus sul contesto lungo e funzioni di agente autonomo. Nel marzo 2026, gli sviluppatori hanno notato che uno strumento di programmazione americano chiamato Cursor utilizzava una versione precedente di Kimi come base per le funzionalità principali. Cursor ha oltre 1 milione di utenti attivi giornalieri e entrate ricorrenti annuali nell’ordine di miliardi di dollari.

Lançamento rafforza il dibattito sugli ecosistemi IA

Il caso di Cursor ha attirato l’attenzione perché ha mostrato l’adozione pratica del modello cinese in uno strumento sviluppato da Estados Unidos. La scoperta è avvenuta senza la divulgazione iniziale da parte di Cursor. Depois, i dirigenti hanno confermato l’utilizzo della base aperta con ulteriori aggiustamenti.

Isso è arrivato nel mezzo delle discussioni sulla possibile separazione tra gli ecosistemi AI americani e cinesi. Argumentos cita differenze normative, di sicurezza e di valore. In pratica, quando sono comparsi modelli aperti e competitivi, gli ingegneri hanno dato priorità alle prestazioni e ai costi.

Kimi K2.6 viene fornito con il supporto nativo per più linguaggi di programmazione, come Python, Rust e Go. Ele genera interfacce utente da descrizioni in linguaggio naturale, comprese animazioni ed effetti visivi. La multimodalità consente di elaborare immagini e video direttamente nel modello principale.

Detalhes Kimi Tecnici K2.6

  • Arquitetura: Mix di esperti (MoE) con 1 trilione di parametri totali
  • Parâmetros asset per richiesta: circa 32 miliardi
  • Contesto Janela: circa 260mila token
  • Capacidades: multimodale (testo, immagine, video), generazione di codice, funzionamento dell’agente
  • Disponibilidade: pesi aperti in Hugging Face, integrazione con vLLM e OpenRouter
  • Benchmarks evidenziato: 58,6% su SWE-Bench Pro, 83,2% su SfogliaComp

Moonshot AI posiziona il modello per scenari a lungo termine. Exemplos include l’ottimizzazione del codice in repository di grandi dimensioni, la creazione di siti Web completi e l’automazione dei flussi di lavoro che richiedono dozzine o centinaia di passaggi.

Il lancio è avvenuto il 21 aprile 2026. Il modello è ora accessibile sul sito Kimi, nell’app e tramite API. Variantes include modalità per chat, ragionamento e azione come agente.

Comunidade testa casi d’uso reali

Desenvolvedores ha segnalato i test iniziali poco dopo il lancio. Alguns ha menzionato l’esecuzione di attività infrastrutturali senza intervento per periodi prolungati. Outros ha evidenziato la capacità di generare front-end complessi con elementi visivi da semplici istruzioni.

Il rilascio come open source facilita la sperimentazione in ambienti diversi. Empresas e i ricercatori possono modificare il modello o integrarlo nelle proprie pipeline. Isso contrasta con gli approcci chiusi di alcuni laboratori americani.

L’attenzione agli agenti autonomi riflette una tendenza più ampia nell’area. Invece di risposte isolate alle domande, i sistemi ora cercano di completare obiettivi completi con pianificazione, esecuzione e correzione degli errori nel tempo.

L’intelligenza artificiale di Moonshot indica che Kimi K2.6 rappresenta un progresso nella capacità di mantenere un funzionamento utile per ore o giorni. La funzionalità Essa può ridurre la necessità di supervisione umana in attività di ingegneria del software ripetitive o complesse.

To Top