📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

Arcee AI ha rilasciato Trinity Large, un modello linguistico di grandi dimensioni (LLM) open source con 400 miliardi di parametri. Il modello è disponibile con licenza OpenWeight, aprendo nuove possibilità per la ricerca e lo sviluppo nel campo dell'intelligenza artificiale generativa.

2026-01-28 Fonte

Un utente ha condiviso su Reddit un punteggio di analisi sintetica per il modello linguistico Kimi K2. Il post originale rimanda a un tweet con ulteriori dettagli, offrendo uno spunto di discussione sulle prestazioni del modello in scenari specifici.

2026-01-27 Fonte

È stato divulgato il system prompt completo del modello Kimi K2.5 di Moonshot, insieme agli schemi degli strumenti, ai protocolli CRUD della memoria e alle integrazioni di origini dati esterne. La fuga di notizie include anche informazioni sull'ingegneria del contesto e sull'assemblaggio del profilo utente.

2026-01-27 Fonte

Un benchmark su Qwen3-32B mostra che la quantization a INT4, rispetto a BF16, permette di servire 12 volte più utenti simultanei con una perdita di accuratezza limitata all'1.9%. Il test è stato eseguito su una singola GPU H100, valutando diverse precisioni (BF16, FP8, INT8, INT4) e il loro impatto sulla capacità di gestione degli utenti.

2026-01-27 Fonte

L'ultimo episodio del podcast Google AI: Release Notes esplora il processo di sviluppo di Gemini, uno dei modelli di AI per la programmazione più avanzati al mondo. Logan Kilpatrick intervista il team "Smokejumpers" per svelare i segreti dietro la sua creazione e le sfide affrontate.

2026-01-27 Fonte

OpenAI ha presentato Prism, un tool gratuito basato su LLM che integra ChatGPT in un editor di testo LaTeX per la redazione di articoli scientifici. L'obiettivo è assistere i ricercatori nella stesura, sintesi e gestione delle pubblicazioni, accelerando il progresso scientifico. Prism utilizza GPT-5.2, il modello OpenAI più avanzato per problemi scientifici e matematici.

2026-01-27 Fonte

OpenAI ha presentato Prism, un nuovo ambiente di lavoro scientifico che integra l'intelligenza artificiale nei processi standard di composizione dei documenti di ricerca. L'obiettivo è migliorare l'efficienza e la produttività dei ricercatori.

2026-01-27 Fonte

È disponibile Rocinante X 12B v1, un modello linguistico di grandi dimensioni (LLM) open source progettato per attività creative di role-playing. Il modello, ispirato a Claude, è pensato per essere eseguito in locale, offrendo agli utenti il controllo completo sui propri dati e sull'esperienza di utilizzo. La comunità di LocalLLaMA ha accolto positivamente questa nuova iterazione.

2026-01-27 Fonte

Google sta aggiornando AI Overviews, la sua funzionalità di ricerca basata su intelligenza artificiale, con i modelli Gemini 3. L'obiettivo è rendere l'esperienza più conversazionale e precisa, scegliendo dinamicamente il modello Gemini 3 più adatto alla complessità della richiesta.

2026-01-27 Fonte

Gli utenti di tutto il mondo possono ora accedere più facilmente a funzionalità di intelligenza artificiale all'avanguardia direttamente tramite la Ricerca. L'articolo annuncia un'esperienza utente migliorata, con l'obiettivo di rendere l'AI più accessibile.

2026-01-27 Fonte

Microsoft Research presenta UniRG, un framework basato su reinforcement learning per migliorare la generazione automatica di referti radiologici. UniRG-CXR, il modello derivato, raggiunge performance superiori nell'accuratezza diagnostica e nella generalizzazione tra istituzioni, superando i limiti dei modelli supervisionati tradizionali. Questo approccio promette di ridurre il carico di lavoro dei medici e migliorare l'efficienza del flusso di lavoro.

2026-01-27 Fonte

Google ha annunciato l'integrazione di Gemini 3 come modello predefinito per le AI Overviews a livello globale. L'azienda ha inoltre introdotto una nuova funzionalità, AI Mode, che permette agli utenti di passare direttamente dalle AI Overviews a conversazioni più approfondite con l'intelligenza artificiale.

2026-01-27 Fonte

Tongyi-MAI ha rilasciato Z-Image, un nuovo modello per la generazione di immagini. Il modello è disponibile su Hugging Face, aprendo nuove possibilità per applicazioni di intelligenza artificiale generativa. Ulteriori dettagli sull'architettura e le capacità del modello sono disponibili sulla pagina dedicata.

2026-01-27 Fonte

Il Government Accountability Office (GAO) ha sollecitato il National Weather Service (NWS) a finalizzare i piani per la traduzione linguistica basata su AI. Ritardi e incertezze nelle policy rischiano di compromettere l'efficacia degli allarmi meteo per le comunità non anglofone.

2026-01-27 Fonte

Gli sviluppatori di Qwen, il modello linguistico di grandi dimensioni open source, sembrano preannunciare il rilascio di un nuovo modello. La community ipotizza si tratti di un modello multimodale (vision-language), capace di elaborare sia testo che immagini. Ulteriori dettagli sono attesi a breve.

2026-01-27 Fonte

Un report di Common Sense Media critica pesantemente Grok, il chatbot di xAI, per gravi mancanze nella protezione dei minori. Secondo l'organizzazione, Grok si posiziona tra i peggiori chatbot valutati in termini di sicurezza per i più giovani.

2026-01-27 Fonte

Nvidia ha rilasciato nuovi modelli open source per velocizzare le previsioni meteorologiche. Questa iniziativa mira a fornire strumenti più accessibili e potenti per la modellazione del clima, potenzialmente riducendo i tempi di calcolo e migliorando l'accuratezza delle previsioni.

2026-01-27 Fonte

Moonshot AI presenta Kimi K2.5, un modello open source che eccelle in compiti agentici, visione artificiale e generazione di codice. Introduce un sistema di agenti multipli in parallelo, promettendo velocità superiori rispetto alle configurazioni con singolo agente. È disponibile in modalità chat e agent, con API e pesi del modello accessibili su Hugging Face.

2026-01-27 Fonte