📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

Google ha annunciato Lyria 3 Pro, un modello AI evoluto per la creazione di musica. Questo strumento genera brani più lunghi e personalizzabili, integrandosi con Gemini e altre piattaforme aziendali. L'iniziativa espande le capacità musicali basate sull'intelligenza artificiale in diversi servizi Google.

2026-03-25 Fonte

Google introduce Lyria 3, l'ultima versione del suo modello di intelligenza artificiale per la generazione di musica. Il modello è disponibile in anteprima a pagamento tramite la Gemini API e per test in Google AI Studio, aprendo nuove possibilità per la creazione musicale assistita dall'AI.

2026-03-25 Fonte

Google porta Lyria 3, il suo modello di generazione musicale, direttamente negli strumenti di lavoro dei professionisti. L'obiettivo è semplificare e velocizzare il processo creativo, offrendo nuove possibilità per la composizione musicale all'interno dell'ecosistema Google.

2026-03-25 Fonte

Lo scorso settembre, OpenAI ha rilasciato una demo di Sora 2, generando un ampio dibattito sulle sue capacità di generazione video. Nonostante la demo non sia più disponibile, il lavoro di sviluppo sul modello continua internamente.

2026-03-25 Fonte

Google presenta TurboQuant, una tecnica per comprimere le cache KV dei modelli linguistici di grandi dimensioni (LLM) fino a 3 bit, ottenendo un incremento di performance fino a 8 volte su GPU Nvidia H100 senza perdita di accuratezza. Riduce i requisiti di memoria di almeno sei volte.

2026-03-25 Fonte

Un dipendente di DeepSeek ha anticipato l'arrivo di un nuovo modello linguistico di grandi dimensioni (LLM) che supererebbe le prestazioni dell'attuale DeepSeek V3.2. L'annuncio, poi rimosso, ha generato grande interesse nella comunità open source focalizzata su LLM.

2026-03-25 Fonte

Google Research presenta TurboQuant, un nuovo algoritmo di compressione per LLM che promette una riduzione di almeno 6 volte della memoria della cache chiave-valore e un aumento di velocità fino a 8 volte, senza sacrificare l'accuratezza. L'innovazione punta a ridefinire l'efficienza nell'ambito dell'intelligenza artificiale.

2026-03-25 Fonte

RWS ha presentato Language Weaver Pro, un nuovo modello di traduzione linguistica. Secondo l'azienda, il modello supera DeepL e Gemini in 31 delle 32 lingue testate internamente. Language Weaver Pro è integrato nel portafoglio Trados.

2026-03-25 Fonte

Un nuovo studio valuta l'efficacia di diverse strategie di prompting (Zero-Shot, Few-Shot, Chain-of-Thought) su modelli linguistici di grandi dimensioni (LLM) come GPT-3.5, GPT-4 e GPT-4o, applicate al question answering su grafici. L'analisi si concentra sull'accuratezza e l'aderenza al formato delle risposte, usando il dataset ChartQA.

2026-03-25 Fonte

Un nuovo studio esplora l'uso di Large Language Models (LLM) per la generazione di dati sintetici, con l'obiettivo di migliorare le performance di modelli più piccoli tramite fine-tuning. La ricerca si concentra sull'analisi della diversità dei dati generati nello spazio degli embedding e propone un metodo di campionamento mirato per ottimizzare le consegne.

2026-03-25 Fonte

Una ricerca esplora se il pensiero richieda un formato linguistico, come ipotizzato dalla teoria del Linguaggio del Pensiero (LoT). Simulazioni con agenti AI rivelano che protocolli di comunicazione emergenti superano in efficienza i linguaggi predefiniti, suggerendo che la cognizione collaborativa ottimale potrebbe non dipendere da strutture simboliche.

2026-03-25 Fonte

GigaChat ha rilasciato con licenza MIT i pesi dei suoi modelli GigaChat-3.1-Ultra (702B) e Lightning (10B). Ultra è progettato per ambienti ad alte risorse, mentre Lightning punta all'inference locale. Entrambi sono pre-addestrati da zero e ottimizzati per inglese e russo, con buone performance multilingua e tool calling. GigaChat-3.1-Lightning raggiunge 0.76 nel benchmark BFCLv3.

2026-03-25 Fonte

Un utente cerca modelli LLM capaci di competere con Claude Opus, ma con un vincolo estremo: soli 32MB di VRAM. La discussione esplora i limiti hardware e le possibili alternative, considerando l'esecuzione locale con Ollama su hardware obsoleto.

2026-03-25 Fonte

Il team di Reka AI, un laboratorio di ricerca focalizzato su modelli utili per applicazioni nel mondo reale, ha partecipato a una sessione AMA (Ask Me Anything) su Reddit, nel subreddit LocalLLaMA. L'attenzione si è concentrata sul loro modello Reka Edge e sulla direzione della loro ricerca, con un focus particolare sull'inference e le API.

2026-03-25 Fonte

HP introduce "HP IQ", una nuova applicazione AI locale integrata nei suoi portatili business. Questa applicazione permette di chattare, condividere file, registrare e riassumere le riunioni, con l'obiettivo di differenziare i prodotti HP nel mercato.

2026-03-25 Fonte

OpenAI ha interrotto Sora, la sua app basata sul modello di generazione video e audio Sora 2. Nonostante le impressionanti capacità del modello sottostante, l'interesse per un feed social interamente generato dall'intelligenza artificiale non è stato sufficiente a sostenerne la crescita.

2026-03-25 Fonte

OpenAI ha annunciato la chiusura di Sora, l'applicazione per la generazione di video che aveva suscitato grande interesse al suo lancio nel 2024. La società ha ringraziato gli utenti per il loro contributo e ha promesso maggiori dettagli sui tempi di chiusura e sulla conservazione dei lavori creati con la piattaforma.

2026-03-24 Fonte

La nuova modalità automatica di Claude Code di Anthropic consente all'AI di eseguire compiti con meno approvazioni. Questo riflette una tendenza verso strumenti più autonomi, che bilanciano velocità ed efficienza con meccanismi di sicurezza integrati. L'obiettivo è accelerare i processi mantenendo il controllo sui risultati.

2026-03-24 Fonte

Google TV si arricchisce con tre nuove funzionalità basate su Gemini: risposte visive, approfondimenti tematici e aggiornamenti sportivi. L'integrazione mira a fornire un'esperienza utente più interattiva e informativa direttamente sul televisore.

2026-03-24 Fonte

OpenAI rilascia policy di sicurezza basate su prompt per proteggere i più giovani nell'utilizzo di sistemi AI. Le policy sono pensate per gli sviluppatori che usano gpt-oss-safeguard, con l'obiettivo di moderare i rischi specifici per questa fascia d'età.

2026-03-24 Fonte