📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

📁 LLM AI generated

Google presenta Lyria 3 Pro per la generazione musicale AI

Google ha annunciato Lyria 3 Pro, un modello AI evoluto per la creazione di musica. Questo strumento genera brani più lunghi e personalizzabili, integrandosi con Gemini e altre piattaforme aziendali. L'iniziativa espande le capacità musicali basate sull'intelligenza artificiale in diversi servizi Google.

2026-03-25 Fonte

📁 LLM AI generated

Lyria 3: Google presenta il nuovo modello per la generazione musicale

Google introduce Lyria 3, l'ultima versione del suo modello di intelligenza artificiale per la generazione di musica. Il modello è disponibile in anteprima a pagamento tramite la Gemini API e per test in Google AI Studio, aprendo nuove possibilità per la creazione musicale assistita dall'AI.

2026-03-25 Fonte

📁 LLM AI generated

Lyria 3 Pro: Integrazione estesa nei prodotti Google

Google porta Lyria 3, il suo modello di generazione musicale, direttamente negli strumenti di lavoro dei professionisti. L'obiettivo è semplificare e velocizzare il processo creativo, offrendo nuove possibilità per la composizione musicale all'interno dell'ecosistema Google.

2026-03-25 Fonte

📁 LLM AI generated

OpenAI Sora: la demo è sparita, ma la ricerca continua

Lo scorso settembre, OpenAI ha rilasciato una demo di Sora 2, generando un ampio dibattito sulle sue capacità di generazione video. Nonostante la demo non sia più disponibile, il lavoro di sviluppo sul modello continua internamente.

2026-03-25 Fonte

📁 LLM AI generated

TurboQuant di Google: compressione LLM a 3 bit su Nvidia H100

Google presenta TurboQuant, una tecnica per comprimere le cache KV dei modelli linguistici di grandi dimensioni (LLM) fino a 3 bit, ottenendo un incremento di performance fino a 8 volte su GPU Nvidia H100 senza perdita di accuratezza. Riduce i requisiti di memoria di almeno sei volte.

2026-03-25 Fonte

📁 LLM AI generated

DeepSeek: in arrivo un modello LLM ancora più potente

Un dipendente di DeepSeek ha anticipato l'arrivo di un nuovo modello linguistico di grandi dimensioni (LLM) che supererebbe le prestazioni dell'attuale DeepSeek V3.2. L'annuncio, poi rimosso, ha generato grande interesse nella comunità open source focalizzata su LLM.

2026-03-25 Fonte

📁 LLM AI generated

TurboQuant di Google: compressione LLM estrema senza perdita di accuratezza

Google Research presenta TurboQuant, un nuovo algoritmo di compressione per LLM che promette una riduzione di almeno 6 volte della memoria della cache chiave-valore e un aumento di velocità fino a 8 volte, senza sacrificare l'accuratezza. L'innovazione punta a ridefinire l'efficienza nell'ambito dell'intelligenza artificiale.

2026-03-25 Fonte

📁 LLM AI generated

RWS lancia Language Weaver Pro, modello di traduzione avanzato

RWS ha presentato Language Weaver Pro, un nuovo modello di traduzione linguistica. Secondo l'azienda, il modello supera DeepL e Gemini in 31 delle 32 lingue testate internamente. Language Weaver Pro è integrato nel portafoglio Trados.

2026-03-25 Fonte

📁 LLM AI generated

Strategie di Prompting per LLM e Dati Strutturati: un'Analisi

Un nuovo studio valuta l'efficacia di diverse strategie di prompting (Zero-Shot, Few-Shot, Chain-of-Thought) su modelli linguistici di grandi dimensioni (LLM) come GPT-3.5, GPT-4 e GPT-4o, applicate al question answering su grafici. L'analisi si concentra sull'accuratezza e l'aderenza al formato delle risposte, usando il dataset ChartQA.

2026-03-25 Fonte

📁 LLM AI generated

Generazione di dati sintetici tramite embedding per task complessi

Un nuovo studio esplora l'uso di Large Language Models (LLM) per la generazione di dati sintetici, con l'obiettivo di migliorare le performance di modelli più piccoli tramite fine-tuning. La ricerca si concentra sull'analisi della diversità dei dati generati nello spazio degli embedding e propone un metodo di campionamento mirato per ottimizzare le consegne.

2026-03-25 Fonte

📁 LLM AI generated

Comunicazione AI: protocolli efficienti battono il linguaggio umano?

Una ricerca esplora se il pensiero richieda un formato linguistico, come ipotizzato dalla teoria del Linguaggio del Pensiero (LoT). Simulazioni con agenti AI rivelano che protocolli di comunicazione emergenti superano in efficienza i linguaggi predefiniti, suggerendo che la cognizione collaborativa ottimale potrebbe non dipendere da strutture simboliche.

2026-03-25 Fonte

📁 LLM AI generated

GigaChat rilascia modelli open source Ultra (702B) e Lightning (10B)

GigaChat ha rilasciato con licenza MIT i pesi dei suoi modelli GigaChat-3.1-Ultra (702B) e Lightning (10B). Ultra è progettato per ambienti ad alte risorse, mentre Lightning punta all'inference locale. Entrambi sono pre-addestrati da zero e ottimizzati per inglese e russo, con buone performance multilingua e tool calling. GigaChat-3.1-Lightning raggiunge 0.76 nel benchmark BFCLv3.

2026-03-25 Fonte

📁 LLM AI generated

LLM: sfide con 32MB di VRAM e alternative a Claude Opus

Un utente cerca modelli LLM capaci di competere con Claude Opus, ma con un vincolo estremo: soli 32MB di VRAM. La discussione esplora i limiti hardware e le possibili alternative, considerando l'esecuzione locale con Ollama su hardware obsoleto.

2026-03-25 Fonte

📁 LLM AI generated

Reka AI risponde alle domande su LocalLLaMA: focus sull'edge

Il team di Reka AI, un laboratorio di ricerca focalizzato su modelli utili per applicazioni nel mondo reale, ha partecipato a una sessione AMA (Ask Me Anything) su Reddit, nel subreddit LocalLLaMA. L'attenzione si è concentrata sul loro modello Reka Edge e sulla direzione della loro ricerca, con un focus particolare sull'inference e le API.

2026-03-25 Fonte

📁 LLM AI generated

HP integra un LLM di OpenAI nei suoi nuovi portatili

HP introduce "HP IQ", una nuova applicazione AI locale integrata nei suoi portatili business. Questa applicazione permette di chattare, condividere file, registrare e riassumere le riunioni, con l'obiettivo di differenziare i prodotti HP nel mercato.

2026-03-25 Fonte

📁 LLM AI generated

Sora di OpenAI chiude: l'esperimento social AI non decolla

OpenAI ha interrotto Sora, la sua app basata sul modello di generazione video e audio Sora 2. Nonostante le impressionanti capacità del modello sottostante, l'interesse per un feed social interamente generato dall'intelligenza artificiale non è stato sufficiente a sostenerne la crescita.

2026-03-25 Fonte

📁 LLM AI generated

OpenAI chiuderà Sora dopo soli 15 mesi dal lancio

OpenAI ha annunciato la chiusura di Sora, l'applicazione per la generazione di video che aveva suscitato grande interesse al suo lancio nel 2024. La società ha ringraziato gli utenti per il loro contributo e ha promesso maggiori dettagli sui tempi di chiusura e sulla conservazione dei lavori creati con la piattaforma.

2026-03-24 Fonte

📁 LLM AI generated

Claude Code di Anthropic: più controllo AI, ma con limiti

La nuova modalità automatica di Claude Code di Anthropic consente all'AI di eseguire compiti con meno approvazioni. Questo riflette una tendenza verso strumenti più autonomi, che bilanciano velocità ed efficienza con meccanismi di sicurezza integrati. L'obiettivo è accelerare i processi mantenendo il controllo sui risultati.

2026-03-24 Fonte

📁 LLM AI generated

Google TV: Gemini porta aggiornamenti sportivi e risposte visive

Google TV si arricchisce con tre nuove funzionalità basate su Gemini: risposte visive, approfondimenti tematici e aggiornamenti sportivi. L'integrazione mira a fornire un'esperienza utente più interattiva e informativa direttamente sul televisore.

2026-03-24 Fonte

📁 LLM AI generated

OpenAI: policy di sicurezza AI per i più giovani

OpenAI rilascia policy di sicurezza basate su prompt per proteggere i più giovani nell'utilizzo di sistemi AI. Le policy sono pensate per gli sviluppatori che usano gpt-oss-safeguard, con l'obiettivo di moderare i rischi specifici per questa fascia d'età.

2026-03-24 Fonte