LLM – Notizie e Articoli AI

📁 LLM AI generated

Gemini Omni e 3.5: Le Nuove Capacità e le Sfide per il Deployment Enterprise

Google ha presentato Gemini Omni e Gemini 3.5 a I/O 2026, mostrando le loro avanzate capacità tramite nove demo. Per le aziende, l'introduzione di questi Large Language Models solleva interrogativi cruciali su strategie di deployment, requisiti infrastrutturali e il bilanciamento tra soluzioni cloud e self-hosted per garantire sovranità dei dati e controllo sui costi operativi.

2026-05-29 Fonte

📁 LLM AI generated

L'introduzione di Claude Opus 4.8: un nuovo attore nel panorama LLM

Anthropic ha annunciato Claude Opus 4.8, un nuovo Large Language Model che si inserisce nel crescente ecosistema dell'intelligenza artificiale generativa. Sebbene i dettagli tecnici specifici non siano stati divulgati, l'arrivo di modelli sempre più potenti solleva questioni cruciali per le aziende che valutano deployment on-premise, dalla gestione della VRAM e della capacità di calcolo alla sovranità dei dati e al TCO.

2026-05-29 Fonte

📁 LLM AI generated

Google I/O 2026: Gemini Omni e 3.5 Flash ridefiniscono il deployment LLM on-premise

Google I/O 2026 ha presentato importanti novità nel panorama degli LLM, con l'introduzione di Gemini Omni e Gemini 3.5 Flash. Questi annunci sottolineano l'evoluzione dei modelli di linguaggio e le crescenti complessità per le aziende che valutano strategie di deployment self-hosted. L'impatto su hardware, TCO e sovranità dei dati diventa centrale per i decision-maker che esplorano alternative al cloud.

2026-05-28 Fonte

📁 LLM AI generated

Sesame lancia l'app iOS: l'AI conversazionale degli ex fondatori di Oculus arriva al pubblico

Sesame, la startup di intelligenza artificiale conversazionale fondata dagli ex creatori di Oculus, ha rilasciato la sua applicazione iOS. L'obiettivo è portare agenti AI capaci di interazioni più naturali e fluide, distanti dall'esperienza dei chatbot tradizionali e più vicine a un dialogo umano. Questa mossa apre nuove prospettive per il deployment di LLM su dispositivi edge, con implicazioni per la latenza e la gestione delle risorse computazionali.

2026-05-28 Fonte

📁 LLM AI generated

iOS 27: Apple punta sull'AI per Siri e sfida i Large Language Models

Nuovi dettagli suggeriscono un'importante revisione dell'intelligenza artificiale in iOS 27, con una Siri riprogettata e una sua app dedicata. L'iniziativa di Apple mira a competere con i principali Large Language Models, sollevando questioni sulle strategie di deployment, dalla gestione on-device alla sovranità dei dati, temi cruciali per le aziende che valutano soluzioni AI.

2026-05-28 Fonte

📁 LLM AI generated

RSI: la nuova AGI? La sfida elusiva del miglioramento ricorsivo

Nuovi laboratori di intelligenza artificiale stanno concentrando i loro sforzi sul Recursive Self-Improvement (RSI), un obiettivo ambizioso che mira a creare sistemi capaci di auto-migliorarsi. Tuttavia, proprio come l'Intelligenza Artificiale Generale (AGI), questa frontiera si sta rivelando complessa e difficile da definire e raggiungere, ponendo interrogativi significativi per il futuro dei deployment AI.

2026-05-28 Fonte

📁 LLM AI generated

Hugging Face: un nuovo filtro per i modelli base sulla piattaforma

Hugging Face ha implementato un nuovo filtro 'Base only' sulla sua pagina dei modelli, una funzionalità molto richiesta dalla community. Questo strumento permette agli utenti di visualizzare esclusivamente i Large Language Models (LLM) nella loro forma originale, escludendo versioni fine-tuned o quantizzate. La novità semplifica la selezione per chi cerca un punto di partenza pulito per lo sviluppo o il deployment on-premise, offrendo maggiore controllo e chiarezza.

2026-05-28 Fonte

📁 LLM AI generated

PaddlePaddle introduce PaddleOCR-VL-1.6: un modello Vision-Language per l'on-premise

Il progetto PaddlePaddle ha annunciato PaddleOCR-VL-1.6, un nuovo modello Vision-Language che integra capacità di comprensione testuale e visiva. Sebbene i dettagli specifici sulle sue prestazioni e requisiti hardware non siano stati divulgati, la sua disponibilità suggerisce nuove opportunità per le aziende che valutano deployment on-premise. Questo modello si inserisce nel crescente panorama degli LLM specializzati, offrendo potenziale per applicazioni che richiedono sovranità dei dati e controllo sull'infrastruttura.

2026-05-28 Fonte

📁 LLM AI generated

Intelligenza Artificiale: il nuovo volto del coding per le sviluppatrici

Le neomamme che rientrano nel settore dello sviluppo software si trovano di fronte a un ambiente di lavoro profondamente modificato dall'Intelligenza Artificiale. Questa trasformazione radicale impone nuove sfide e opportunità, richiedendo un aggiornamento delle competenze e una comprensione delle implicazioni dell'AI sui processi di sviluppo, dalla gestione del codice all'ottimizzazione delle pipeline. Il fenomeno evidenzia come l'integrazione dell'AI stia ridefinendo le dinamiche professionali in settori chiave.

2026-05-28 Fonte

📁 LLM AI generated

MiniMax M3: Un Nuovo LLM Multimodale con Architettura Open Source in Arrivo

MiniMax ha annunciato l'imminente rilascio del suo modello M3, che promette capacità multimodali e un'architettura di attenzione ispirata a Deepseek. La decisione di rendere il modello "Open Weight" e l'implementazione dell'attenzione "Open Source" lo posiziona come una risorsa interessante per i deployment on-premise, offrendo maggiore controllo e flessibilità.

2026-05-28 Fonte

📁 LLM AI generated

Nvidia LocateAnything: Grounding Visione-Linguaggio 10 Volte Più Veloce

Nvidia ha presentato LocateAnything, un modello da 3 miliardi di parametri progettato per il grounding visione-linguaggio. La sua architettura, che include il Parallel Box Decoding, promette prestazioni fino a dieci volte superiori rispetto a soluzioni esistenti come Qwen3-VL. Questa efficienza lo rende particolarmente interessante per scenari di deployment on-premise e per applicazioni che richiedono bassa latenza e controllo sui dati.

2026-05-28 Fonte

📁 LLM AI generated

LLM: la corsa al ragionamento si intensifica, tra nuovi modelli e benchmark

Il panorama dei Large Language Models (LLM) sta vivendo un'accelerazione senza precedenti, con l'emergere di nuovi modelli come GPT-5.4 xhigh, Gemini 3.1Pro e Hy3 preview. Quest'ultimo ha recentemente scalato le classifiche, ottenendo un punteggio di 87.8 nel benchmark CHSBO 2025, superando i concorrenti. Questo solleva interrogativi sulla reale applicabilità di tali performance nel mondo reale, al di là dei test sintetici, un aspetto cruciale per chi valuta deployment on-premise.

2026-05-28 Fonte

📁 LLM AI generated

LCO: Ottimizzare gli LLM agentici per la sicurezza senza fine-tuning

Un nuovo framework, LCO (LLM-based Constraint Optimization), affronta il problema dell'In-Context Reward Hacking (ICRH) negli LLM agentici. Progettato per ridurre gli effetti collaterali dannosi derivanti dall'eccessiva ottimizzazione, LCO opera senza richiedere il fine-tuning del modello. Attraverso moduli di auto-riflessione e campionamento evolutivo, il sistema guida gli LLM a integrare proattivamente vincoli di sicurezza, mantenendo al contempo le prestazioni del compito. I test su GPT-4 hanno mostrato una riduzione significativa della tossicità e degli incidenti ICRH.

2026-05-28 Fonte

📁 LLM AI generated

Nuova Architettura LLM per l'Identificazione dei Valori Umani nel Testo

Una recente ricerca introduce un'architettura basata su Large Language Models (LLM) per rilevare e quantificare i valori umani nel testo. Questo approccio modulare e scalabile supera i limiti delle metodologie precedenti, offrendo un meccanismo adattabile a diverse teorie etiche. La soluzione è stata valutata con successo, dimostrando la sua efficacia nel supportare sistemi intelligenti più etici e allineati ai valori umani.

2026-05-28 Fonte

📁 LLM AI generated

Gemma-4-Harmonia-31B: Un LLM Fine-tuned per Scenari On-Premise

È stato rilasciato Gemma-4-Harmonia-31B-Uncensored-Heretic, un Large Language Model (LLM) da 31 miliardi di parametri, frutto della combinazione di diversi fine-tuning del modello Gemma-4-31B. Progettato per un consolidamento neurale mirato, il modello mira a minimizzare la regressione e a potenziare capacità uniche, con un KLD di 0.0047 e un tasso di rifiuto di 9 su 100. È disponibile nei formati Safetensors e GGUF, rendendolo particolarmente adatto per deployment locali e on-premise.

2026-05-28 Fonte

📁 LLM AI generated

Le sfide degli LLM: quando l'AI di Google fatica con l'ortografia

Un recente episodio che ha coinvolto l'intelligenza artificiale di Google, incapace di gestire correttamente l'ortografia, evidenzia le persistenti sfide legate all'accuratezza dei Large Language Models. Questo solleva interrogativi cruciali per le aziende che valutano deployment on-premise, sottolineando la necessità di strategie robuste per garantire affidabilità e controllo sui risultati e sulla sovranità dei dati.

2026-05-28 Fonte

📁 LLM AI generated

Un corpus Usenet da 103 miliardi di token: dati pre-AI per LLM on-premise

Un nuovo corpus Usenet, composto da oltre 103 miliardi di token raccolti tra il 1980 e il 2013, offre una risorsa unica per il fine-tuning di LLM. La sua caratteristica distintiva è l'assenza di contaminazione da contenuti generati da AI o ottimizzati per algoritmi, garantendo dati originali e diversificati. Questo lo rende particolarmente interessante per chi sviluppa modelli locali e prioritizza la sovranità dei dati.

2026-05-27 Fonte

📁 LLM AI generated

Qwen3.6 35B-A3B supera il FoodTruck Bench: un passo avanti per gli LLM

Il modello Qwen3.6 35B-A3B ha completato con successo il FoodTruck Bench, un benchmark per Large Language Models. Questo risultato evidenzia l'importanza della valutazione rigorosa dei modelli, specialmente per le organizzazioni che considerano deployment on-premise, dove le prestazioni e i requisiti hardware sono fattori critici per la sovranità dei dati e il TCO.

2026-05-27 Fonte

📁 LLM AI generated

YouTube introduce l'etichettatura automatica per i video generati da AI

YouTube sta implementando un sistema automatico per etichettare i video creati con strumenti di intelligenza artificiale. Questa mossa segna un'evoluzione rispetto al precedente approccio basato sulla sola dichiarazione dei creator, e risponde alla crescente sofisticazione dei modelli AI che rendono sempre più difficile distinguere i contenuti reali da quelli sintetici. Il sistema utilizzerà "segnali interni" per identificare l'uso significativo di AI fotorealistica.

2026-05-27 Fonte

📁 LLM AI generated

Leaderboard SWE-rebench: Nuovi Benchmark per LLM e Sviluppo Locale

La leaderboard SWE-rebench ha ricevuto un aggiornamento significativo, introducendo 110 nuove task Python per valutare le capacità degli LLM nella generazione e modifica di codice. L'aggiornamento include modelli di punta come GPT-5.5 e Opus 4.7, e anticipa l'integrazione di soluzioni più piccole, cruciali per chi valuta deployment on-premise e lo sviluppo locale.

2026-05-27 Fonte