LLM – Notizie e Articoli AI

📁 LLM AI generated

Intel Auto-Round: la Quantization SOTA per LLM su CPU, XPU e CUDA

Intel ha rilasciato Auto-Round, un algoritmo di quantization all'avanguardia progettato per ottimizzare l'inference di LLM a bassa precisione con elevata accuratezza. La soluzione è compatibile con CPU, XPU e CUDA, supporta molteplici tipi di dati e si integra con framework come vLLM, SGLang e Transformers, offrendo flessibilità per i deployment on-premise.

2026-05-01 Fonte

📁 LLM AI generated

Rilasciato Gemma-4-31B-it-DFlash: un nuovo LLM per deployment locali

È stato annunciato il rilascio di Gemma-4-31B-it-DFlash, una nuova variante del modello Gemma di Google, ottimizzata per la lingua italiana. La sua disponibilità su Hugging Face e l'integrazione in sospeso con il framework `llama.cpp` suggeriscono un forte potenziale per l'inference efficiente su hardware locale. Questo modello si posiziona come una risorsa interessante per le organizzazioni che cercano soluzioni LLM self-hosted, privilegiando la sovranità dei dati e il controllo sull'infrastruttura.

2026-05-01 Fonte

📁 LLM AI generated

OpenAI e il rilascio selettivo di GPT-5.5-Cyber: un cambio di rotta?

OpenAI ha annunciato un rilascio limitato del suo nuovo modello GPT-5.5-Cyber, destinato a un gruppo selezionato di "cyber defender". Questa strategia di accesso controllato arriva a poche settimane di distanza dalle critiche mosse dalla stessa OpenAI ad Anthropic per un approccio simile, sollevando interrogativi sulla coerenza delle politiche di deployment dei Large Language Models e sulle implicazioni per l'adozione aziendale.

2026-05-01 Fonte

📁 LLM AI generated

OpenAI: l'IA genera l'80% del codice, ma la produttività resta un dibattito

Greg Brockman, presidente di OpenAI, ha dichiarato che l'intelligenza artificiale produce circa l'80% del codice dell'azienda. Questa affermazione, rilasciata alla conferenza Sequoia’s AI Ascent 2026, si inserisce in un trend di dichiarazioni ottimistiche sulla produttività dell'IA, sebbene le prove concrete sulla generazione di codice tramite IA siano ancora oggetto di discussione e analisi critica nel settore tecnicico.

2026-05-01 Fonte

📁 LLM AI generated

NVIDIA Gemma 4-26B-A4B-NVFP4: Ottimizzazione e Performance On-Premise

NVIDIA ha rilasciato una versione quantizzata a 4 bit del modello Gemma 2B, denominata Gemma 4-26B-A4B-NVFP4, ottimizzata per l'inference su hardware locale. Con una dimensione di 18.8GB, il modello è stato testato su GPU con 32GB di VRAM, dimostrando la capacità di gestire un contesto di circa 50.000 token. I benchmark indicano una minima variazione delle prestazioni rispetto alla versione a piena precisione, rendendolo una soluzione interessante per deployment self-hosted che richiedono efficienza e controllo sui dati.

2026-05-01 Fonte

📁 LLM AI generated

BatteryPass-12K: il primo dataset per la conformità ai passaporti digitali delle batterie

Un nuovo studio introduce BatteryPass-12K, il primo benchmark pubblico per la classificazione di conformità dei passaporti digitali delle batterie (DBP). Creato sinteticamente da campioni reali, il dataset risponde all'imminente regolamentazione UE. Le valutazioni su 22 Large Language Models (LLM) rivelano che i modelli più piccoli possono superare i più grandi e che gli attacchi di prompt injection degradano le performance, offrendo spunti cruciali per i deployment on-premise.

2026-05-01 Fonte

📁 LLM AI generated

CL-bench Life: I Large Language Models faticano con i contesti della vita reale

Un nuovo benchmark, CL-bench Life, rivela le difficoltà dei Large Language Models nel comprendere e ragionare su contesti complessi e disordinati della vita quotidiana. Valutando dieci LLM di frontiera, la ricerca evidenzia tassi di successo molto bassi, suggerendo la necessità di progressi significativi per assistenti AI più intelligenti e affidabili, con implicazioni dirette per i deployment on-premise.

2026-05-01 Fonte

📁 LLM AI generated

Migliorare i Masked Diffusion Models con l'Auto-Condizionamento Post-Training

Una nuova tecnica, Self-Conditioned Masked Diffusion Models (SCMDM), promette di ottimizzare i modelli di diffusione mascherati. Questa adattazione post-training, che richiede modifiche architettoniche minime, migliora l'inference condizionando ogni passo di denoising sulle previsioni precedenti del modello. I risultati mostrano una riduzione significativa della perplessità generativa e un miglioramento in sintesi di immagini, generazione molecolare e modellazione genomica, offrendo efficienza senza costosi re-training.

2026-05-01 Fonte

📁 LLM AI generated

Reti Neurali a Spike Binarie: Analisi Causale per l'AI Spiegabile

La ricerca introduce un'analisi causale delle Reti Neurali a Spike Binarie (BSNN), rappresentandone l'attività come un modello causale binario. Questo approccio permette di spiegare le decisioni della rete attraverso metodi logici, utilizzando risolutori SAT e SMT per generare spiegazioni abduttive. Testato sul dataset MNIST, il metodo offre spiegazioni a livello di pixel, garantendo l'assenza di caratteristiche irrilevanti, un vantaggio rispetto a tecniche come SHAP.

2026-05-01 Fonte

📁 LLM AI generated

LLM Locali: Aprile 2026 Segna un Picco per i Modelli Open?

Un recente dibattito nella community di `/r/LocalLLaMA` suggerisce che aprile 2026 potrebbe rappresentare un momento cruciale per i Large Language Models (LLM) open. L'attenzione si concentra sui modelli idonei per deployment self-hosted, evidenziando l'importanza delle licenze d'uso. Questo scenario è particolarmente rilevante per le aziende che valutano soluzioni on-premise per ragioni di sovranità dei dati e controllo sui costi.

2026-04-30 Fonte

📁 LLM AI generated

OpenAI limita l'accesso a GPT-5.5 Cyber per i difensori critici

OpenAI ha annunciato il rilascio del suo strumento di test per la cybersecurity, GPT-5.5 Cyber. L'accesso sarà inizialmente riservato esclusivamente ai "difensori critici della sicurezza informatica", evidenziando un approccio mirato alla distribuzione di tecnicie avanzate per la protezione dei dati e delle infrastrutture. Questa strategia solleva interrogativi sulle implicazioni per i deployment on-premise e la sovranità dei dati.

2026-04-30 Fonte

📁 LLM AI generated

Musk rivela: Grok di xAI addestrato su modelli OpenAI

Elon Musk ha testimoniato che xAI ha addestrato il suo LLM Grok utilizzando modelli di OpenAI. Questa rivelazione solleva interrogativi sulle pratiche di sviluppo nel settore degli LLM, in particolare riguardo alla "distillation", un tema caldo tra i laboratori di frontiera che cercano di proteggere la loro proprietà intellettuale dalla copia da parte di concorrenti minori. La questione evidenzia le sfide etiche e competitive nella corsa all'innovazione AI.

2026-04-30 Fonte

📁 LLM AI generated

Google porta Gemini nelle auto: l'AI conversazionale arriva sui veicoli

Google ha annunciato l'integrazione del suo assistente AI Gemini nei veicoli dotati di "Google built-in", segnando un'evoluzione significativa rispetto all'attuale Google Assistant. Questa mossa mira a introdurre un'intelligenza artificiale più avanzata e conversazionale nell'esperienza di guida, seguendo un annuncio simile da parte di General Motors. L'iniziativa evidenzia la crescente tendenza a portare capacità LLM direttamente sull'edge, con implicazioni per l'hardware e l'ottimizzazione.

2026-04-30 Fonte

📁 LLM AI generated

Qwen 3.6: i nuovi modelli da 27B e 35B ridefiniscono il panorama degli LLM?

I recenti modelli Qwen 3.6 da 27B e 35B parametri stanno generando un dibattito significativo nel settore degli LLM. Sembrano superare i predecessori nella fascia dei ~30B, inclusi Qwen Coder 30B, GPT OSS 20B e Gemma, in particolare per lo sviluppo di codice e i workflow per agenti. Questa evoluzione solleva interrogativi sulla rilevanza dei modelli più datati per i deployment on-premise, influenzando le decisioni su TCO e infrastruttura.

2026-04-30 Fonte

📁 LLM AI generated

Uber espande i servizi con prenotazioni alberghiere e assistente vocale AI

Uber ha annunciato l'introduzione di nuove funzionalità, tra cui la prenotazione di hotel e un assistente vocale basato su intelligenza artificiale. Queste novità, presentate il 29 aprile durante l'evento Go-Get a New York, nascono da una partnership con Expedia Group e mirano a offrire un'esperienza di viaggio più completa agli utenti. L'integrazione dell'AI è centrale per questa espansione.

2026-04-30 Fonte

📁 LLM AI generated

Granite 4.1: IBM e l'efficienza degli LLM da 8 miliardi di parametri

IBM ha presentato Granite 4.1, un Large Language Model da 8 miliardi di parametri. Questo modello si distingue per la sua capacità di competere in termini di prestazioni con LLM di dimensioni quattro volte superiori. L'annuncio evidenzia l'impegno di IBM nella ricerca di soluzioni AI efficienti, potenzialmente vantaggiose per scenari di deployment on-premise dove le risorse hardware sono un fattore critico.

2026-04-30 Fonte

📁 LLM AI generated

Qwen-Scope: Introspezione profonda e controllo granulare per i modelli Qwen 3.5

Il team Qwen ha rilasciato Qwen-Scope, una suite di Sparse Autoencoders (SAE) per la famiglia di modelli Qwen 3.5. Questo strumento permette di mappare e manipolare le caratteristiche interne dei modelli, offrendo un controllo senza precedenti su concetti specifici come il linguaggio tecnico o le risposte di rifiuto. Qwen-Scope facilita il debugging, l'analisi dei dataset e la personalizzazione del comportamento del modello, aspetti cruciali per deployment che richiedono sovranità e controllo.

2026-04-30 Fonte

📁 LLM AI generated

L'origine dei "goblins" negli LLM: trasparenza e controllo per l'infrastruttura locale

Un recente contributo di OpenAI, intitolato "Where the goblins came from", ha suscitato interesse nella comunità tech. Sebbene i dettagli specifici non siano stati divulgati, il titolo suggerisce un'esplorazione delle dinamiche interne e dei comportamenti emergenti dei Large Language Models. Questa discussione è cruciale per le organizzazioni che mirano a deployment on-premise, dove la comprensione approfondita del modello è fondamentale per garantire controllo, prevedibilità e sovranità dei dati.

2026-04-30 Fonte

📁 LLM AI generated

ICD: la nuova tecnica di jailbreak che aggira le difese di sicurezza degli LLM

Una nuova ricerca introduce Incremental Completion Decomposition (ICD), una strategia di jailbreak che aggira le difese di sicurezza dei Large Language Models. La tecnica sfrutta la generazione incrementale di singole parole per eludere i meccanismi di rifiuto, ottenendo un tasso di successo superiore sui benchmark di sicurezza. Questo studio evidenzia vulnerabilità critiche per le organizzazioni che implementano LLM, specialmente in contesti dove la sovranità dei dati e il controllo sono prioritari.

2026-04-30 Fonte

📁 LLM AI generated

LLM Leggeri per il Settore Sanitario: Efficienza e Privacy in Primo Piano

Una nuova analisi esplora l'efficacia dei Large Language Models (LLM) leggeri per il riconoscimento di entità nominate in ambito biomedico. Lo studio evidenzia come questi modelli, meno esigenti in termini computazionali, possano offrire prestazioni competitive rispetto alle controparti più grandi. Questa soluzione risponde alle stringenti esigenze di privacy e budget del settore sanitario, dimostrando il potenziale degli LLM ottimizzati per l'estrazione di informazioni mediche.

2026-04-30 Fonte