LLM – Notizie e Articoli AI

📁 LLM AI generated

Gemma-4-Gembrain-31B-it-uncensored-heretic: il nuovo LLM per logica e creatività

È stato rilasciato Gemma-4-Gembrain-31B-it-uncensored-heretic, un nuovo Large Language Model basato su Gemma 4 31B. Frutto di un merge di diversi fine-tuning, il modello mira a potenziare il pensiero logico e la prosa creativa. Disponibile in formati Safetensors e GGUF, è ottimizzato per deployment on-premise, offrendo controllo e sovranità dei dati, con metriche specifiche come un KLD di 0.0186 e un tasso di rifiuto di 13/100.

2026-05-18 Fonte

📁 LLM AI generated

Qwen3.5 e WebGL: rendering fotorealistico in tempo reale con LLM locali

Un'implementazione basata su Qwen3.5-122B UD-Q3_K_XL dimostra la capacità di generare rendering fotorealistici di volti umani in tempo reale tramite WebGL. Questo approccio evidenzia il potenziale degli LLM altamente quantizzati per carichi di lavoro on-premise o edge, consentendo elaborazioni complesse direttamente sul dispositivo client e riducendo la dipendenza dal cloud. La soluzione offre vantaggi in termini di latenza, sovranità dei dati e TCO.

2026-05-17 Fonte

📁 LLM AI generated

OpenAI unifica ChatGPT e Codex: Brockman alla guida della strategia di prodotto

OpenAI, sotto la guida di Greg Brockman per la strategia di prodotto, intende integrare le capacità di ChatGPT e Codex in un'unica esperienza utente. Questa mossa strategica mira a semplificare l'interazione con i Large Language Models, offrendo un accesso più coeso a funzionalità che spaziano dalla conversazione alla generazione di codice. L'iniziativa potrebbe influenzare le future architetture di deployment per le aziende che valutano soluzioni LLM self-hosted.

2026-05-17 Fonte

📁 LLM AI generated

Soderbergh e l'AI di Meta nel documentario su Lennon: un caso studio controverso

Il nuovo documentario di Steven Soderbergh, "John Lennon: The Last Interview", presentato al 79° Festival di Cannes, ha suscitato dibattito per l'uso dell'intelligenza artificiale di Meta. Basato su un'intervista inedita del 1980, il film ha ricevuto critiche negative, ma il regista suggerisce che la reazione fosse intenzionale, sollevando interrogativi sull'applicazione dell'AI nell'arte e nella conservazione storica.

2026-05-17 Fonte

📁 LLM AI generated

La speranza di un Gemma da 124B: implicazioni per il deployment on-premise

Un post su Reddit ha acceso il dibattito sulla possibilità di avere LLM di grandi dimensioni, come un ipotetico Gemma da 124 miliardi di parametri, disponibili per il deployment self-hosted. Questa prospettiva solleva questioni cruciali riguardo ai requisiti hardware, alle sfide di Inference e ai trade-off tra controllo dei dati e costi infrastrutturali per le aziende che valutano soluzioni on-premise.

2026-05-17 Fonte

📁 LLM AI generated

OpenAI: Greg Brockman unifica ChatGPT e Codex per una piattaforma "agentica"

Greg Brockman, presidente e co-fondatore di OpenAI, assume la guida della strategia di prodotto, consolidando ChatGPT, Codex e l'API per sviluppatori in un'unica organizzazione. Questa mossa mira a creare una piattaforma "agentica" unificata, ottimizzando lo sviluppo e il deployment di Large Language Models. La riorganizzazione sottolinea l'importanza di un approccio integrato per l'evoluzione dei sistemi AI, con implicazioni significative per le strategie di adozione e gestione dei modelli da parte delle aziende che valutano soluzioni self-hosted.

2026-05-17 Fonte

📁 LLM AI generated

Quantization KV Cache per LLM on-premise: bilanciare VRAM e qualità

Un dibattito tra sviluppatori evidenzia la sfida di ottimizzare l'uso della VRAM per i Large Language Models (LLM) in deployment on-premise. La questione centrale riguarda la quantization del KV cache (Q4_0 vs Q8_0) e il suo impatto sulla qualità del modello, specialmente con finestre di contesto estese. La necessità di ridurre il fabbisogno di VRAM si scontra con il timore di compromettere le performance, un dilemma comune per chi gestisce infrastrutture locali.

2026-05-17 Fonte

📁 LLM AI generated

ArXiv introduce un divieto di un anno per i paper generati da IA non verificati

ArXiv, il noto repository open-access per preprint scientifici, ha annunciato una nuova politica. Gli autori che sottoporranno articoli con evidenti segni di generazione automatica tramite intelligenza artificiale, senza adeguata revisione umana, saranno banditi per un anno. La misura, comunicata da Thomas Dietterich, mira a preservare l'integrità della ricerca distribuita sulla piattaforma da oltre trent'anni.

2026-05-17 Fonte

📁 LLM AI generated

Valutazione delle tecniche di "abliteration" per LLM: un'analisi su Qwen3.6-27B

Un'analisi approfondita ha confrontato cinque varianti "abliterated" del modello Qwen3.6-27B, impiegando 85 ore di GPU su una singola RTX 5090. Lo studio ha esaminato benchmark di capacità, sicurezza e modifiche a livello di pesi, rivelando come le diverse tecniche influenzino le performance e la rimozione dei contenuti indesiderati. Heretic e Huihui emergono per la migliore preservazione delle capacità, mentre altre mostrano compromessi significativi.

2026-05-17 Fonte

📁 LLM AI generated

Deepseek V4 e la finestra di contesto da 1M: limiti e opportunità pratiche

Un'analisi approfondita della finestra di contesto da 1 milione di token di Deepseek V4 rivela prestazioni solide fino a 150.000 token, ma una significativa degradazione della precisione e un'elevata latenza oltre i 300.000. I test su codebase reali evidenziano la necessità di tecniche di prompt engineering avanzate e di un layer di validazione per l'uso in produzione, sottolineando i compromessi critici per le aziende che valutano deployment on-premise di LLM con ampie finestre di contesto.

2026-05-17 Fonte

📁 LLM AI generated

G4-Meromero-31B-Uncensored-Heretic: un LLM per compiti creativi

È stato rilasciato G4-Meromero-31B-Uncensored-Heretic, un LLM basato su Gemma 4 31B e ottimizzato per compiti creativi. Il modello, disponibile nei formati Safetensors e GGUF, presenta un basso tasso di rifiuto (15/100) e un KLD di 0.0100, suggerendo una maggiore flessibilità nella generazione di contenuti. La sua disponibilità in formati diversi lo rende adatto a vari scenari di deployment, inclusi quelli on-premise.

2026-05-17 Fonte

📁 LLM AI generated

OpenAI: Greg Brockman alla guida della strategia di prodotto e integrazione

Greg Brockman, co-fondatore di OpenAI, avrebbe assunto la direzione della strategia di prodotto dell'azienda. Questa mossa si inserisce in un contesto di riorganizzazione interna e precede i piani, anch'essi riportati, di integrare ChatGPT con Codex, il prodotto di programmazione di OpenAI, segnalando una potenziale evoluzione verso modelli più versatili e con implicazioni significative per le infrastrutture di Deployment.

2026-05-16 Fonte

📁 LLM AI generated

Qwen3.6-35B-A3B e 9B: i modelli open source che sfidano i giganti su Terminal-Bench 2.0

I modelli Qwen3.6-35B-A3B e Qwen3.5-9B hanno fatto il loro ingresso nella classifica pubblica di Terminal-Bench 2.0. In particolare, la versione 35B, integrata con little-coder, ha raggiunto un punteggio del 24.6%, superando modelli come Gemini 2.5 Pro. Questo risultato evidenzia la crescente capacità dei Large Language Models (LLM) di dimensioni più contenute, inferiori ai 10 miliardi di parametri, di competere in benchmark complessi, aprendo nuove prospettive per i deployment on-premise e l'innovazione open source che mira a ridurre i requisiti computazionali.

2026-05-16 Fonte

📁 LLM AI generated

Yoshua Bengio: l'AI potrebbe minacciare l'umanità entro un decennio

Yoshua Bengio, scienziato informatico vincitore del Turing Award e figura di spicco nell'intelligenza artificiale, ha ribadito il suo avvertimento. Secondo Bengio, le macchine superintelligenti potrebbero rappresentare una minaccia esistenziale per l'umanità entro i prossimi dieci anni. La sua posizione, espressa in un'intervista al Wall Street Journal e ripubblicata da Fortune, sottolinea l'urgenza di considerare le implicazioni a lungo termine dello sviluppo dell'AI.

2026-05-16 Fonte

📁 LLM AI generated

Databricks integra GPT-5.5 per agenti aziendali, elevando gli standard di settore

Databricks ha annunciato l'adozione di GPT-5.5 per i workflow di agenti aziendali. Questa mossa segue il raggiungimento di un nuovo stato dell'arte da parte del modello sul benchmark OfficeQA Pro. L'integrazione mira a migliorare l'efficienza e le capacità degli agenti AI in contesti enterprise, offrendo nuove prospettive per l'automazione e l'interazione in ambienti professionali complessi.

2026-05-16 Fonte

📁 LLM AI generated

Ottimizzare gli LLM on-premise: l'allocazione dinamica del compute e Qwen-35B-A3B

L'ottimizzazione delle risorse di calcolo per i Large Language Models (LLM) rappresenta una sfida cruciale, specialmente per i deployment on-premise. Un approccio che prevede l'allocazione dinamica del budget di compute e l'evoluzione modulare delle sezioni, utilizzando modelli come Qwen-35B-A3B, promette prestazioni paragonabili a quelle di LLM proprietari di fascia alta, offrendo nuove prospettive per le aziende che cercano controllo e sovranità dei dati.

2026-05-15 Fonte

📁 LLM AI generated

Orthrus-Qwen3-8B: Accelerazione fino a 7.8x per i Large Language Models con accuratezza invariata

Orthrus-Qwen3-8B introduce un'innovazione per l'inference degli LLM, promettendo un'accelerazione fino a 7.8x rispetto al modello base Qwen3-8B, mantenendo la stessa distribuzione di output. Questo approccio, che congela il backbone del modello e introduce un modulo di attenzione a diffusione, riduce significativamente i tempi di elaborazione. La soluzione si distingue per l'efficienza nell'uso della cache e l'assenza di penalità sul Time-To-First-Token, rendendola particolarmente interessante per i deployment on-premise che richiedono performance elevate e controllo sui costi.

2026-05-15 Fonte

📁 LLM AI generated

ArXiv inasprisce le regole: un anno di ban per contenuti generati da AI non verificati

ArXiv, il noto repository di preprint accademici, ha annunciato una nuova politica severa. Gli autori che presenteranno lavori scientifici con prove inconfutabili di contenuti generati da LLM senza un'adeguata verifica rischieranno un ban di un anno. La responsabilità della correttezza e originalità del materiale ricade interamente sugli autori, con sanzioni che includono anche l'obbligo di pubblicazione peer-reviewed successiva.

2026-05-15 Fonte

📁 LLM AI generated

Affidabilità degli LLM: la ricerca Microsoft sui workflow delegati a lungo termine

Microsoft Research ha pubblicato uno studio che esamina l'affidabilità dei Large Language Models (LLM) in compiti delegati a lungo termine. La ricerca evidenzia come i modelli possano accumulare errori semantici in workflow estesi, con una degradazione della fedeltà che può raggiungere il 19-34% su 20 iterazioni. Sebbene i sistemi di produzione possano mitigare questi effetti con meccanismi di verifica e orchestrazione, lo studio sottolinea la necessità di ulteriori sviluppi per rendere gli LLM collaboratori più affidabili in contesti professionali.

2026-05-15 Fonte

📁 LLM AI generated

OpenAI riorganizza i vertici: Greg Brockman assume il controllo dei prodotti

OpenAI ha annunciato una riorganizzazione dei suoi vertici, con Greg Brockman che assume la responsabilità diretta dei prodotti. L'obiettivo principale è unificare le esperienze di ChatGPT e Codex in un'unica offerta centrale, mirando a semplificare l'interazione per gli utenti e a consolidare la strategia di prodotto dell'azienda nel panorama degli LLM.

2026-05-15 Fonte