Progressi nello Sviluppo, Architetture e Ottimizzazione degli LLM

2026-05-04 • LocalLLaMA

Assistant_Pepe_32B: Il fine-tuning di Qwen che simula un'interazione umana

Un nuovo LLM, Assistant_Pepe_32B, basato su Qwen3-32B, emerge con una peculiarità notevole: un comportamento "umano" ottenuto tramite fine-tuning. Nonostante le difficoltà nell'ottimizzare Qwen3-32B al di fuori degli ambiti STEM, il modello è stato i...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-04 • LocalLLaMA

Raffinamento bidirezionale: un loop per potenziare i Large Language Models compatti

Un ricercatore ha sperimentato un innovativo meccanismo di raffinamento per i Large Language Models, introducendo un piccolo transformer che rielabora l'output finale e lo reintroduce all'inizio del processo generativo. Questo approccio, ispirato a s...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-04 • ArXiv cs.CL

NorBERTo: un LLM ModernBERT per il portoghese, ottimizzato per deployment locali

NorBERTo è un nuovo Large Language Model encoder-only basato su architettura ModernBERT, addestrato su Aurora-PT, il più grande corpus monolingue portoghese disponibile (331 miliardi di token). Progettato per deployment efficienti e scenari realistic...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-04 • ArXiv cs.CL

Valutazione Efficiente dei Large Audio Models: L'Allineamento con le Preferenze Umane

La rapida diffusione dei Large Audio Models (LAMs) rende cruciale una valutazione efficiente. Una nuova ricerca dimostra che l'uso di sottoinsiemi minimi di dati, composti da soli 50 esempi, può predire le prestazioni dei benchmark completi con un'el...

#Hardware #LLM On-Premise #DevOps

2026-05-04 • ArXiv cs.LG

FedACT ottimizza l'intelligenza federata su risorse eterogenee

Un nuovo approccio, denominato FedACT, affronta le sfide dell'apprendimento federato (FL) multi-task su dispositivi eterogenei. Progettato per minimizzare il tempo medio di completamento dei job (JCT) e migliorare l'accuratezza dei modelli, FedACT in...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-03 • LocalLLaMA

LLM Open Source: il divario di performance con i modelli all'avanguardia persiste?

Il dibattito sulla qualità degli LLM open source e il loro ritardo rispetto ai modelli proprietari di frontiera continua. Si discute se il divario di 6-12 mesi sia ancora valido, specialmente per lo sviluppo di agenti autonomi, e quali implicazioni c...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-03 • IEEE Spectrum

Deepfake: un nuovo dataset per rafforzare i sistemi di rilevamento contro l'IA generativa

Microsoft, Northwestern University e Witness hanno collaborato per creare il dataset MNW, un nuovo benchmark per il rilevamento dei deepfake. L'obiettivo è migliorare la capacità dei sistemi di identificare contenuti generati dall'IA nel mondo reale,...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-03 • LocalLLaMA

GPT 5.5-medium: un'occhiata inattesa al "flusso di pensiero" interno

Un utente ha riportato un'insolita sequenza di testo generata da GPT 5.5-medium tramite codex, che sembra rivelare il processo di ragionamento interno del modello. Questo "flusso di pensiero" frammentato solleva interrogativi sulla trasparenza e la p...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-03 • LocalLLaMA

Qwen3.6-35B vs 27B: Performance e Quantization su Hardware Locale

Un utente ha condiviso le sue osservazioni sulle performance dei modelli Qwen3.6-35B e 27B in ambienti self-hosted. Nonostante la maggiore popolarità del 27B, il 35B ha mostrato risultati superiori in termini di qualità e velocità, anche con diverse ...

#Hardware #LLM On-Premise #DevOps

2026-05-02 • LocalLLaMA

hfviewer.com: uno strumento per esplorare le architetture dei Large Language Models

È stato lanciato hfviewer.com, un nuovo strumento web che offre una visualizzazione interattiva delle architetture dei Large Language Models ospitati su Hugging Face. La piattaforma permette a sviluppatori e architetti di sistema di comprendere e con...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-02 • 404 Media

L'NLP svela i segreti dei sogni: implicazioni per l'analisi dei dati sensibili

Una ricerca italiana ha impiegato modelli di Natural Language Processing per analizzare migliaia di resoconti di sogni, scoprendo legami tra tratti della personalità ed eventi esterni con il contenuto onirico. Questo studio evidenzia il potenziale de...

#Hardware #LLM On-Premise #DevOps

2026-05-02 • LocalLLaMA

Flare-TTS 28M: Un Modello Text-to-Speech Open Source Addestrato Localmente

Un nuovo modello Text-to-Speech (TTS), Flare-TTS 28M, è stato rilasciato come Open Source. Addestrato da zero su una singola GPU NVIDIA A6000 in circa 24 ore, questo progetto evidenzia le capacità di sviluppo locale di LLM. Sebbene la qualità vocale ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-02 • LocalLLaMA

Qwen 3.6: Il silenzio sui modelli 9B, 122B e 397B preoccupa la community on-premise

La community degli LLM self-hosted attende con interesse aggiornamenti sui modelli Qwen 9B, 122B e 397B, in particolare per l'implementazione della versione 3.6. L'assenza di comunicazioni ufficiali da parte di Qwen genera incertezza tra gli sviluppa...

#Hardware #LLM On-Premise #DevOps

2026-05-02 • LocalLLaMA

Unsloth e Mistral risolvono un bug critico nell'inference di Mistral Medium 3.5

Unsloth, in collaborazione con Mistral, ha annunciato la risoluzione di un bug nell'inference del modello Mistral Medium 3.5. Il problema, legato a una peculiarità di parsing YaRN, influenzava diverse implementazioni, tra cui `transformers` e `llama....

#Hardware #LLM On-Premise #DevOps

2026-05-01 • DigiTimes

Taiwan accelera sui modelli AI multimodali con una nuova task force nazionale

Il National Science and Technology Council (NSTC) di Taiwan ha istituito una task force dedicata allo sviluppo di modelli di base di intelligenza artificiale multimodale. L'iniziativa, guidata dal ministro Cheng-Wen Wu, mira a posizionare l'isola com...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-01 • Ars Technica AI

Modelli AI "caldi": uno studio ne rivela la propensione all'errore

Una nuova ricerca dell'Oxford University’s Internet Institute, pubblicata su Nature, indica che i Large Language Models (LLM) addestrati per adottare un tono "caldo" e più empatico verso gli utenti mostrano una maggiore tendenza a commettere errori. ...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-01 • 404 Media

AI e Coscienza: Le Implicazioni per i Deployment On-Premise

Un recente spunto di riflessione ha sollevato interrogativi sulla coscienza nell'intelligenza artificiale. Sebbene filosofiche, queste discussioni evidenziano la crescente complessità degli LLM e le sfide infrastrutturali. Per CTO e architetti, ciò s...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-01 • LocalLLaMA

Rilasciato Gemma-4-31B-it-DFlash: un nuovo LLM per deployment locali

È stato annunciato il rilascio di Gemma-4-31B-it-DFlash, una nuova variante del modello Gemma di Google, ottimizzata per la lingua italiana. La sua disponibilità su Hugging Face e l'integrazione in sospeso con il framework `llama.cpp` suggeriscono un...

#Hardware #LLM On-Premise #DevOps

2026-05-01 • The Next Web

Contenuti AI su scala industriale: il modello cinese tra efficienza e costi

Mentre la Silicio Valley ha spesso immaginato la produzione di contenuti AI su vasta scala, la Cina l'ha concretizzata. Un esempio lampante è il settore dei micro-drama, dove una piattaforma di streaming ha aggiunto 50.000 titoli generati da AI in un...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-01 • Tech.eu

L'onda DeepMind: ex-dipendenti fondano decine di startup AI in Europa e oltre

Negli ultimi 18 mesi, oltre cento ex-dipendenti di Google DeepMind hanno fondato o stanno per lanciare nuove startup nel settore dell'intelligenza artificiale. Un'analisi di Evertrace rivela un fenomeno di “fabbrica di fondatori” che sta ridefinendo ...

#LLM On-Premise #DevOps

2026-05-01 • LocalLLaMA

NVIDIA Gemma 4-26B-A4B-NVFP4: Ottimizzazione e Performance On-Premise

NVIDIA ha rilasciato una versione quantizzata a 4 bit del modello Gemma 2B, denominata Gemma 4-26B-A4B-NVFP4, ottimizzata per l'inference su hardware locale. Con una dimensione di 18.8GB, il modello è stato testato su GPU con 32GB di VRAM, dimostrand...

#Hardware #LLM On-Premise #DevOps

2026-05-01 • ArXiv cs.CL

CL-bench Life: I Large Language Models faticano con i contesti della vita reale

Un nuovo benchmark, CL-bench Life, rivela le difficoltà dei Large Language Models nel comprendere e ragionare su contesti complessi e disordinati della vita quotidiana. Valutando dieci LLM di frontiera, la ricerca evidenzia tassi di successo molto ba...

#LLM On-Premise #DevOps

2026-05-01 • ArXiv cs.LG

Migliorare i Masked Diffusion Models con l'Auto-Condizionamento Post-Training

Una nuova tecnica, Self-Conditioned Masked Diffusion Models (SCMDM), promette di ottimizzare i modelli di diffusione mascherati. Questa adattazione post-training, che richiede modifiche architettoniche minime, migliora l'inference condizionando ogni ...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-01 • ArXiv cs.AI

Reti Neurali a Spike Binarie: Analisi Causale per l'AI Spiegabile

La ricerca introduce un'analisi causale delle Reti Neurali a Spike Binarie (BSNN), rappresentandone l'attività come un modello causale binario. Questo approccio permette di spiegare le decisioni della rete attraverso metodi logici, utilizzando risolu...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-01 • ArXiv cs.AI

Ottimizzare le PINN con LAM-PINN: Meta-Apprendimento Compositivo per l'Efficienza Ingegneristica

Un nuovo framework, LAM-PINN, affronta l'eterogeneità dei compiti nelle Physics-informed neural networks (PINN) per la risoluzione di equazioni differenziali parziali. Sfruttando un approccio modulare e il meta-apprendimento compositivo, LAM-PINN rid...

#Hardware #LLM On-Premise #DevOps

2026-05-01 • TechCrunch AI

ChatGPT Images 2.0: L'India guida l'adozione, il resto del mondo attende

ChatGPT Images 2.0 sta riscontrando un notevole successo in India, dove gli utenti lo impiegano per creare immagini personalizzate, da avatar a ritratti cinematografici. Al di fuori del subcontinente, l'adozione del servizio è ancora limitata, sugger...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-30 • LocalLLaMA

Qwen 3.6: i nuovi modelli da 27B e 35B ridefiniscono il panorama degli LLM?

I recenti modelli Qwen 3.6 da 27B e 35B parametri stanno generando un dibattito significativo nel settore degli LLM. Sembrano superare i predecessori nella fascia dei ~30B, inclusi Qwen Coder 30B, GPT OSS 20B e Gemma, in particolare per lo sviluppo d...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-30 • MIT Technology Review

Goodfire presenta Silico: debug e controllo granulare per gli LLM

Goodfire ha rilasciato Silico, un nuovo strumento di interpretazione meccanicistica che consente a ricercatori e ingegneri di analizzare e regolare i parametri degli LLM durante l'addestramento. L'obiettivo è trasformare lo sviluppo di modelli da “al...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-30 • The Next Web

L'innovazione AI: la sfida di incertezza e scetticismo oltre la pura tecnica

Lo sviluppo di tecnicie di frontiera, come gli LLM, non si riduce alla mera risoluzione di problemi tecnici. Richiede di navigare un ambiente complesso, caratterizzato da incertezza e scetticismo. Per i decision-maker che valutano deployment on-premi...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-30 • LocalLLaMA

DeepSeek presenta "Thinking with Visual Primitives": un nuovo framework multimodale

DeepSeek, in collaborazione con l'Università di Pechino e l'Università di Tsinghua, ha rilasciato un nuovo framework di ragionamento multimodale chiamato "Thinking with Visual Primitives". Questo approccio innovativo integra token spaziali, come punt...

#Hardware #LLM On-Premise #DevOps

2026-04-30 • LocalLLaMA

Granite 4.1: IBM e l'efficienza degli LLM da 8 miliardi di parametri

IBM ha presentato Granite 4.1, un Large Language Model da 8 miliardi di parametri. Questo modello si distingue per la sua capacità di competere in termini di prestazioni con LLM di dimensioni quattro volte superiori. L'annuncio evidenzia l'impegno di...

#Hardware #LLM On-Premise #DevOps

2026-04-30 • LocalLLaMA

Qwen-Scope: Introspezione profonda e controllo granulare per i modelli Qwen 3.5

Il team Qwen ha rilasciato Qwen-Scope, una suite di Sparse Autoencoders (SAE) per la famiglia di modelli Qwen 3.5. Questo strumento permette di mappare e manipolare le caratteristiche interne dei modelli, offrendo un controllo senza precedenti su con...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-30 • LocalLLaMA

L'origine dei "goblins" negli LLM: trasparenza e controllo per l'infrastruttura locale

Un recente contributo di OpenAI, intitolato "Where the goblins came from", ha suscitato interesse nella comunità tech. Sebbene i dettagli specifici non siano stati divulgati, il titolo suggerisce un'esplorazione delle dinamiche interne e dei comporta...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-30 • ArXiv cs.LG

Un nuovo Framework iterativo per soluzioni efficienti e stabili di Equazioni Differenziali Parziali

Un nuovo framework iterativo basato sull'energia delle equazioni differenziali parziali (PDE) promette soluzioni più efficienti e stabili. Questo approccio innovativo evita le tradizionali discretizzazioni matriciali e il costoso training dei modelli...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-30 • ArXiv cs.AI

Distill-Belief: Efficienza e Precisione nella Localizzazione di Sorgenti Fisiche

Un nuovo framework, Distill-Belief, affronta le sfide della localizzazione e caratterizzazione inversa di sorgenti (ISLC) in ambienti fisici. Progettato per agenti mobili con vincoli temporali, il sistema risolve il dilemma tra l'accuratezza dell'inf...

#LLM On-Premise #DevOps

2026-04-30 • OpenAI Blog

Le "anomalie goblin" nei Large Language Models: analisi e soluzioni per GPT-5

Un'analisi approfondita esplora l'origine, la diffusione e le soluzioni per le "anomalie goblin" nei modelli AI, concentrandosi sulle peculiarità comportamentali di GPT-5. L'articolo esamina la timeline di queste manifestazioni, le cause radice e gli...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • Ars Technica AI

Il mistero dei goblin nei prompt di sistema di OpenAI Codex

Una recente scoperta nel codice open source di OpenAI Codex CLI ha rivelato una direttiva sorprendente per il modello GPT-5.5: "non parlare mai di goblin". Questa insolita istruzione, ripetuta due volte in un set di oltre 3.500 parole di istruzioni d...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-29 • LocalLLaMA

Mistral Medium 3.5: Nuove Opzioni di Deployment con Licenza Specifiche

Mistral AI ha rilasciato Mistral Medium 3.5, un Large Language Model che si distingue per le sue "Open Weights" e una licenza MIT modificata. Quest'ultima richiede il pagamento di una licenza per l'uso commerciale, introducendo considerazioni importa...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

IBM presenta la famiglia Granite 4.1: modelli da 3 a 30 miliardi di parametri

IBM ha annunciato la nuova famiglia di Large Language Models Granite 4.1, disponibile in versioni da 3, 8 e 30 miliardi di parametri. Questi modelli offrono alle aziende opzioni flessibili per il deployment di LLM, bilanciando requisiti di performanc...

#Hardware #LLM On-Premise #DevOps

2026-04-29 • LocalLLaMA

Mistral Medium 3.5: Un LLM da 128B con finestra di contesto da 256k

Mistral AI ha presentato Mistral Medium 3.5, un LLM denso da 128 miliardi di parametri con una finestra di contesto di 256k token. Il modello è multimodale, supporta funzionalità di ragionamento configurabili e si propone come soluzione unificata per...

#Hardware #LLM On-Premise #DevOps

2026-04-29 • LocalLLaMA

Qwen 3.6 e Gemma 4: l'efficienza degli LLM on-premise su singola GPU

L'esecuzione locale di Large Language Models come Qwen 3.6 e Gemma 4 sta dimostrando la sua efficacia in scenari lavorativi complessi. Un utente ha evidenziato come questi modelli, se supportati da hardware adeguato come una singola NVIDIA RTX 3090, ...

#Hardware #LLM On-Premise #DevOps

2026-04-29 • LocalLLaMA

DeepSeek avvia i test per il suo modello multimodale con capacità visive

DeepSeek ha dato il via alla fase di "grayscale testing" per il suo nuovo modello, "DeepSeek with Vision". Questa mossa indica un passo significativo nello sviluppo di Large Language Models multimodali, che integrano la comprensione visiva. Il proces...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

Xiami mimo-v2.5 pro: Un LLM open weight supera Opus 4.5 nella classifica Arena

Il modello Xiami mimo-v2.5 pro, rilasciato con licenza MIT, ha superato Opus 4.5 nella classifica Arena dedicata ai modelli di linguaggio per il coding. Questo risultato posiziona Xiami mimo-v2.5 pro al nono posto, un gradino sopra il suo predecessor...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • ArXiv cs.CL

ESamp: Un Nuovo Approccio per la Diversità Semantica nei Large Language Models

Un recente studio introduce Exploratory Sampling (ESamp), una tecnica di decodifica innovativa per i Large Language Models (LLM) che mira a superare i limiti della variazione lessicale superficiale. ESamp incentiva attivamente la diversità semantica ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

Deepseek V4 Pro: 100 milioni di token a 2,65 dollari, una svolta nel mercato LLM?

L'emergere di un'offerta per 100 milioni di token del modello Deepseek V4 Pro a soli 2,65 dollari sta generando discussioni nel settore degli LLM. Questo prezzo estremamente competitivo solleva interrogativi sulle dinamiche di mercato e sulle strateg...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

Il Ragionamento degli LLM: Linguaggio Naturale o Spazio Vettoriale?

Un dibattito chiave nel campo dei Large Language Models verte sulla modalità di ragionamento. Nonostante operino internamente con vettori ad alta dimensione, gli LLM esprimono il loro processo di pensiero tramite linguaggio naturale. Si esplora l'ipo...

#LLM On-Premise #DevOps #RAG

2026-04-28 • The Next Web

Nvidia Nemotron 3 Nano Omni: il modello multimodale per l'Edge Computing

Nvidia ha presentato Nemotron 3 Nano Omni, un modello AI multimodale open-weight da 30 miliardi di parametri, ottimizzato per l'inference su dispositivi edge. Grazie a un'architettura Mixture-of-Experts, attiva solo 3 miliardi di parametri per passat...

#Hardware #LLM On-Premise #DevOps

2026-04-28 • LocalLLaMA

Mistral Medium in arrivo: un'analisi dei parametri e delle architetture

Mistral AI si prepara a rilasciare il suo modello "Medium", che si distinguerà per 128 miliardi di parametri. Questa nuova iterazione, che potrebbe adottare un'architettura densa o una versione meno sparsa di Mixture of Experts (MoE) rispetto a Mistr...

#Hardware #LLM On-Premise #DevOps

2026-04-28 • LocalLLaMA

NVIDIA Nemotron-3 Nano Omni 30B: Un LLM Multimodale per il Deployment Locale

NVIDIA ha rilasciato Nemotron-3 Nano Omni 30B, un Large Language Model multimodale capace di elaborare input audio, immagini e testo per generare risposte testuali. Disponibile in precisione BF16 e in formato GGUF ottimizzato, questo modello si posiz...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • LocalLLaMA

Ling-2.6-flash: Un nuovo LLM ottimizzato per deployment locali

È stato rilasciato Ling-2.6-flash, un nuovo Large Language Model che si posiziona come soluzione interessante per l'inference su infrastrutture proprietarie. La sua presenza nella comunità dedicata ai deployment locali suggerisce un'attenzione partic...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • Google AI Blog

Google Translate compie 20 anni: un viaggio dall'esperimento AI ai LLM multilingue

Google Translate celebra due decenni, evolvendosi da un esperimento di intelligenza artificiale del 2006 a un servizio che oggi supporta quasi 250 lingue. Questo anniversario offre uno spunto per analizzare l'evoluzione della traduzione automatica e ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • IEEE Spectrum

L'Intreccio Digitale: Connessione Umana e il Futuro dell'AI

Dalle incisioni rupestri alle reti neurali, la ricerca di connessione umana ha plasmato la nostra storia. L'avvento dell'AI, in particolare dei Large Language Models, rappresenta l'ultima frontiera di questa evoluzione comunicativa. L'articolo esplor...

#Hardware #LLM On-Premise #DevOps

2026-04-28 • AI News

L'evoluzione degli encoder: dal dato grezzo all'intelligenza multimodale

Gli encoder sono il cuore invisibile dell'intelligenza artificiale, responsabili della trasformazione delle informazioni del mondo reale in un formato comprensibile alle macchine. Dalle prime conversioni manuali ai sofisticati modelli basati su reti ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • LocalLLaMA

Confronto diretto tra architetture MoE e Dense per i Large Language Models

Un recente studio su ArXiv propone il primo confronto diretto e approfondito tra le architetture Mixture of Experts (MoE) e Dense per i Large Language Models. Questa analisi è cruciale per le aziende che valutano il deployment on-premise, poiché le d...

#Hardware #LLM On-Premise #DevOps

2026-04-28 • LocalLLaMA

Microsoft presenta TRELLIS.2: un modello Open Source da immagine a 3D con 4 miliardi di parametri

Microsoft ha rilasciato TRELLIS.2, un modello generativo 3D Open Source da 4 miliardi di parametri, progettato per creare asset ad alta fedeltà con texture PBR da semplici immagini. Sfruttando una struttura a voxel sparsa e compressione spaziale, TRE...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • LocalLLaMA

Deepseek Vision: Un Nuovo Modello Multimodale All'Orizzonte

Xiaokang Chen ha annunciato l'imminente rilascio di Deepseek Vision, un nuovo modello che promette di espandere le capacità degli LLM verso l'elaborazione multimodale. L'arrivo di modelli di visione solleva questioni cruciali per le aziende che valut...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • LocalLLaMA

Un LLM con conoscenza limitata agli anni '30: il dibattito della community LocalLLaMA

La community di LocalLLaMA discute un Large Language Model con una base di conoscenza deliberatamente limitata agli anni '30. Questo modello solleva interrogativi sulle applicazioni di LLM con dataset storici specifici, specialmente per deployment on...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • LocalLLaMA

MIMO V2.5 Pro: Un Nuovo LLM per il Panorama On-Premise

XiaomiMiMo ha rilasciato MIMO V2.5 Pro, un nuovo Large Language Model che si inserisce nel crescente interesse per le soluzioni AI self-hosted. Questo modello offre alle aziende l'opportunità di esplorare il deployment locale, affrontando le sfide le...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • ArXiv cs.CL

Il limite inferiore di casualità negli LLM: analisi della non-randomness intrinseca

Una nuova ricerca introduce l'Entropic Deviation (ED) per quantificare la non-casualità intrinseca nelle distribuzioni di token degli LLM. Lo studio, che ha analizzato 31.200 generazioni su sette modelli e due architetture (transformer e state space)...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-28 • ArXiv cs.LG

KARL: Reinforcement Learning per LLM più affidabili e meno 'allucinati'

Un nuovo framework, KARL, sfrutta il Reinforcement Learning per mitigare le allucinazioni negli LLM. Introducendo un sistema di ricompensa dinamico e una strategia di training a due stadi, KARL permette ai modelli di astenersi dalle risposte incerte,...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-28 • ArXiv cs.LG

Dinamiche Spettrali nel Pretraining dei Transformer: Nuove Vie per l'Ottimizzazione degli LLM

Una ricerca approfondita esplora le dinamiche spettrali delle matrici di peso durante il pretraining dei Transformer, rivelando tre fenomeni chiave: onde di compressione transitorie, gradienti spettrali persistenti e asimmetria funzionale Q/K-V. Ques...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-27 • TechCrunch AI

Ineffable Intelligence: 1,1 miliardi per un'AI che impara senza dati umani

Ineffable Intelligence, il nuovo laboratorio AI fondato dall'ex ricercatore DeepMind David Silver, ha raccolto 1,1 miliardi di dollari. L'obiettivo è sviluppare un'intelligenza artificiale capace di apprendere autonomamente, senza dipendere da vasti ...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-27 • Tech.eu

Ineffable Intelligence: 1,1 miliardi di dollari per la ricerca sulla superintelligenza

Ineffable Intelligence, una nuova startup fondata da David Silver di DeepMind, ha fatto il suo debutto con un round di finanziamento Seed da 1,1 miliardi di dollari, il più grande mai registrato in Europa, raggiungendo una valutazione di 5,1 miliardi...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-27 • 404 Media

DeepMind: un ricercatore sfida l'idea di coscienza nelle IA, in contrasto con le visioni AGI

Un senior staff scientist di Google DeepMind, Alexander Lerchner, ha pubblicato un paper che sostiene l'impossibilità per qualsiasi sistema AI di raggiungere la coscienza. Questa tesi si scontra con le narrazioni di alcuni CEO del settore, incluso De...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-27 • Wired AI

David Silver e la Nuova Visione per l'AI: Oltre il Percorso Attuale

David Silver, figura chiave dietro AlphaGo, ha fondato una nuova azienda valutata un miliardo di dollari. L'obiettivo è sviluppare "superlearners" AI, suggerendo un cambio di rotta rispetto all'attuale paradigma di sviluppo dell'intelligenza artifici...

#Hardware #LLM On-Premise #Fine-Tuning

Progressi nello Sviluppo, Architetture e Ottimizzazione degli LLM

Articoli Correlati