Sviluppo e Ricerca LLM

2026-05-26 • LocalLLaMA

Qwen3.5 27B: un LLM versatile per deployment on-premise con MTP preservati

È stato rilasciato Qwen3.5 27B, un Large Language Model ottimizzato per l'assistenza AI generica, che mantiene intatte le sue 15 capacità di Multi-Turn Preservation (MTP). Disponibile in diversi formati come Safetensors, GGUFs, NVFP4 e GPTQ-Int4, il ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-26 • LocalLLaMA

Qwen3.5 35B A3B: Un Nuovo LLM per Usi Generali, Ottimizzato per Deployment Locali

Il modello Qwen3.5 35B A3B, sviluppato da llmfan46, è ora disponibile in diverse configurazioni ottimizzate per l'inference su hardware locale, inclusi formati GGUF e GPTQ-Int4. Questo LLM, che mantiene 785 MTPs, si distingue per la sua architettura ...

#Hardware #LLM On-Premise #DevOps

2026-05-26 • ArXiv cs.CL

Raon-Speech e Raon-SpeechChat: LLM open source per la comprensione e generazione vocale

Presentati Raon-Speech e Raon-SpeechChat, due modelli di linguaggio vocale (SpeechLM) da 9 miliardi di parametri. Raon-Speech eccelle nella comprensione e generazione vocale in inglese e coreano, mantenendo solide capacità testuali. Raon-SpeechChat e...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-26 • ArXiv cs.AI

La calibrazione della fiducia negli LLM: tra eccesso e difetto

Un nuovo studio rivela che i Large Language Models (LLM) mostrano una calibrazione della fiducia complessa: tendono a essere eccessivamente fiduciosi su compiti difficili e, sorprendentemente, sotto-fiduciosi su quelli facili. La ricerca introduce Li...

#Hardware #LLM On-Premise #DevOps

2026-05-25 • LocalLLaMA

MiniCPM5-1B: Un LLM compatto per deployment on-premise e edge

MiniCPM5-1B emerge come un nuovo Large Language Model da 5.1 miliardi di parametri, progettato per l'efficienza e l'esecuzione su hardware meno potente. La sua natura Open Source e le dimensioni contenute lo rendono particolarmente interessante per s...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-25 • LocalLLaMA

Grok: un modello da 0.5T parametri in arrivo e l'impegno open source

xAI ha annunciato l'arrivo, previsto per il prossimo anno, di un nuovo modello Grok da 0.5 Trillion di parametri. Parallelamente, Grok-3 ha aderito a un'iniziativa per il rilascio Open Source. Questo sviluppo solleva importanti considerazioni per le ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-25 • LocalLLaMA

MiMo-V2.5-coder: Un Nuovo LLM per lo Sviluppo On-Premise con 128 GB VRAM

È stato rilasciato MiMo-V2.5-coder, un nuovo Large Language Model ottimizzato per attività di coding e tool calling. Richiede 128 GB di VRAM, posizionandosi come un'alternativa per deployment self-hosted. Il modello, disponibile con quantization Q2, ...

#Hardware #LLM On-Premise #DevOps

2026-05-25 • LocalLLaMA

LLM e raccomandazioni musicali open source: la sfida dei dati proprietari

La ricerca di sistemi di raccomandazione musicale open source, simili a Spotify, evidenzia il potenziale dei Large Language Models. Tuttavia, l'accesso ai dati di ascolto degli utenti, spesso custoditi in ecosistemi chiusi, rappresenta un ostacolo si...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-25 • ArXiv cs.AI

NeuroNL2LTL: Il Ponte Neurosimbolico tra Linguaggio Naturale e Logica LTL

NeuroNL2LTL è un nuovo framework neurosimbolico che affronta la sfida di tradurre il linguaggio naturale in Logica Temporale Lineare (LTL) con garanzie di correttezza formale. A differenza degli approcci puramente neurali o basati su template, NeuroN...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-25 • ArXiv cs.CL

QASC: Il Chunking Adattivo alle Query che Potenzia i Sistemi RAG

Una nuova ricerca introduce Query-Adaptive Semantic Chunking (QASC), una strategia dinamica per il chunking dei documenti nei sistemi Retrieval-Augmented Generation (RAG). Integrando le query utente nella fase di segmentazione, QASC migliora signific...

#Hardware #LLM On-Premise #DevOps

2026-05-25 • ArXiv cs.CL

Risorse NLP per Hausa e Fongbe: uno sguardo tra disponibilità e lacune

Una recente indagine ha catalogato le risorse testuali e vocali pubblicamente disponibili per Hausa e Fongbe, due lingue dell'Africa occidentale. Lo studio evidenzia una maggiore diversità di risorse testuali per Hausa, mentre Fongbe beneficia di rec...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-25 • ArXiv cs.LG

Misurare l'incertezza degli LLM: un nuovo approccio dalle traiettorie interne

Un recente studio propone un metodo innovativo per quantificare l'incertezza nei Large Language Models (LLM), superando i limiti della probabilità softmax. Analizzando le traiettorie interne degli LLM attraverso undici caratteristiche geometriche e u...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-25 • ArXiv cs.LG

Latent Cache Flow: la comunicazione tra LLM supera i limiti del testo

Una nuova ricerca introduce Latent Cache Flow (LCF), un approccio innovativo per la comunicazione tra Large Language Models (LLM) che supera le inefficienze del testo. LCF consente lo scambio di informazioni tra modelli senza la necessità di decodifi...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-24 • DigiTimes

World Models nell'AI Incarnata: Fondamenti e Implicazioni di Deployment

I World Models rappresentano una frontiera chiave nell'AI incarnata, consentendo agli agenti autonomi di costruire una comprensione interna del loro ambiente. Questo approccio riduce la necessità di esplorazione fisica e accelera l'apprendimento. L'a...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-24 • LocalLLaMA

Qwen 3.6-35B Uncensored: un LLM robusto per deployment on-premise

Una variante del modello Qwen 3.6-35B di Alibaba Cloud, denominata Uncensored-Genesis-APEX-MTP, dimostra notevoli capacità di gestione del contesto e stabilità su hardware locale. Ottimizzata con tecniche di Quantization APEX e MTP, questa versione è...

#Hardware #LLM On-Premise #DevOps

2026-05-23 • LocalLLaMA

Embeddings per le Personas Nemotron di NVIDIA: un approccio leggero alla ricerca semantica

Un progetto recente ha generato vettori di Embeddings per il vasto dataset NVIDIA Nemotron-Personas, composto da milioni di profili sintetici dettagliati. Utilizzando l'LLM leggero Qwen 0.6B, è ora possibile effettuare ricerche semantiche e raggruppa...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-23 • LocalLLaMA

GPT-5.5 e la "Modalità Uomo delle Caverne": Speculazioni sull'Efficienza dei LLM

Un utente ha condiviso osservazioni su un presunto "trace" di GPT-5.5, suggerendo l'uso di una "modalità uomo delle caverne" per ottimizzare il processo di pensiero. La speculazione ruota attorno all'idea di migliorare l'efficienza dei Token tramite ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-22 • The Next Web

L'ascesa degli LLM: un cambiamento strutturale nel panorama digitale

Gli LLM stanno ridefinendo il comportamento utente e le strategie aziendali, segnando un'evoluzione profonda che va oltre i precedenti cambiamenti tecnicici. Questa trasformazione impone alle aziende di riconsiderare le proprie infrastrutture e le de...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-22 • LocalLLaMA

SupraLabs presenta Supra-50M: un LLM compatto con performance sorprendenti

SupraLabs ha rilasciato Supra-50M, un LLM causale da 50 milioni di parametri con architettura Llama-style. Addestrato su 20 miliardi di token, il modello dimostra risultati competitivi su diversi benchmark, superando in alcuni casi modelli di dimensi...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-22 • LocalLLaMA

DeepSeek avanza con un round da 10,29 miliardi, puntando sull'Open Source

DeepSeek sta finalizzando un round di finanziamento da 10,29 miliardi di dollari. Il fondatore Liang Wenfeng ha ribadito l'impegno a sviluppare modelli AI Open Source, privilegiando la visione a lungo termine rispetto a obiettivi di commercializzazio...

#Hardware #LLM On-Premise #DevOps

2026-05-22 • The Next Web

DeepSeek punta all'AGI con un round di finanziamento da 10 miliardi di dollari

DeepSeek, guidata dal fondatore Liang Wenfeng, ha annunciato l'obiettivo di perseguire l'Intelligenza Artificiale Generale (AGI) come priorità principale. L'azienda, con sede a Hangzhou, sta conducendo il suo primo round di finanziamento esterno, pun...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-22 • ArXiv cs.LG

LLM compatti: prevedere il successo della ricerca scientifica prima degli esperimenti

Un nuovo studio esplora la capacità dei Large Language Models (LLM) di prevedere il successo empirico di idee di ricerca prima di qualsiasi sperimentazione. Utilizzando un dataset di 11.488 coppie di idee, i ricercatori hanno dimostrato che modelli d...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-22 • ArXiv cs.AI

SOLAR: Un Agente Autonomo per l'Apprendimento Continuo e l'Adattamento Dinamico degli LLM

SOLAR è un nuovo agente autonomo progettato per superare le limitazioni degli LLM in ambienti dinamici, come il concept drift e i costi elevati dell'adattamento basato su gradiente. Utilizzando meta-learning a livello di parametro e reinforcement lea...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-21 • MIT Technology Review

Modelli del Mondo: L'IA può davvero comprendere la realtà esterna?

Le aziende di intelligenza artificiale puntano a sviluppare sistemi capaci di comprendere il mondo esterno, superando le attuali limitazioni dei Large Language Models. I "modelli del mondo" sono emersi come un tema centrale nel dibattito sull'IA, esp...

#Hardware #LLM On-Premise #DevOps

2026-05-21 • LocalLLaMA

Equinox-31B: LatitudeGames presenta un LLM versatile basato su Gemma 31B

LatitudeGames ha rilasciato Equinox-31B, un Large Language Model basato su Gemma 31B e sottoposto a Fine-tuning per offrire una notevole versatilità narrativa. Il modello, disponibile su Hugging Face anche in formato GGUF, bilancia stili di narrazion...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-21 • LocalLLaMA

Il dibattito sull'AGI e la realtà dei deployment LLM on-premise

Mentre la comunità tech discute con ironia le frequenti previsioni sull'Intelligenza Artificiale Generale (AGI), il settore si confronta con le sfide concrete del deployment di Large Language Models (LLM) in ambienti on-premise. Questo articolo esplo...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-21 • LocalLLaMA

Qwen 3.7 Max: La Crescita dei LLM Cinesi e la Questione dei Pesi Open Source

Il modello Qwen 3.7 Max, sviluppato da laboratori cinesi, sta attirando l'attenzione per le sue prestazioni percepite, segnalando una crescente competitività asiatica nel panorama dei Large Language Models. Tuttavia, la disponibilità dei suoi pesi pe...

#LLM On-Premise #DevOps

2026-05-20 • TechCrunch AI

OpenAI risolve una congettura geometrica irrisolta dal 1946

OpenAI ha annunciato che il suo modello di ragionamento ha confutato una congettura geometrica che sfidava i matematici dal 1946. La novità significativa è il supporto di esperti che in passato avevano criticato le affermazioni dell'azienda, conferen...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-20 • LocalLLaMA

Qwen: in arrivo un nuovo LLM da 27 miliardi di parametri

Indiscrezioni suggeriscono che Qwen, un attore emergente nel panorama dei Large Language Models, si stia preparando a rilasciare un nuovo modello da 27 miliardi di parametri. L'annuncio ufficiale e la roadmap dettagliata sono attesi, ma la notizia so...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-20 • OpenAI Blog

L'AI di OpenAI riscrive la geometria discreta: risolto un enigma ottantennale

Un modello di intelligenza artificiale sviluppato da OpenAI ha risolto il problema della distanza unitaria, una congettura centrale della geometria discreta che resisteva da ottant'anni. Questo traguardo segna un punto di svolta significativo nell'ap...

#Hardware #LLM On-Premise #DevOps

2026-05-20 • Wired AI

L'IA e la robotica: i Large Language Models semplificano lo sviluppo e il deployment

Le capacità di codifica dei modelli di intelligenza artificiale stanno per rivoluzionare il settore della robotica, rendendo significativamente più semplice la costruzione e il rilascio di sistemi autonomi. Questa evoluzione apre nuove prospettive pe...

#Hardware #LLM On-Premise #DevOps

2026-05-20 • LocalLLaMA

HuggingFace introduce il filtro per dimensione nei benchmark dei modelli

HuggingFace ha implementato una nuova funzionalità nei suoi dataset di benchmark, consentendo agli utenti di filtrare i Large Language Models (LLM) in base alla loro dimensione. Questa aggiunta è particolarmente utile per identificare i modelli più p...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-20 • LocalLLaMA

Qwen 3.7 Max: le valutazioni di Artificial Analysis e l'attesa per i modelli 27B/35B

Artificial Analysis ha pubblicato le sue valutazioni per Qwen 3.7 Max, posizionandolo al quinto posto complessivo. Il modello si allinea con le performance di GPT 5.4 (xhigh) e supera Gemini 3.5 Flash. L'analisi evidenzia un divario di 6 punti rispet...

#Hardware #LLM On-Premise #DevOps

2026-05-20 • ArXiv cs.CL

LLM e il Paradosso dell'Annotazione: La Sfida della Valutazione Autentica

Nonostante la crescita esplosiva dell'NLP a basse risorse, emerge un paradosso critico: la capacità tecnica di scalare i Large Language Models supera di gran lunga l'infrastruttura umana necessaria per una valutazione autentica. La scarsità di expert...

#LLM On-Premise #DevOps

2026-05-20 • ArXiv cs.LG

Compressione dei modelli Transformer con B-spline: efficienza e stabilità

Una nuova ricerca introduce un framework di decoupling basato su B-spline per la compressione dei modelli Transformer. Questa metodologia, denominata R-CMTF-BSD, promette una riduzione significativa dei parametri mantenendo un'elevata accuratezza. Su...

#Hardware #LLM On-Premise #DevOps

2026-05-20 • ArXiv cs.AI

Svelare il Ruolo dei Dati negli LLM: La Proposta delle "Data Probes"

Un nuovo studio propone lo sviluppo di "data probes," sequenze sintetiche generate sistematicamente, per comprendere a fondo come le caratteristiche dei dati influenzino le performance degli LLM. L'obiettivo è superare gli attuali approcci empirici, ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-19 • The Next Web

Andrej Karpathy in Anthropic: un innesto chiave per il pre-training di Claude e la corsa agli LLM

Andrej Karpathy, co-fondatore di OpenAI e figura di spicco nella ricerca AI, è entrato a far parte di Anthropic. Il suo ruolo sarà strategico nel team di pre-training, con l'obiettivo di accelerare lo sviluppo di Claude e mantenere l'azienda all'avan...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-19 • Ars Technica AI

Gemini 3.5 Flash: Google Punta sull'Efficienza per Applicazioni AI Complesse

Google ha annunciato il rilascio di Gemini 3.5 Flash, l'ultima iterazione della sua famiglia di Large Language Models. Il gigante tecnicico afferma che il nuovo modello combina un'intelligenza di alto livello con un'efficienza tale da rendere economi...

#Hardware #LLM On-Premise #DevOps

2026-05-19 • Google AI Blog

Google I/O: Gemini 3.5 eleva l'intelligenza dei Large Language Models

Google ha presentato Gemini 3.5, l'ultima iterazione della sua famiglia di Large Language Models, durante l'evento Google I/O. Questi nuovi modelli promettono di integrare capacità di intelligenza avanzata con funzionalità di azione, un aspetto cruci...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-19 • TechCrunch AI

Gemini si evolve: Google punta a un hub AI completo contro ChatGPT e Claude

Google ha aggiornato la sua applicazione Gemini, segnando un'evoluzione significativa. L'obiettivo è trasformare Gemini da un semplice chatbot autonomo in un hub AI multifunzione, capace di gestire una gamma più ampia di compiti. Questa mossa strateg...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-19 • TechCrunch AI

Andrej Karpathy si unisce ad Anthropic per il pre-training di LLM

Andrej Karpathy, co-fondatore di OpenAI ed ex responsabile AI di Tesla, entra nel team di pre-training di Anthropic. Questa mossa sottolinea l'importanza strategica della fase di addestramento iniziale per i Large Language Models, un processo che ric...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-19 • LocalLLaMA

ByteDance rilascia Lance: un modello multimodale open source da 3 miliardi di parametri

ByteDance ha presentato Lance, un modello multimodale unificato e leggero, progettato per la comprensione, generazione ed editing di immagini e video. Con soli 3 miliardi di parametri attivi, Lance promette prestazioni robuste, rendendolo un'opzione ...

#Hardware #LLM On-Premise #DevOps

Sviluppo e Ricerca LLM

Articoli Correlati