Topic / Trend Rising

Sviluppo e Ricerca LLM

Questa tendenza si concentra sui progressi nelle architetture dei Large Language Model, nelle metodologie di addestramento e nelle iniziative open source. Include anche applicazioni specializzate e l'uso degli LLM nella scoperta scientifica e nella risoluzione dei problemi.

Detected: 2026-05-26 · Updated: 2026-05-26

Articoli Correlati

2026-05-26 LocalLLaMA

Qwen3.5 27B: un LLM versatile per deployment on-premise con MTP preservati

È stato rilasciato Qwen3.5 27B, un Large Language Model ottimizzato per l'assistenza AI generica, che mantiene intatte le sue 15 capacità di Multi-Turn Preservation (MTP). Disponibile in diversi formati come Safetensors, GGUFs, NVFP4 e GPTQ-Int4, il ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-26 ArXiv cs.AI

La calibrazione della fiducia negli LLM: tra eccesso e difetto

Un nuovo studio rivela che i Large Language Models (LLM) mostrano una calibrazione della fiducia complessa: tendono a essere eccessivamente fiduciosi su compiti difficili e, sorprendentemente, sotto-fiduciosi su quelli facili. La ricerca introduce Li...

#Hardware #LLM On-Premise #DevOps
2026-05-25 LocalLLaMA

MiniCPM5-1B: Un LLM compatto per deployment on-premise e edge

MiniCPM5-1B emerge come un nuovo Large Language Model da 5.1 miliardi di parametri, progettato per l'efficienza e l'esecuzione su hardware meno potente. La sua natura Open Source e le dimensioni contenute lo rendono particolarmente interessante per s...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-25 LocalLLaMA

Grok: un modello da 0.5T parametri in arrivo e l'impegno open source

xAI ha annunciato l'arrivo, previsto per il prossimo anno, di un nuovo modello Grok da 0.5 Trillion di parametri. Parallelamente, Grok-3 ha aderito a un'iniziativa per il rilascio Open Source. Questo sviluppo solleva importanti considerazioni per le ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-25 LocalLLaMA

MiMo-V2.5-coder: Un Nuovo LLM per lo Sviluppo On-Premise con 128 GB VRAM

È stato rilasciato MiMo-V2.5-coder, un nuovo Large Language Model ottimizzato per attività di coding e tool calling. Richiede 128 GB di VRAM, posizionandosi come un'alternativa per deployment self-hosted. Il modello, disponibile con quantization Q2, ...

#Hardware #LLM On-Premise #DevOps
2026-05-25 LocalLLaMA

LLM e raccomandazioni musicali open source: la sfida dei dati proprietari

La ricerca di sistemi di raccomandazione musicale open source, simili a Spotify, evidenzia il potenziale dei Large Language Models. Tuttavia, l'accesso ai dati di ascolto degli utenti, spesso custoditi in ecosistemi chiusi, rappresenta un ostacolo si...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-25 ArXiv cs.AI

NeuroNL2LTL: Il Ponte Neurosimbolico tra Linguaggio Naturale e Logica LTL

NeuroNL2LTL è un nuovo framework neurosimbolico che affronta la sfida di tradurre il linguaggio naturale in Logica Temporale Lineare (LTL) con garanzie di correttezza formale. A differenza degli approcci puramente neurali o basati su template, NeuroN...

#LLM On-Premise #Fine-Tuning #DevOps
2026-05-25 ArXiv cs.CL

QASC: Il Chunking Adattivo alle Query che Potenzia i Sistemi RAG

Una nuova ricerca introduce Query-Adaptive Semantic Chunking (QASC), una strategia dinamica per il chunking dei documenti nei sistemi Retrieval-Augmented Generation (RAG). Integrando le query utente nella fase di segmentazione, QASC migliora signific...

#Hardware #LLM On-Premise #DevOps
2026-05-25 ArXiv cs.CL

Risorse NLP per Hausa e Fongbe: uno sguardo tra disponibilità e lacune

Una recente indagine ha catalogato le risorse testuali e vocali pubblicamente disponibili per Hausa e Fongbe, due lingue dell'Africa occidentale. Lo studio evidenzia una maggiore diversità di risorse testuali per Hausa, mentre Fongbe beneficia di rec...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-25 ArXiv cs.LG

Misurare l'incertezza degli LLM: un nuovo approccio dalle traiettorie interne

Un recente studio propone un metodo innovativo per quantificare l'incertezza nei Large Language Models (LLM), superando i limiti della probabilità softmax. Analizzando le traiettorie interne degli LLM attraverso undici caratteristiche geometriche e u...

#LLM On-Premise #Fine-Tuning #DevOps
2026-05-25 ArXiv cs.LG

Latent Cache Flow: la comunicazione tra LLM supera i limiti del testo

Una nuova ricerca introduce Latent Cache Flow (LCF), un approccio innovativo per la comunicazione tra Large Language Models (LLM) che supera le inefficienze del testo. LCF consente lo scambio di informazioni tra modelli senza la necessità di decodifi...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-24 DigiTimes

World Models nell'AI Incarnata: Fondamenti e Implicazioni di Deployment

I World Models rappresentano una frontiera chiave nell'AI incarnata, consentendo agli agenti autonomi di costruire una comprensione interna del loro ambiente. Questo approccio riduce la necessità di esplorazione fisica e accelera l'apprendimento. L'a...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-24 LocalLLaMA

Qwen 3.6-35B Uncensored: un LLM robusto per deployment on-premise

Una variante del modello Qwen 3.6-35B di Alibaba Cloud, denominata Uncensored-Genesis-APEX-MTP, dimostra notevoli capacità di gestione del contesto e stabilità su hardware locale. Ottimizzata con tecniche di Quantization APEX e MTP, questa versione è...

#Hardware #LLM On-Premise #DevOps
2026-05-22 The Next Web

L'ascesa degli LLM: un cambiamento strutturale nel panorama digitale

Gli LLM stanno ridefinendo il comportamento utente e le strategie aziendali, segnando un'evoluzione profonda che va oltre i precedenti cambiamenti tecnicici. Questa trasformazione impone alle aziende di riconsiderare le proprie infrastrutture e le de...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-22 LocalLLaMA

SupraLabs presenta Supra-50M: un LLM compatto con performance sorprendenti

SupraLabs ha rilasciato Supra-50M, un LLM causale da 50 milioni di parametri con architettura Llama-style. Addestrato su 20 miliardi di token, il modello dimostra risultati competitivi su diversi benchmark, superando in alcuni casi modelli di dimensi...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-22 LocalLLaMA

DeepSeek avanza con un round da 10,29 miliardi, puntando sull'Open Source

DeepSeek sta finalizzando un round di finanziamento da 10,29 miliardi di dollari. Il fondatore Liang Wenfeng ha ribadito l'impegno a sviluppare modelli AI Open Source, privilegiando la visione a lungo termine rispetto a obiettivi di commercializzazio...

#Hardware #LLM On-Premise #DevOps
2026-05-22 The Next Web

DeepSeek punta all'AGI con un round di finanziamento da 10 miliardi di dollari

DeepSeek, guidata dal fondatore Liang Wenfeng, ha annunciato l'obiettivo di perseguire l'Intelligenza Artificiale Generale (AGI) come priorità principale. L'azienda, con sede a Hangzhou, sta conducendo il suo primo round di finanziamento esterno, pun...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-21 MIT Technology Review

Modelli del Mondo: L'IA può davvero comprendere la realtà esterna?

Le aziende di intelligenza artificiale puntano a sviluppare sistemi capaci di comprendere il mondo esterno, superando le attuali limitazioni dei Large Language Models. I "modelli del mondo" sono emersi come un tema centrale nel dibattito sull'IA, esp...

#Hardware #LLM On-Premise #DevOps
2026-05-21 LocalLLaMA

Equinox-31B: LatitudeGames presenta un LLM versatile basato su Gemma 31B

LatitudeGames ha rilasciato Equinox-31B, un Large Language Model basato su Gemma 31B e sottoposto a Fine-tuning per offrire una notevole versatilità narrativa. Il modello, disponibile su Hugging Face anche in formato GGUF, bilancia stili di narrazion...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-21 LocalLLaMA

Il dibattito sull'AGI e la realtà dei deployment LLM on-premise

Mentre la comunità tech discute con ironia le frequenti previsioni sull'Intelligenza Artificiale Generale (AGI), il settore si confronta con le sfide concrete del deployment di Large Language Models (LLM) in ambienti on-premise. Questo articolo esplo...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-20 TechCrunch AI

OpenAI risolve una congettura geometrica irrisolta dal 1946

OpenAI ha annunciato che il suo modello di ragionamento ha confutato una congettura geometrica che sfidava i matematici dal 1946. La novità significativa è il supporto di esperti che in passato avevano criticato le affermazioni dell'azienda, conferen...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-20 LocalLLaMA

Qwen: in arrivo un nuovo LLM da 27 miliardi di parametri

Indiscrezioni suggeriscono che Qwen, un attore emergente nel panorama dei Large Language Models, si stia preparando a rilasciare un nuovo modello da 27 miliardi di parametri. L'annuncio ufficiale e la roadmap dettagliata sono attesi, ma la notizia so...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-20 LocalLLaMA

HuggingFace introduce il filtro per dimensione nei benchmark dei modelli

HuggingFace ha implementato una nuova funzionalità nei suoi dataset di benchmark, consentendo agli utenti di filtrare i Large Language Models (LLM) in base alla loro dimensione. Questa aggiunta è particolarmente utile per identificare i modelli più p...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-20 ArXiv cs.CL

LLM e il Paradosso dell'Annotazione: La Sfida della Valutazione Autentica

Nonostante la crescita esplosiva dell'NLP a basse risorse, emerge un paradosso critico: la capacità tecnica di scalare i Large Language Models supera di gran lunga l'infrastruttura umana necessaria per una valutazione autentica. La scarsità di expert...

#LLM On-Premise #DevOps
2026-05-20 ArXiv cs.LG

Compressione dei modelli Transformer con B-spline: efficienza e stabilità

Una nuova ricerca introduce un framework di decoupling basato su B-spline per la compressione dei modelli Transformer. Questa metodologia, denominata R-CMTF-BSD, promette una riduzione significativa dei parametri mantenendo un'elevata accuratezza. Su...

#Hardware #LLM On-Premise #DevOps
2026-05-20 ArXiv cs.AI

Svelare il Ruolo dei Dati negli LLM: La Proposta delle "Data Probes"

Un nuovo studio propone lo sviluppo di "data probes," sequenze sintetiche generate sistematicamente, per comprendere a fondo come le caratteristiche dei dati influenzino le performance degli LLM. L'obiettivo è superare gli attuali approcci empirici, ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-19 Ars Technica AI

Gemini 3.5 Flash: Google Punta sull'Efficienza per Applicazioni AI Complesse

Google ha annunciato il rilascio di Gemini 3.5 Flash, l'ultima iterazione della sua famiglia di Large Language Models. Il gigante tecnicico afferma che il nuovo modello combina un'intelligenza di alto livello con un'efficienza tale da rendere economi...

#Hardware #LLM On-Premise #DevOps
2026-05-19 Google AI Blog

Google I/O: Gemini 3.5 eleva l'intelligenza dei Large Language Models

Google ha presentato Gemini 3.5, l'ultima iterazione della sua famiglia di Large Language Models, durante l'evento Google I/O. Questi nuovi modelli promettono di integrare capacità di intelligenza avanzata con funzionalità di azione, un aspetto cruci...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-19 TechCrunch AI

Gemini si evolve: Google punta a un hub AI completo contro ChatGPT e Claude

Google ha aggiornato la sua applicazione Gemini, segnando un'evoluzione significativa. L'obiettivo è trasformare Gemini da un semplice chatbot autonomo in un hub AI multifunzione, capace di gestire una gamma più ampia di compiti. Questa mossa strateg...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-19 TechCrunch AI

Andrej Karpathy si unisce ad Anthropic per il pre-training di LLM

Andrej Karpathy, co-fondatore di OpenAI ed ex responsabile AI di Tesla, entra nel team di pre-training di Anthropic. Questa mossa sottolinea l'importanza strategica della fase di addestramento iniziale per i Large Language Models, un processo che ric...

#Hardware #LLM On-Premise #Fine-Tuning
← Torna ai Topic