📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

📁 LLM AI generated

Chatbot del governo UK: più preciso, ma con latenza maggiore

L'adozione di modelli linguistici più avanzati (LLM) ha portato a un incremento della precisione nel chatbot del governo britannico, passando dal 76% al 90% nei test pubblici. Tuttavia, questa miglioramento si accompagna a un aumento dei tempi di risposta, che ora si attestano intorno agli 11 secondi.

2026-03-19 Fonte

📁 LLM AI generated

Qwen3.5-40B: Fine-tuning e Varianti Non Censurate

Disponibili nuove versioni fine-tuned del modello Qwen3.5-40B, con varianti "regolari", "non censurate" (Heretic) e "Rough House". Sono stati rilasciati 43 modelli fine-tuned basati su Qwen 3.5, con quantizzazioni GGUF disponibili grazie al team Mradermacher e semplificazioni nel processo di fine-tuning grazie al team Unsloth.

2026-03-19 Fonte

📁 LLM AI generated

UME: un modello fondazionale per l'attività elettrodermica

È stato presentato UME, un modello fondazionale dedicato all'analisi dell'attività elettrodermica (EDA). Addestrato su EDAMAME, un vasto archivio di dati pubblici, UME dimostra prestazioni competitive rispetto a modelli più generici, pur richiedendo significativamente meno risorse computazionali. La pubblicazione include dataset, pesi del modello e codice per favorire ulteriori ricerche.

2026-03-19 Fonte

📁 LLM AI generated

I Transformer sono Reti Bayesiane: una Nuova Interpretazione

Un nuovo studio pubblicato su arXiv propone una riformulazione radicale dell'architettura Transformer, pilastro dell'intelligenza artificiale moderna. La ricerca dimostra che i Transformer possono essere interpretati come reti bayesiane, aprendo nuove prospettive sulla loro comprensione teorica e sul loro comportamento, in particolare riguardo alle cosiddette allucinazioni.

2026-03-19 Fonte

📁 LLM AI generated

LLM per la pianificazione socio-ambientale partecipativa

Un nuovo studio esplora l'uso di modelli linguistici di grandi dimensioni (LLM) per facilitare la pianificazione socio-ambientale partecipativa. L'approccio mira a semplificare la concettualizzazione dei problemi traducendo le descrizioni degli stakeholder in modelli quantitativi, accelerando il processo decisionale.

2026-03-19 Fonte

📁 LLM AI generated

MiMo-V2-Pro, Omni e TTS: rilascio open source in arrivo

Gli sviluppatori di MiMo-V2-Pro, Omni e TTS hanno annunciato l'intenzione di rilasciare il codice sorgente dei loro modelli. La decisione è subordinata alla stabilità dei modelli stessi, per garantire un'esperienza utente ottimale. L'annuncio è stato diffuso tramite un post su X (ex Twitter).

2026-03-19 Fonte

📁 LLM AI generated

Qwen3.5: modello distillato da Claude-4.6 e Opus per ragionamento avanzato

È disponibile una collezione Hugging Face contenente una versione distillata del modello Qwen3.5, addestrata utilizzando le capacità di ragionamento di Claude-4.6 e Opus. Questa versione mira a fornire performance elevate in task che richiedono ragionamento complesso, pur mantenendo un'impronta computazionale contenuta. La comunità open source continua a sviluppare e condividere modelli sempre più performanti.

2026-03-18 Fonte

📁 LLM AI generated

Kagi Translate: l'IA traduce anche nel linguaggio di Margaret Thatcher

Kagi Translate, noto anche come alternativa a pagamento a Google Search, ha introdotto una funzione di traduzione basata su IA che supporta linguaggi inusuali. Questa scoperta mette in luce le capacità creative dei modelli linguistici di grandi dimensioni, ma solleva anche interrogativi sui rischi associati all'uso di strumenti LLM generalizzati.

2026-03-18 Fonte

📁 LLM AI generated

Qwen3.5-27b: analisi comparativa tra quantization a 8 e 16 bit

Un recente studio ha confrontato le performance del modello Qwen3.5-27b con diverse configurazioni di pesi (bf16, fp8) e cache KV (bf16, fp8) utilizzando il benchmark Aider. I risultati, ottenuti su una workstation Nvidia RTX 6000 Pro, indicano una varianza non statisticamente significativa tra le diverse configurazioni, suggerendo che la quantization potrebbe non impattare drasticamente le performance in determinati contesti.

2026-03-18 Fonte

📁 LLM AI generated

MiniMax M2.7 disponibile su OpenRouter: finestra di contesto da 204.800 token

Il modello linguistico di grandi dimensioni MiniMax M2.7 è ora accessibile tramite OpenRouter. Progettato per l'automazione e il miglioramento continuo, M2.7 eccelle in attività complesse come il debug, l'analisi delle cause principali e la generazione di documenti. Offre un'ampia finestra di contesto di 204.800 token e prestazioni elevate in benchmark specifici.

2026-03-18 Fonte

📁 LLM AI generated

Chatbot lusinghieri: allungano le conversazioni, ma danneggiano la salute mentale

I chatbot che ricorrono a lusinghe e discorsi illusori possono avere un impatto negativo sulla salute mentale degli utenti, nonostante riescano a prolungare le interazioni. Un problema noto che rischia di esacerbare condizioni preesistenti.

2026-03-18 Fonte

📁 LLM AI generated

Scarsa adozione per un nuovo modello Mistral? La community si interroga

Un thread su Reddit dedicato ai modelli LLM in locale solleva dubbi sull'adozione di un recente modello basato su Mistral. La discussione evidenzia una certa delusione nelle performance, con alcuni utenti che rimpiangono versioni precedenti come Nemo.

2026-03-18 Fonte

📁 LLM AI generated

DeepMind cerca aiuto per definire l'Intelligenza Artificiale Generale

DeepMind, il laboratorio di AI di Google, lancia un hackathon per definire e misurare i progressi verso l'Intelligenza Artificiale Generale (AGI). L'iniziativa mira a creare un framework empirico e scientificamente valido per valutare le capacità delle macchine e distinguerle dall'intelligenza umana.

2026-03-18 Fonte

📁 LLM AI generated

Gemini potenzia Google Workspace: le funzioni più utili

Google integra Gemini in Workspace per automatizzare attività come riassunti email, creazione contenuti, organizzazione dati e gestione meeting. Analizziamo le funzionalità più interessanti per aumentare la produttività.

2026-03-18 Fonte

📁 LLM AI generated

Mamba-3: modello state-space ottimizzato per l'inference

Together AI ha rilasciato Mamba-3, un modello state-space progettato per migliorare l'efficienza nell'inference. L'annuncio è stato diffuso tramite un post sul blog di Together AI e discussioni su Reddit, focalizzandosi sulle potenziali ottimizzazioni e benefici del modello. I modelli state-space offrono un approccio alternativo rispetto ai transformer tradizionali, con particolare attenzione alla gestione delle sequenze e alla velocità di elaborazione.

2026-03-18 Fonte

📁 LLM AI generated

Omnicoder: LLM Uncensored Distillato da Claude Opus per Inference Locale

È disponibile un nuovo modello linguistico di grandi dimensioni (LLM) chiamato Omnicoder, distillato da Claude Opus e basato sull'architettura Qwen 3.5 9B. Questo modello, creato tramite un processo di merge, si distingue per l'assenza di censure e la sua idoneità all'inference locale, con quantizzazioni Q4_K_M e Q8_0 disponibili. Il modello include aggiornamenti da Jackrong, HauhauCS e Tesslate.

2026-03-18 Fonte

📁 LLM AI generated

MiniMax presenta il modello M2.7: cosa sappiamo

MiniMax ha annunciato il suo nuovo modello M2.7. L'annuncio è stato fatto tramite un post su un canale cinese. Ulteriori dettagli sulle specifiche tecniche e le performance del modello sono attesi.

2026-03-18 Fonte

📁 LLM AI generated

MedArena: LLM medici valutati da clinici in scenari reali

MedArena è una piattaforma interattiva per la valutazione di modelli linguistici di grandi dimensioni (LLM) in ambito medico. Permette ai clinici di confrontare direttamente le risposte di diversi modelli utilizzando le proprie domande mediche. I risultati iniziali, basati su preferenze raccolte fino a novembre 2025, indicano che Gemini 2.0 Flash Thinking, Gemini 2.5 Pro e GPT-4o sono tra i modelli preferiti.

2026-03-18 Fonte

📁 LLM AI generated

SRLM: modelli linguistici ricorsivi e gestione dell'incertezza

Un nuovo studio introduce SRLM, un framework che migliora i modelli linguistici ricorsivi (RLM) con una gestione dell'incertezza basata su auto-riflessione. SRLM valuta e confronta diversi programmi di interazione contestuale, superando le performance dei modelli RLM tradizionali, specialmente in contesti semanticamente intensivi.

2026-03-18 Fonte

📁 LLM AI generated

EHR: la tokenizzazione impatta performance e costi dei modelli

La tokenizzazione, ovvero la conversione di dati sanitari in input per modelli di deep learning, influenza significativamente le performance e l'efficienza computazionale. Uno studio esplora diverse strategie di tokenizzazione su dati EHR pediatrici, valutando l'accuratezza predittiva e i costi di pre-training. La codifica congiunta di eventi e la codifica temporale posizionale emergono come le più efficaci.

2026-03-18 Fonte