📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

L'adozione di modelli linguistici più avanzati (LLM) ha portato a un incremento della precisione nel chatbot del governo britannico, passando dal 76% al 90% nei test pubblici. Tuttavia, questa miglioramento si accompagna a un aumento dei tempi di risposta, che ora si attestano intorno agli 11 secondi.

2026-03-19 Fonte

Disponibili nuove versioni fine-tuned del modello Qwen3.5-40B, con varianti "regolari", "non censurate" (Heretic) e "Rough House". Sono stati rilasciati 43 modelli fine-tuned basati su Qwen 3.5, con quantizzazioni GGUF disponibili grazie al team Mradermacher e semplificazioni nel processo di fine-tuning grazie al team Unsloth.

2026-03-19 Fonte

È stato presentato UME, un modello fondazionale dedicato all'analisi dell'attività elettrodermica (EDA). Addestrato su EDAMAME, un vasto archivio di dati pubblici, UME dimostra prestazioni competitive rispetto a modelli più generici, pur richiedendo significativamente meno risorse computazionali. La pubblicazione include dataset, pesi del modello e codice per favorire ulteriori ricerche.

2026-03-19 Fonte

Un nuovo studio pubblicato su arXiv propone una riformulazione radicale dell'architettura Transformer, pilastro dell'intelligenza artificiale moderna. La ricerca dimostra che i Transformer possono essere interpretati come reti bayesiane, aprendo nuove prospettive sulla loro comprensione teorica e sul loro comportamento, in particolare riguardo alle cosiddette allucinazioni.

2026-03-19 Fonte

Un nuovo studio esplora l'uso di modelli linguistici di grandi dimensioni (LLM) per facilitare la pianificazione socio-ambientale partecipativa. L'approccio mira a semplificare la concettualizzazione dei problemi traducendo le descrizioni degli stakeholder in modelli quantitativi, accelerando il processo decisionale.

2026-03-19 Fonte

Gli sviluppatori di MiMo-V2-Pro, Omni e TTS hanno annunciato l'intenzione di rilasciare il codice sorgente dei loro modelli. La decisione è subordinata alla stabilità dei modelli stessi, per garantire un'esperienza utente ottimale. L'annuncio è stato diffuso tramite un post su X (ex Twitter).

2026-03-19 Fonte

È disponibile una collezione Hugging Face contenente una versione distillata del modello Qwen3.5, addestrata utilizzando le capacità di ragionamento di Claude-4.6 e Opus. Questa versione mira a fornire performance elevate in task che richiedono ragionamento complesso, pur mantenendo un'impronta computazionale contenuta. La comunità open source continua a sviluppare e condividere modelli sempre più performanti.

2026-03-18 Fonte

Kagi Translate, noto anche come alternativa a pagamento a Google Search, ha introdotto una funzione di traduzione basata su IA che supporta linguaggi inusuali. Questa scoperta mette in luce le capacità creative dei modelli linguistici di grandi dimensioni, ma solleva anche interrogativi sui rischi associati all'uso di strumenti LLM generalizzati.

2026-03-18 Fonte

Un recente studio ha confrontato le performance del modello Qwen3.5-27b con diverse configurazioni di pesi (bf16, fp8) e cache KV (bf16, fp8) utilizzando il benchmark Aider. I risultati, ottenuti su una workstation Nvidia RTX 6000 Pro, indicano una varianza non statisticamente significativa tra le diverse configurazioni, suggerendo che la quantization potrebbe non impattare drasticamente le performance in determinati contesti.

2026-03-18 Fonte

Il modello linguistico di grandi dimensioni MiniMax M2.7 è ora accessibile tramite OpenRouter. Progettato per l'automazione e il miglioramento continuo, M2.7 eccelle in attività complesse come il debug, l'analisi delle cause principali e la generazione di documenti. Offre un'ampia finestra di contesto di 204.800 token e prestazioni elevate in benchmark specifici.

2026-03-18 Fonte

DeepMind, il laboratorio di AI di Google, lancia un hackathon per definire e misurare i progressi verso l'Intelligenza Artificiale Generale (AGI). L'iniziativa mira a creare un framework empirico e scientificamente valido per valutare le capacità delle macchine e distinguerle dall'intelligenza umana.

2026-03-18 Fonte

Google integra Gemini in Workspace per automatizzare attività come riassunti email, creazione contenuti, organizzazione dati e gestione meeting. Analizziamo le funzionalità più interessanti per aumentare la produttività.

2026-03-18 Fonte

Together AI ha rilasciato Mamba-3, un modello state-space progettato per migliorare l'efficienza nell'inference. L'annuncio è stato diffuso tramite un post sul blog di Together AI e discussioni su Reddit, focalizzandosi sulle potenziali ottimizzazioni e benefici del modello. I modelli state-space offrono un approccio alternativo rispetto ai transformer tradizionali, con particolare attenzione alla gestione delle sequenze e alla velocità di elaborazione.

2026-03-18 Fonte

È disponibile un nuovo modello linguistico di grandi dimensioni (LLM) chiamato Omnicoder, distillato da Claude Opus e basato sull'architettura Qwen 3.5 9B. Questo modello, creato tramite un processo di merge, si distingue per l'assenza di censure e la sua idoneità all'inference locale, con quantizzazioni Q4_K_M e Q8_0 disponibili. Il modello include aggiornamenti da Jackrong, HauhauCS e Tesslate.

2026-03-18 Fonte

MiniMax ha annunciato il suo nuovo modello M2.7. L'annuncio è stato fatto tramite un post su un canale cinese. Ulteriori dettagli sulle specifiche tecniche e le performance del modello sono attesi.

2026-03-18 Fonte

MedArena è una piattaforma interattiva per la valutazione di modelli linguistici di grandi dimensioni (LLM) in ambito medico. Permette ai clinici di confrontare direttamente le risposte di diversi modelli utilizzando le proprie domande mediche. I risultati iniziali, basati su preferenze raccolte fino a novembre 2025, indicano che Gemini 2.0 Flash Thinking, Gemini 2.5 Pro e GPT-4o sono tra i modelli preferiti.

2026-03-18 Fonte

Un nuovo studio introduce SRLM, un framework che migliora i modelli linguistici ricorsivi (RLM) con una gestione dell'incertezza basata su auto-riflessione. SRLM valuta e confronta diversi programmi di interazione contestuale, superando le performance dei modelli RLM tradizionali, specialmente in contesti semanticamente intensivi.

2026-03-18 Fonte

La tokenizzazione, ovvero la conversione di dati sanitari in input per modelli di deep learning, influenza significativamente le performance e l'efficienza computazionale. Uno studio esplora diverse strategie di tokenizzazione su dati EHR pediatrici, valutando l'accuratezza predittiva e i costi di pre-training. La codifica congiunta di eventi e la codifica temporale posizionale emergono come le più efficaci.

2026-03-18 Fonte