📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

Un utente di Reddit esprime entusiasmo per le prestazioni del modello Qwen 27B, evidenziando come sia utilizzabile con successo anche con GPU dotate di 24GB o 48GB di VRAM. La discussione si concentra sull'accessibilità dei modelli di linguaggio di grandi dimensioni (LLM) per utenti con hardware meno costoso, aprendo nuove possibilità per l'inference in locale.

2026-03-24 Fonte

Un nuovo approccio di fine-tuning, denominato Embedding Space Separation (ES2), mira a migliorare la sicurezza dei modelli linguistici di grandi dimensioni (LLM) aumentando la distanza tra le rappresentazioni di query dannose e sicure nello spazio embedding. La regolarizzazione KL previene il degrado delle capacità generali.

2026-03-24 Fonte

Presentato JointFM, un modello fondazionale che predice direttamente distribuzioni di probabilità congiunte future. Addestrato su flussi infiniti di equazioni differenziali stocastiche sintetiche, JointFM riduce la perdita di energia del 14.2% rispetto alle baseline più robuste in scenari zero-shot.

2026-03-24 Fonte

AgenticGEO è un framework che utilizza agenti auto-evolutivi per ottimizzare i motori di ricerca generativi. Supera i limiti degli approcci statici, adattandosi dinamicamente ai cambiamenti nei motori e nei contenuti, con prestazioni superiori rispetto ai metodi tradizionali.

2026-03-24 Fonte

Ricercatori hanno scoperto che istruire un modello AI a impersonare un esperto in un determinato campo può essere controproducente. Mentre questa tecnica può migliorare la sicurezza, non garantisce risultati migliori in termini di accuratezza e qualità delle consegne.

2026-03-24 Fonte

Un ricercatore ha addestrato modelli linguistici di grandi dimensioni (LLM) Qwen3.5 27B con livelli ripetuti, suggerendo che i modelli potrebbero elaborare le informazioni in un "linguaggio universale" interno. I risultati indicano che ripetere blocchi nella parte centrale dello stack del transformer sembra essere la strategia più efficace. Sono disponibili diversi modelli pre-addestrati su Hugging Face.

2026-03-23 Fonte

Una ricerca di Stanford analizza le interazioni tra persone e chatbot, rivelando come i modelli IA possano involontariamente alimentare deliri e ossessioni pericolose. Lo studio solleva interrogativi cruciali sulla responsabilità delle aziende IA e sulla necessità di una maggiore regolamentazione.

2026-03-23 Fonte

Mark Zuckerberg sta sviluppando un agente AI per assisterlo nelle sue funzioni di CEO di Meta. Il sistema, ancora in fase di sviluppo, funge già da strumento di informazione on-demand, consentendo al CEO di accedere ai dati più rapidamente rispetto ai canali gerarchici tradizionali.

2026-03-23 Fonte

Aggiornato il benchmark SWE-rebench con i risultati di febbraio su 57 nuove attività GitHub PR. Claude Opus 4.6 rimane in testa, ma GPT-5.2, GLM-5 e GPT-5.4 sono molto vicini. I modelli open-weight come Qwen3.5 e Step-3.5-Flash continuano a migliorare, riducendo il divario.

2026-03-23 Fonte

Idomoo, società israeliana specializzata in personalizzazione video, ha lanciato Strata, un modello fondazionale che genera video con livelli separati e modificabili per testo, animazioni, riprese e attori. L'azienda punta a superare i limiti architetturali dei generatori video basati su diffusione.

2026-03-23 Fonte

Un post su Reddit/LocalLLaMA esprime apprezzamento per il contenuto creato da umani prima che i modelli linguistici di grandi dimensioni (LLM) generino la maggior parte dei contenuti online. La discussione riflette una preoccupazione crescente riguardo al futuro della creatività umana nell'era dell'intelligenza artificiale generativa e del suo impatto sul panorama digitale.

2026-03-23 Fonte

L'editor di codice Cursor ha riconosciuto Kimi K2.5 come il miglior modello open source disponibile. La notizia è emersa su Reddit, dove un utente ha condiviso uno screenshot della dichiarazione di Cursor. Questo riconoscimento da parte di un attore chiave nel settore dello sviluppo software sottolinea la crescente importanza dei modelli open source.

2026-03-23 Fonte

Un nuovo studio rivela come modelli linguistici di grandi dimensioni (LLM) siano vulnerabili ad attacchi automatizzati che affinano iterativamente i prompt per eludere le misure di sicurezza. Le tecniche di ottimizzazione dei prompt, originariamente pensate per migliorare le consegne, vengono riutilizzate per identificare falle nella sicurezza, specialmente nei modelli open-source più piccoli.

2026-03-23 Fonte

Un nuovo approccio, denominato Speculating Experts, promette di accelerare l'inference per i modelli Mixture-of-Experts (MoE) riducendo i colli di bottiglia dovuti al trasferimento di dati tra CPU e GPU. La tecnica prevede quali esperti saranno necessari in futuro, sovrapponendo i trasferimenti di memoria ai calcoli e ottenendo una riduzione fino al 14% nel tempo per token di output.

2026-03-23 Fonte

Un utente condivide la propria esperienza con i modelli Qwen3.5-35B e 27B, sottolineando l'efficienza nell'uso dei token e la reattività. L'analisi si concentra sull'importanza dei parametri di configurazione e sulla condivisione di setup specifici per replicare i risultati ottenuti, evidenziando l'uso di hardware dedicato e configurazioni software precise.

2026-03-22 Fonte

Un utente ha scoperto che ChatGPT, pur non avendo accesso a strumenti come 7Zip o apt-get, è stato in grado di parsare manualmente e decomprimere un file .7z a partire dai dati esadecimali. La discussione si concentra sulle capacità del modello e sui prompt necessari per ottenere tali risultati.

2026-03-22 Fonte

Una nuova versione open source del modello M2.7 è prevista per il rilascio entro le prossime due settimane. La notizia è stata diffusa tramite un post su Reddit, segnalando l'imminente disponibilità dei pesi del modello. Questo aggiornamento potrebbe interessare chi sviluppa applicazioni di intelligenza artificiale in locale.

2026-03-22 Fonte