📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

Mark Zuckerberg ha comunicato ai dipendenti che lo sviluppo degli agenti AI di Meta sta procedendo più lentamente del previsto, nonostante la riorganizzazione di quattro mesi fa. La notizia solleva interrogativi sulle sfide tecniche dell'AI agentica e sulle implicazioni per chi gestisce carichi di lavoro LLM on-premise.

2026-07-03 Fonte

Con GLM-5.2, Z.ai intensifica la competizione globale nell'AI generativa, puntando ai big occidentali. L'annuncio accende i riflettori sulle capacità cinesi di sviluppare LLM competitivi e sul ruolo della sovranità dei dati nelle scelte di deployment on-premise.

2026-07-03 Fonte

Z.ai ha rilasciato GLM-5.2, quarto nella classifica dei modelli più performanti, con capacità in coding e agentica vicine ai leader di mercato. Il costo è una frazione di quello di Anthropic o OpenAI, sollevando interrogativi su come questo cambierà le scelte di deployment, soprattutto per chi punta a soluzioni on-premise e alla sovranità dei dati.

2026-07-02 Fonte

L’entropia, da concetto teorico a parametro pratico, sta guidando nuove strategie per potenziare la creatività dei Large Language Models. L’approccio non è solo accademico: per chi gestisce modelli in locale, offre un controllo più fine e un allineamento migliore ai casi d’uso aziendali senza esporre dati.

2026-07-02 Fonte

Nuova ricerca mostra che i cosiddetti 'persona vector' negli LLM non sono coerenti tra diverse modalità di induzione: prompt, fine-tuning e steering in fase di inference. Gli esperimenti sui modelli Qwen3-4B-Instruct e Mistral-7B-Instruct-v0.2 rivelano quattro asimmetrie che minano l'assunto di equivalenza, con ricadute concrete per chi gestisce modelli on-premise e cerca comportamenti prevedibili.

2026-07-02 Fonte

Un gruppo di ricerca propone la Bounded Morality, estensione della razionalità limitata di Simon al dominio morale. Il trade-off tra ampiezza e profondità del ragionamento definisce cosa è computazionalmente possibile per un agente finito, con implicazioni dirette sull’allineamento dei sistemi di intelligenza artificiale.

2026-07-02 Fonte

L'uso quotidiano di lingue mescolate alla scrittura latina è un banco di prova severo per i Large Language Models. Il nuovo benchmark Indi-RomCoM mostra che persino i modelli più potenti perdono colpi quando le istruzioni intrecciano inglese e lingue indiane, con un crollo delle performance all'aumentare della densità del code-mixing. Un campanello d'allarme per chi immagina assistenti AI davvero multilingue.

2026-07-01 Fonte

Un nuovo dataset tabulare basato su dati NHANES e accelerometria sfida i modelli di apprendimento automatico a prevedere biomarcatori come HbA1c e PCR. TabPFN v2 emerge come la soluzione più efficace, ma con limiti sui trigliceridi. Per chi adotta AI in ambito medico, la trasparenza e la privacy dei dati restano centrali.

2026-07-01 Fonte