📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

Un team di ricercatori ha esplorato la sintassi dei clausi qulk nel dialetto Ibbi Arabo, un linguaggio isolato parlato in Yemen. La loro ricerca, pubblicata su arXiv, propone una teoria minimalista per spiegare il funzionamento di questi clausi, che possono essere utilizzati per formare interrogative e imperativi senza complemento.

2025-12-30 Fonte

Meta ha lanciato tre nuove varianti di modello LLM aperto, Moxin-VLM, Moxin-VLA e Moxin-Chinese, che offrono capacità in vision-language, vision-language-action e cinese. Queste versioni sono state sviluppate utilizzando il framework Model Openness Framework e sono state testate con esperimenti positivi.

2025-12-30 Fonte

I modelli di linguaggio grandi, come i transformer, hanno dimostrato di imparare strutture geometriche complesse nelle loro rappresentazioni spaziali. Ma cosa succede quando si cerca di catturare la struttura cognitiva più alta all'interno di queste rappresentazioni? Una nuova ricerca ha scoperto che i modelli di linguaggio grandi possono codificare una gerarchia geometrica che corrisponde a attributi psicologici umani.

2025-12-30 Fonte

L'industria dell'intelligenza artificiale ha iniziato l'anno con un'esplosione di investimenti e promesse di infrastrutture per trillion di dollari. Tuttavia, alla fine dell'anno la frenesia si è trasformata in una critica più radicale sulla sostenibilità, sulla sicurezza e sui modelli di business.

2025-12-29 Fonte

Meta ha presentato oggi le sue ultime innovazioni nel campo dei modelli di linguaggio grande, rafforzando la sua posizione di leader in questo campo. Queste nuove tecnologie sono state annunciate durante il mese di dicembre del 2025.

2025-12-29 Fonte

Il team di Machine-Learning-Dynamical-Systems ha lanciato kooplearn, una libreria di apprendimento automatico che implementa estimatori lineari, kernel e deep-learning per operatori evolutivi dinamici. Questo framework consente di analizzare sistemi dinamici tramite metodi spettrali, derivare modelli ridotti di ordine dati e previsione future state e osservabili.

2025-12-29 Fonte

Un team di ricercatori ha sviluppato un nuovo framework per l'analisi psicologica utilizzando modelli di linguaggio grandi. Il progetto, chiamato House-Tree-Person (HTP), utilizza la collaborazione multi-agente per correggere le interpretazioni umane e produrre report con alta validità ecologica.

2025-12-29 Fonte

I grandi modelli di linguaggio (LLM) sono diventati sempre più popolari, ma spesso vengono utilizzati in modo scorretto. Un nuovo studio analizza perché questo accade e come insegnare ai modelli i loro errori.

2025-12-29 Fonte

I modelli di ragionamento grandi (LRM) sono stati sviluppati utilizzando l'apprendimento guidato con ricompense verificabili (RLVR) per migliorare le loro capacità di ragionamento. Un nuovo studio ha esplorato come le diverse polarità delle sample influenzino i dinami e comportamenti dell'addestramento RLVR. I risultati mostrano che le sample positive migliorano le pattern di ragionamento corretti, mentre quelle negative incoraggiano l'esplorazione di nuove strade di ragionamento. Il lavoro propone un nuovo metodo per la token-level Advantage shaping, A3PO, che migliora la precisione degli impulsi di vantaggio alle chiavi dei token in base alla polarità.

2025-12-29 Fonte

Meta ha annunciato la creazione di dUltra, un nuovo framework di apprendimento per migliorare le prestazioni dei modelli di diffusione. Questo nuovo approccio utilizza l'apprendimento guidato per ottimizzare il processo di decodifica in modo parallelo.

2025-12-29 Fonte

Un gruppo di ricercatori ha sviluppato un nuovo framework di apprendimento automatico che può risolvere problemi quantistici complessi con una grande precisione. Il framework, basato su intelligenza artificiale, utilizza reti neurali per imparare funzioni Bloch e loro corrispondenti valori energetici in modo simultaneo.

2025-12-29 Fonte