Ricerca innovativa che propone un nuovo approccio all'apprendimento causale senza supervisione, migliorando la capacità dei modelli di catturare relazioni causali in dati non strutturati.
Un team di ricercatori ha esplorato la sintassi dei clausi qulk nel dialetto Ibbi Arabo, un linguaggio isolato parlato in Yemen. La loro ricerca, pubblicata su arXiv, propone una teoria minimalista per spiegare il funzionamento di questi clausi, che possono essere utilizzati per formare interrogative e imperativi senza complemento.
Meta ha lanciato tre nuove varianti di modello LLM aperto, Moxin-VLM, Moxin-VLA e Moxin-Chinese, che offrono capacità in vision-language, vision-language-action e cinese. Queste versioni sono state sviluppate utilizzando il framework Model Openness Framework e sono state testate con esperimenti positivi.
Meta ha lanciato SmartSnap, una tecnologia innovativa che consente agli agenti autonomi di verificare la propria performance in modo proattivo e scalabile.
I modelli di linguaggio grandi, come i transformer, hanno dimostrato di imparare strutture geometriche complesse nelle loro rappresentazioni spaziali. Ma cosa succede quando si cerca di catturare la struttura cognitiva più alta all'interno di queste rappresentazioni? Una nuova ricerca ha scoperto che i modelli di linguaggio grandi possono codificare una gerarchia geometrica che corrisponde a attributi psicologici umani.
L'industria dell'intelligenza artificiale ha iniziato l'anno con un'esplosione di investimenti e promesse di infrastrutture per trillion di dollari. Tuttavia, alla fine dell'anno la frenesia si è trasformata in una critica più radicale sulla sostenibilità, sulla sicurezza e sui modelli di business.
Meta ha presentato oggi le sue ultime innovazioni nel campo dei modelli di linguaggio grande, rafforzando la sua posizione di leader in questo campo. Queste nuove tecnologie sono state annunciate durante il mese di dicembre del 2025.
La Cina ha presentato una serie di regole innovative per prevenire la violenza e il suicidio causati da chatbot AI. Le norme, che potrebbero diventare le più severe al mondo, mirano a impedire che i chatbot simulino conversazioni umane in modo da influenzare negativamente gli utenti.
ChatGPT, il modello di linguaggio grande, sta diventando sempre più integrato con altre piattaforme per offrire esperienze utente più complete. In questo articolo scopriremo come utilizzare le nuove integrazioni di ChatGPT con servizi come Spotify, DoorDash e Uber.
Un ex ingegnere di Samsung è stato accusato di aver rivelato i segreti della sua ex azienda ai cinesi. I documenti manoscritti contengono dettagli cruciali sui processi produttivi dei DRAM a 10nm.
Più di 20 venture capitalist condividono i loro pensieri sull'intelligenza artificiale, sui budget aziendali e altro ancora per il 2026.
Il team di Machine-Learning-Dynamical-Systems ha lanciato kooplearn, una libreria di apprendimento automatico che implementa estimatori lineari, kernel e deep-learning per operatori evolutivi dinamici. Questo framework consente di analizzare sistemi dinamici tramite metodi spettrali, derivare modelli ridotti di ordine dati e previsione future state e osservabili.
Un nuovo framework propone una soluzione innovativa per controllare la lunghezza dei generi dei grandi modelli di ragionamento, migliorando l'efficienza e la concisione.
Un team di ricercatori ha sviluppato un nuovo framework per l'analisi psicologica utilizzando modelli di linguaggio grandi. Il progetto, chiamato House-Tree-Person (HTP), utilizza la collaborazione multi-agente per correggere le interpretazioni umane e produrre report con alta validità ecologica.
I grandi modelli di linguaggio (LLM) sono diventati sempre più popolari, ma spesso vengono utilizzati in modo scorretto. Un nuovo studio analizza perché questo accade e come insegnare ai modelli i loro errori.
I modelli di ragionamento grandi (LRM) sono stati sviluppati utilizzando l'apprendimento guidato con ricompense verificabili (RLVR) per migliorare le loro capacità di ragionamento. Un nuovo studio ha esplorato come le diverse polarità delle sample influenzino i dinami e comportamenti dell'addestramento RLVR. I risultati mostrano che le sample positive migliorano le pattern di ragionamento corretti, mentre quelle negative incoraggiano l'esplorazione di nuove strade di ragionamento. Il lavoro propone un nuovo metodo per la token-level Advantage shaping, A3PO, che migliora la precisione degli impulsi di vantaggio alle chiavi dei token in base alla polarità.
Gamayun, un nuovo modello LLM multilingue, ha superato i suoi concorrenti con una strategia di pre-allenamento innovativa. Grazie a questo approccio, il modello può essere adattato in ambienti con risorse limitate.
I ricercatori hanno finalmente trovato una soluzione per il problema della falsa informazione nei modelli di linguaggio. La loro teoria unifica le diverse definizioni esistenti e fornisce una chiave comune per valutare i risultati.
Meta ha annunciato la creazione di dUltra, un nuovo framework di apprendimento per migliorare le prestazioni dei modelli di diffusione. Questo nuovo approccio utilizza l'apprendimento guidato per ottimizzare il processo di decodifica in modo parallelo.
Un gruppo di ricercatori ha sviluppato un nuovo framework di apprendimento automatico che può risolvere problemi quantistici complessi con una grande precisione. Il framework, basato su intelligenza artificiale, utilizza reti neurali per imparare funzioni Bloch e loro corrispondenti valori energetici in modo simultaneo.