Il regista Darren Aronofsky ha collaborato con Time per "On This Day... 1776", una serie di brevi video che ricostruiscono eventi della Rivoluzione Americana tramite AI. La critica non ha accolto positivamente il progetto, definendolo "osceno" e "terribile".
Un utente dimostra come far girare un modello linguistico di grandi dimensioni (LLM) da 16 miliardi di parametri su un laptop HP ProBook del 2018 con processore Intel i3 di ottava generazione e 16GB di RAM. Ottimizzando l'uso della iGPU e sfruttando modelli MoE, si raggiungono velocità di inference sorprendenti, aprendo nuove prospettive per chi ha budget limitati.
Una nuova ricerca propone un framework, Causal Analyst, per identificare le cause dirette delle vulnerabilità (jailbreak) nei modelli linguistici di grandi dimensioni (LLM). Il sistema utilizza l'analisi causale per migliorare sia gli attacchi che le difese, dimostrando come specifiche caratteristiche dei prompt possano innescare comportamenti indesiderati.
Un utente ha condiviso la sua esperienza positiva con il modello linguistico Qwen3-235B, eseguito su un sistema desktop. L'utente ha sottolineato l'accuratezza del modello e la sua utilità, al punto da preferirlo a un abbonamento commerciale a ChatGPT.
La community di LocalLLaMA si interroga sul futuro di Gemma 4, chiedendosi se Google stia ancora investendo nello sviluppo del modello linguistico. Nonostante i progressi nel settore, il destino di Gemma 4 rimane incerto.
SoproTTS v1.5 è un modello TTS (text-to-speech) da 135 milioni di parametri che offre clonazione vocale zero-shot. Addestrato con circa 100 dollari su una singola GPU, il modello raggiunge una velocità di esecuzione di circa 20 volte il tempo reale su un MacBook M3 base. La nuova versione v1.5 offre latenza ridotta e maggiore stabilità.
OpenAI ha annunciato un aggiornamento del suo modello di sviluppo agentico Codex, progettato per accelerare le capacità di sviluppo. La notizia arriva poco dopo un annuncio simile da parte di Anthropic, segnalando una competizione crescente nel settore.
Sono stati rilasciati LightOnOCR-2 e GLM-OCR, due nuovi modelli per il riconoscimento ottico dei caratteri (OCR). Un utente ha segnalato prestazioni superiori rispetto alle soluzioni disponibili a fine 2025, con GLM-OCR che offre velocità e output strutturato affidabile.
Presentato GPT-5.3-Codex, un modello avanzato per la generazione di codice che combina le prestazioni di GPT-5.2-Codex con capacità di ragionamento e conoscenza professionale superiori. Il modello si posiziona come uno dei più avanzati nel suo genere.
Anthropic ha rilasciato la versione 4.6 di Opus, il suo modello linguistico di punta. Questa release punta ad ampliare la sua applicabilità a nuovi casi d'uso, in particolare quelli che coinvolgono team di agenti AI.
DeepBrainz ha rilasciato DeepBrainz-R1, una famiglia di modelli linguistici di dimensioni ridotte (4B, 2B, 0.6B) focalizzati sul ragionamento per workflow agentici. Ottimizzati per il ragionamento multi-step e la stabilità nel tool-calling, questi modelli Apache 2.0 mirano a fornire un comportamento prevedibile in configurazioni locali e con costi contenuti.
Meta sta sperimentando un'applicazione indipendente per 'Vibes', la sua piattaforma di video brevi generati tramite intelligenza artificiale. Lanciata a settembre, Vibes consente agli utenti di creare e condividere video AI e di accedere a un feed dedicato.
Trillion Labs e KAIST AI hanno presentato gWorld, un modello di mondo visuale open-weight per interfacce grafiche mobile. gWorld, disponibile nelle versioni 8B e 32B, genera codice web eseguibile anziché pixel, superando in accuratezza modelli più grandi come Llama 4. Questo approccio offre una migliore fedeltà visiva e precisione del testo rispetto ai modelli basati su pixel o solo testo.
Un grafico prodotto da METR, un'organizzazione no-profit di ricerca sull'IA, è diventato un punto di riferimento per valutare i progressi dei modelli linguistici di grandi dimensioni (LLM). Tuttavia, la sua interpretazione è spesso fonte di confusione. L'analisi si basa principalmente su compiti di programmazione e misura il tempo impiegato dagli umani per completare compiti che l'IA riesce a svolgere con successo, non la durata di autonomia dei modelli stessi. Nonostante le limitazioni, lo studio offre una metrica concreta per valutare l'evoluzione dell'IA.
I modelli linguistici di grandi dimensioni (LLM) sono esposti a minacce di sicurezza complesse, come le backdoor sleeper-agent. Questi attacchi, difficili da individuare, compromettono l'integrità e la sicurezza dei modelli, aprendo scenari da film di fantascienza.
Microsoft presenta Paza, un progetto per migliorare il riconoscimento vocale automatico (ASR) in lingue con poche risorse. Include PazaBench, una classifica ASR per 39 lingue africane, e modelli ASR Paza, ottimizzati su sei lingue keniote. L'iniziativa, nata dal progetto Gecko, mira a colmare il divario digitale e linguistico, sviluppando tecnicie vocali in collaborazione con le comunità locali e valutando le prestazioni in contesti reali.
Un nuovo studio esplora l'uso del Natural Language Processing (NLP), inclusi i Large Language Models (LLM), per classificare automaticamente i materiali didattici rispetto alle linee guida dei programmi di studio di informatica. L'obiettivo è accelerare e semplificare il processo di valutazione della copertura dei contenuti.
Un nuovo studio analizza le difficoltà nell'estrazione automatica di decisioni mediche da testi clinici, rivelando come le variazioni linguistiche tra diverse categorie di decisioni influenzino negativamente l'accuratezza dei modelli. L'analisi evidenzia la necessità di strategie di estrazione più robuste, capaci di gestire la diversità stilistica dei testi medici.
Un nuovo studio analizza l'impatto dell'addestramento con privacy differenziale (DP-SGD) su dati long-tailed, caratterizzati da una grande quantità di campioni rari. La ricerca evidenzia come DP-SGD possa portare a performance di generalizzazione subottimali, specialmente su queste tipologie di dati, e fornisce un framework teorico per comprendere questo fenomeno.
Un nuovo metodo, Iteratively Improved Program Construction (IIPC), migliora le capacità di ragionamento matematico dei modelli linguistici di grandi dimensioni (LLM). IIPC affina iterativamente le catene di ragionamento programmatico, combinando il feedback di esecuzione con le capacità di Chain-of-thought del modello base. Il codice è open source.