NVIDIA ha annunciato il supporto ufficiale per le distribuzioni compatibili con Red Hat Enterprise Linux (RHEL) come AlmaLinux in CUDA 13.2. Ciò consente la distribuzione dei pacchetti NVIDIA direttamente dai repository dei sistemi operativi, semplificando l'installazione e la gestione per gli utenti.
Intel ha reso disponibile su GitHub l'SDK della versione 3.0 di XeSS (Xe Super Sampling), la sua tecnicia di upscaling basata su AI per videogiochi. Tuttavia, il software rimane proprietario e supporta nativamente solo Windows.
La suite per ufficio open source LibreOffice introduce il supporto nativo per il formato Markdown nella sua ultima versione. Gli utenti potranno importare ed esportare documenti in CommonMark, ampliando le opzioni di compatibilità e semplificando la gestione di testi in chiaro.
Richard Biener di SUSE ha comunicato lo stato di avanzamento dello sviluppo di GCC 16. La correzione delle regressioni procede lentamente, ma si spera di pubblicare una release candidate entro metà aprile.
È stata rilasciata la versione 0.7 di Rust Coreutils, un'alternativa alle GNU Coreutils focalizzata sulle prestazioni. L'obiettivo del progetto rimane la piena compatibilità con la GNU Test Suite, offrendo un set di strumenti di sistema sviluppato in Rust.
JAWS è una tecnica di regolarizzazione che migliora la stabilità degli operatori neurali, modelli surrogate data-driven usati per simulare sistemi dinamici continui. Modulando la regolarizzazione in base alla complessità fisica locale, JAWS preserva i gradienti e riduce i costi computazionali.
Un nuovo approccio, Traversal-as-Policy, utilizza Gated Behavior Trees (GBT) derivati da log di esecuzione per controllare agenti LLM. Questo metodo migliora la sicurezza, l'efficienza e l'affidabilità, riducendo violazioni e costi computazionali. I risultati mostrano significativi miglioramenti su benchmark standard, aprendo nuove prospettive per lo sviluppo di agenti autonomi più robusti.
Un vicepresidente di AMD ha utilizzato l'intelligenza artificiale per sviluppare un driver userland per Linux Radeon in Python. Un ingegnere AI ha affermato di non aver mai aperto l'editor durante il processo, evidenziando il potenziale dell'AI nella generazione di codice.
AMD ha rilasciato la versione 0.16 di GAIA, un framework open-source per lo sviluppo di agenti AI che girano localmente su hardware Ryzen AI. La novità principale è il supporto allo sviluppo in C++, eliminando la dipendenza da Python.
Google ha rilasciato 'gws', una nuova interfaccia a riga di comando su GitHub. Questo strumento unifica le API di Workspace, semplificando l'interazione tra agenti AI e servizi come Gmail e Drive. L'iniziativa sottolinea l'importanza crescente dell'AI agentiva per Google.
Il team PyTorch ha rilasciato KernelAgent, un sistema agentico open source che ottimizza i kernel GPU basandosi sui segnali di performance dell'hardware. KernelAgent raggiunge un miglioramento medio di 1.56x rispetto a torch.compile e genera kernel che raggiungono l'89% dell'efficienza teorica dell'hardware su H100. Il sistema utilizza un flusso di lavoro multi-agente per profilare, diagnosticare e prescrivere ottimizzazioni, accelerando l'inference e riducendo i costi.
Google ha rilasciato Workspace CLI, un'interfaccia a riga di comando per integrare i servizi Workspace con strumenti di AI. Non è un prodotto supportato ufficialmente, quindi l'utente si assume i rischi legati all'utilizzo e alla potenziale instabilità.
Codex Security è un agente di sicurezza basato su intelligenza artificiale progettato per analizzare il contesto dei progetti, rilevare, validare e correggere vulnerabilità complesse con elevata precisione e riduzione dei falsi positivi.
La webUI Agentic Loop e MCP Client, con supporto per strumenti, risorse e prompt, sono stati integrati in llama.cpp. Questa integrazione offre nuove possibilità per l'esecuzione di modelli localmente, aprendo la strada a workflow più complessi e automatizzati.
È stata rilasciata la versione 1.4.345 di Vulkan, l'ultimo aggiornamento ordinario delle specifiche di questa API grafica e di calcolo. Oltre a una serie di chiarimenti e correzioni a vari elementi delle specifiche, è presente una nuova estensione. L'aggiornamento si concentra sul miglioramento delle capacità di shading su architetture ARM.
Un nuovo approccio di machine learning basato su reti neurali profonde (DNN), denominato EINN (equilibrium-informed neural networks), promette di identificare le soglie critiche associate a cambiamenti di regime catastrofici in sistemi dinamici complessi. Il metodo EINN inverte il processo tradizionale, utilizzando stati di equilibrio candidati come input per inferire i parametri di sistema corrispondenti.
Un nuovo approccio, FreST Loss, affronta le limitazioni dei modelli di previsione diretta che faticano a catturare le complesse dipendenze spazio-temporali nei segnali strutturati a grafo. Allineando le previsioni del modello con i dati reali nel dominio spettrale unificato, FreST Loss riduce la distorsione di stima e migliora le prestazioni su diversi dataset reali.
SkillNet è una nuova infrastruttura open source progettata per creare, valutare e organizzare le skill degli agenti di intelligenza artificiale. Il sistema mira a superare i limiti dell'apprendimento isolato, consentendo agli agenti di riutilizzare e migliorare le skill esistenti. SkillNet integra un repository di oltre 200.000 skill e un toolkit Python, dimostrando miglioramenti significativi nelle performance degli agenti in diversi ambienti.
Un team ha scoperto che Whisper, durante i silenzi, genera frasi coerenti ma inesistenti, non semplice rumore. Analizzano le cause, legate al training su YouTube, e propongono soluzioni: un pre-filtro con Silero VAD, la disattivazione di 'condition_on_previous_text', una blocklist di frasi tipiche e altri accorgimenti per ridurre il problema.
La creazione di skill per agenti di programmazione richiede una fase di test accurata. Questo articolo esplora le best practice per valutare le skill, dalla definizione di task specifici alla misurazione delle performance, con un focus sull'importanza di un ambiente di test controllato e metriche chiare per quantificare i miglioramenti.