LG Display sta implementando Nvidia PhysicsNeMo per creare un sistema di gemelli digitali dedicato alla produzione di pannelli in Corea del Sud. L'obiettivo è ottimizzare i processi e migliorare l'efficienza attraverso simulazioni avanzate.
Disponibile la versione 0.74 di InputPlumber, il demone open-source per il routing e il controllo degli input su sistemi Linux. Questa release offre funzionalità avanzate per la combinazione di dispositivi di input multipli e l'emulazione di diversi input, particolarmente utile per il gaming su Linux.
Anthropic ha modificato Claude Code, il suo strumento di sviluppo assistito da intelligenza artificiale, per nascondere i nomi dei file letti, scritti o modificati. Gli sviluppatori si oppongono, poiché la visibilità è essenziale per il debug e la comprensione del processo.
Un nuovo framework leggero per la classificazione di informazioni umanitarie provenienti dai social media in contesti di emergenza. Sfrutta il fine-tuning efficiente di Llama 3.1 8B tramite LoRA, ottenendo un'accuratezza del 79.62% con un training di solo il 2% dei parametri. QLoRA riduce ulteriormente i costi di memoria mantenendo prestazioni elevate.
OptiML è un framework end-to-end che utilizza modelli linguistici di grandi dimensioni (LLM) e la ricerca Monte Carlo per ottimizzare le performance dei kernel CUDA. Il sistema genera o affina codice CUDA, verificando e profilando le trasformazioni per massimizzare l'efficienza su hardware specifico.
Un nuovo studio introduce Entity State Tuning (EST), un framework che migliora la previsione di grafi di conoscenza temporali. EST utilizza stati persistenti delle entità per modellare le dipendenze strutturali e l'evoluzione temporale, superando i limiti dei metodi esistenti e ottenendo performance all'avanguardia.
Un nuovo studio introduce un framework teorico per ripensare il benchmarking nell'ambito dell'intelligenza artificiale, in particolare per i modelli linguistici di grandi dimensioni. Il framework propone un approccio adattivo che integra le priorità degli stakeholder e le metriche di valutazione, mirando a benchmark più contestualizzati e allineati con le esigenze umane.
Peter Steinberger, noto per aver creato OpenClaw, entra a far parte di OpenAI. OpenClaw continuerà ad essere sviluppato come progetto open source, garantendo la sua disponibilità e il suo contributo alla comunità degli sviluppatori.
KosmicKrisp, il driver Vulkan-on-Metal sviluppato da LunarG per macOS, ha raggiunto un importante traguardo: la parità di funzionalità con MoltenVK. Questo apre nuove possibilità per l'utilizzo dell'API Vulkan sui sistemi Apple, offrendo un'alternativa efficiente.
Kreuzberg, framework open source per l'estrazione di informazioni da documenti, si aggiorna alla versione 4.3.0. Introduce miglioramenti prestazionali e supporto nativo per PaddleOCR, ottimizzato per le lingue asiatiche. I benchmark comparativi evidenziano throughput elevato rispetto ad alternative come Apache Tika e PDFPlumber.
AdaLLM è un nuovo runtime focalizzato sull'inference NVFP4 accelerata su GPU Ada Lovelace, come la RTX 4090. Implementa una cache KV FP8 e un kernel di decodifica FP8 personalizzato, evitando il fallback a FP16. Supporta modelli come Qwen3 e Gemma3, offrendo benchmark di performance e istruzioni di installazione rapida.
Un recente aggiornamento a Llama.cpp sembra aver significativamente migliorato le prestazioni del modello Qwen3 Coder Next. I test indicano un aumento del throughput, misurato in token al secondo, utilizzando configurazioni hardware specifiche con GPU NVIDIA RTX.
Implementazione leggera in GGML di Qwen3-TTS 0.6B, focalizzata sull'inference rapida e sull'utilizzo efficiente della memoria. L'ottimizzazione con Metal backend e CoreML code predictor promette un incremento di velocità fino a 4 volte rispetto alla pipeline PyTorch, con un ingombro di circa 2 GB di memoria. Supporta tutte le funzionalità, incluso il voice cloning.
WinApps permette di integrare applicazioni Windows all'interno di un ambiente desktop Linux, sfruttando macchine virtuali gestite automaticamente. Un approccio per chi necessita di software Windows specifici senza abbandonare Linux.
Una pull request su llama.cpp introduce ottimizzazioni per il modello Qwen3Next, promettendo un incremento nella velocità di elaborazione (token/secondo). I miglioramenti mirano a rendere il modello più efficiente e performante.
Una panoramica di strumenti per lo sviluppo di applicazioni con modelli linguistici di grandi dimensioni (LLM) eseguiti in locale, anziché su cloud. Vengono presentati diversi framework e IDE che facilitano l'integrazione di LLM nei progetti di sviluppo, con un focus sull'esperienza degli sviluppatori.
Un utente ha scoperto che Claude Code riprocessava l'intero prompt a ogni richiesta, a causa di un header di billing dinamico. La soluzione consiste nel disabilitare l'invio dell'header tramite una configurazione locale, ripristinando l'efficacia della cache KV.
La release 6.6 di KDE Plasma è prevista a breve. Gli sviluppatori sono al lavoro sugli ultimi miglioramenti e stanno già implementando nuove funzionalità per la versione 6.7, con particolare attenzione alla semplificazione della condivisione di risorse Samba.
Una demo mostra l'esecuzione di GPT-OSS (20B) interamente in locale all'interno di un browser, sfruttando WebGPU. Il sistema è basato su Transformers.js v4 (anteprima) e ONNX Runtime Web. Il codice sorgente e il modello ONNX ottimizzato sono disponibili su Hugging Face.
OpenAI ha presentato GABRIEL, un toolkit open-source basato su GPT. Questo strumento è progettato per trasformare dati testuali e immagini qualitative in dati quantitativi, con l'obiettivo di supportare i ricercatori nell'analisi di studi di scienze sociali su vasta scala.