📁 Frameworks

La sezione Frameworks osserva il livello software che trasforma i modelli in sistemi operativi: orchestrazione, pipeline RAG, osservabilita, serving ed evaluation. Trovi aggiornamenti su LangChain, tooling vettoriale, runtime di inferenza e pattern di deployment realmente utili per iterare velocemente senza perdere stabilita. Gli articoli sono selezionati per aiutare scelte architetturali concrete, con collegamenti alla pillar frameworks, alla pillar LLM e ai trend.

NVIDIA ha partecipato a KubeCon Europe ad Amsterdam, evidenziando il proprio impegno nell'open source per l'intelligenza artificiale e le più recenti consegne alla comunità. L'azienda continua a investire in soluzioni open per semplificare lo sviluppo e il deployment di applicazioni AI.

2026-03-24 Fonte

Un nuovo studio introduce MARLIN, un approccio di reinforcement learning multi-agente per scoprire strutture causali da dati osservazionali. MARLIN mira a migliorare l'efficienza nell'identificazione di grafi aciclici diretti (DAG), rendendolo adatto ad applicazioni online e superando i metodi esistenti in termini di velocità ed efficacia.

2026-03-24 Fonte

ProMAS è un framework che utilizza transizioni di Markov per l'analisi predittiva degli errori in sistemi multi-agente basati su LLM. Estraendo Causal Delta Features e integrando un Prediction Head proattivo, ProMAS localizza gli errori con una latenza ridotta rispetto ai metodi reattivi, bilanciando precisione diagnostica ed esigenze real-time.

2026-03-24 Fonte
📁 Frameworks AI generated

GTK3: Rilasci annuali per il toolkit UI legacy

Il toolkit GTK 3.24.52 è stato rilasciato, segnando un cambiamento nella frequenza degli aggiornamenti. A causa della vasta base di software che ancora dipende da GTK3, il progetto continuerà a fornire una release all'anno, focalizzandosi sulla manutenzione e correzione di bug.

2026-03-24 Fonte

È stata creata una repository GitHub che raccoglie link e risorse relative al progetto Autoresearch di Andrej Karpathy. La repository mira a fornire un punto di riferimento centralizzato per chi è interessato a questo filone di ricerca.

2026-03-24 Fonte

La nuova release di PyTorch 2.11 introduce miglioramenti significativi per il training distribuito, con particolare attenzione alle GPU NVIDIA Hopper e Blackwell grazie al backend FlashAttention-4 per FlexAttention. Ampliato il supporto per i dispositivi Apple Silicio (MPS) e ottimizzazioni per GPU Intel (XPUGraph) e AMD (ROCm). Torchscript è stato deprecato a favore di torch.export e Executorch. Aumentata la frequenza di rilascio a uno ogni due mesi a partire dal 2026.

2026-03-23 Fonte

Il celebre player musicale XMMS, ispirato a Winamp e molto popolare su Linux, è stato riportato in vita grazie all'intelligenza artificiale. Una nuova versione, basata su GTK4 e GStreamer/PipeWire, è stata sviluppata a partire dal codice originale, a circa vent'anni dall'ultima release ufficiale.

2026-03-23 Fonte

LangSmith Fleet introduce due tipi di autorizzazione per gli agenti: "on-behalf-of" (agenti che operano per conto di un utente) e "Claws" (agenti con credenziali fisse). Questa distinzione permette di gestire in modo più flessibile l'accesso ai dati e le azioni che gli agenti possono intraprendere, aprendo nuove possibilità per l'automazione e l'interazione uomo-macchina.

2026-03-23 Fonte

AvaloniaUI introduce il supporto MAUI per applicazioni Linux e WebAssembly, colmando una lacuna nel framework .NET di Microsoft. L'adozione potrebbe essere limitata da bug persistenti e una base utenti ancora contenuta.

2026-03-23 Fonte

La nuova versione di Firefox, la 149, introduce diversi miglioramenti, tra cui un file picker XDG Portal e un decoder JPEG-XL sviluppato in Rust. L'aggiornamento mira a migliorare l'esperienza utente e la sicurezza del browser multipiattaforma di Mozilla.

2026-03-23 Fonte

Sono disponibili versioni rielaborate dei plugin di LM Studio per la ricerca web, progettate per migliorare l'affidabilità e la qualità dei risultati. I plugin aggiornati, DuckDuckGo Reworked e Visit Website Reworked, sono scaricabili da LM Studio Hub e offrono un'alternativa locale a servizi basati su cloud.

2026-03-23 Fonte

Un ingegnere dati esperto di LLM sottolinea come strumenti consolidati come Elasticsearch e OpenSearch possano essere validi sostituti dei vector store tradizionali per il Retrieval Augmented Generation (RAG), specialmente in scenari con dataset di dimensioni contenute. L'articolo esplora l'uso di modelli BERT in questo contesto.

2026-03-23 Fonte

Baidu ha presentato DuCCAE, un motore ibrido che mira a bilanciare reattività e capacità di gestione di task complesse nei sistemi di conversazione. Il sistema disaccoppia la generazione di risposte in tempo reale dall'esecuzione asincrona, integrando i risultati nel dialogo in corso. L'implementazione ha portato a un aumento della retention degli utenti e del tasso di completamento di task complesse.

2026-03-23 Fonte

Un nuovo approccio di visualizzazione facilita la comparazione delle performance di modelli di regressione. Il metodo proposto considera i residui in uno spazio 2D, sfruttando la distanza di Mahalanobis e una colormap per identificare regioni dense e outlier, offrendo una comprensione più dettagliata delle distribuzioni degli errori rispetto alle metriche aggregate tradizionali.

2026-03-23 Fonte

Un nuovo approccio all'AI auto-migliorante, chiamato Hyperagents, integra agenti di task e meta-agenti in un singolo programma modificabile. Questo permette l'auto-modifica metacognitiva, migliorando sia le prestazioni nelle consegne che il meccanismo di miglioramento stesso, superando i limiti degli approcci tradizionali.

2026-03-23 Fonte

Un nuovo studio esplora un approccio ibrido per la pianificazione automatica, combinando tecniche lifted e grounded tramite codifiche SAT. Il metodo proposto mira a superare i limiti di scalabilità delle soluzioni tradizionali, mantenendo azioni lifted e groundando parzialmente i predicati. I risultati mostrano miglioramenti nelle performance, specialmente su piani di lunga durata.

2026-03-23 Fonte

Kreuzberg v4.5, un framework open-source per l'analisi intelligente dei documenti, introduce miglioramenti significativi nelle prestazioni. Integrando il modello RT-DETR v2 (Docling Heron), Kreuzberg offre un'estrazione della struttura dei documenti più rapida (2.8x) e con un minore overhead di memoria rispetto a Docling, pur mantenendo una qualità comparabile. Supporta 12 linguaggi di programmazione e oltre 88 formati di file.

2026-03-22 Fonte

Una fork di llama.cpp, denominata ik_llama.cpp, promette un'accelerazione significativa nell'elaborazione di prompt per il modello Qwen 3.5 27B. I test su hardware specifico mostrano incrementi notevoli nella velocità di valutazione e generazione, grazie all'implementazione di kernel GDN fusi che riducono il carico sulla CPU.

2026-03-22 Fonte

Il framework mlx-lm introduce la predizione multi-token (MTP) per i modelli Qwen-3.5, incrementando significativamente la velocità di generazione. I primi benchmark su un M4 Pro mostrano un aumento di throughput di circa il 50%, aprendo nuove prospettive per l'inference efficiente di LLM su hardware Apple Silicio. Questo aggiornamento promette di migliorare le performance dei modelli open source in locale.

2026-03-21 Fonte

Gli sviluppatori di KDE sono al lavoro sulle nuove funzionalità per il desktop Plasma 6.7. Tra le novità, l'integrazione del supporto per le LUT 3D (Look-Up Tables) in KWin, il gestore di finestre di Plasma. Questa implementazione mira a migliorare la gestione del colore e l'accuratezza visiva, sfruttando al meglio le capacità delle GPU più recenti.

2026-03-21 Fonte