📁 Frameworks

La sezione Frameworks osserva il livello software che trasforma i modelli in sistemi operativi: orchestrazione, pipeline RAG, osservabilita, serving ed evaluation. Trovi aggiornamenti su LangChain, tooling vettoriale, runtime di inferenza e pattern di deployment realmente utili per iterare velocemente senza perdere stabilita. Gli articoli sono selezionati per aiutare scelte architetturali concrete, con collegamenti alla pillar frameworks, alla pillar LLM e ai trend.

📁 Frameworks AI generated

AutoB2G: Un Framework Agente LLM per la Co-Simulazione Edificio-Rete Automatica

AutoB2G è un nuovo framework che automatizza la co-simulazione tra edifici e reti energetiche, sfruttando i Large Language Models (LLM). Affronta le lacune degli ambienti di simulazione esistenti, che spesso trascurano l'impatto a livello di rete e richiedono configurazioni manuali complesse. Estendendo CityLearn V2 e integrando il framework SOCIA, AutoB2G permette di generare, eseguire e perfezionare simulazioni basandosi su descrizioni in linguaggio naturale, migliorando l'efficienza e le metriche prestazionali della rete.

2026-03-30 Fonte

📁 Frameworks AI generated

AMD GAIA: interfaccia web per agenti AI locali con priorità alla privacy

AMD ha rilasciato una nuova versione di GAIA, il framework per agenti AI destinato all'hardware Ryzen AI. La versione 0.17 introduce Agent UI, una web app focalizzata sulla privacy per la gestione di agenti AI eseguiti in locale.

2026-03-28 Fonte

📁 Frameworks AI generated

Gedit: cicli di rilascio più rapidi e stop ai contributi AI/LLM

Il popolare editor di testo Gedit ha rilasciato la versione 50, allineata al desktop GNOME. Gli sviluppatori puntano ora a rilasci più frequenti e hanno deciso di escludere contributi basati su intelligenza artificiale o modelli linguistici di grandi dimensioni (LLM).

2026-03-28 Fonte

📁 Frameworks AI generated

OpenAI estende Codex con plugin, allineandosi a Claude Code

OpenAI ha introdotto il supporto per i plugin nella sua applicazione di coding agentic, Codex. Questa mossa sembra mirata a colmare il divario con funzionalità simili offerte da Anthropic in Claude Code e Google con l'interfaccia a riga di comando di Gemini. I plugin includono skill, integrazioni di app e server MCP, configurando Codex per task specifici e replicabili.

2026-03-27 Fonte

📁 Frameworks AI generated

TurboQuant-v3 di Google: compressione dei pesi LLM su GPU consumer

Google presenta TurboQuant-v3, una tecnica per comprimere i pesi dei modelli linguistici di grandi dimensioni (LLM), riducendo l'utilizzo di VRAM e accelerando l'inference. A differenza delle precedenti versioni focalizzate sulla cache KV, TurboQuant-v3 agisce direttamente sui pesi, rendendo possibile l'esecuzione di LLM più grandi su GPU consumer. Promette una riduzione della memoria di circa 4 volte e un aumento della velocità di 2-3 volte.

2026-03-27 Fonte

📁 Frameworks AI generated

Ottimizzazione Llama.cpp: -90% dequantization, +22% velocità

Un affinamento open source per Llama.cpp riduce drasticamente il tempo di dequantization della cache KV, accelerando l'inference del modello Qwen3.5-35B-A3B fino al 22.8% su un M5 Max. La tecnica sfrutta la sparsità dell'attenzione, saltando la dequantization per posizioni irrilevanti, con impatto minimo sulla perplexity.

2026-03-27 Fonte

📁 Frameworks AI generated

AMD ROCm 7.12: Anteprima tecnica con supporto APU e GPU esteso

AMD ha rilasciato ROCm 7.12 come nuova anteprima tecnica, in preparazione alla versione 8.0. Questa release estende il supporto a un numero maggiore di APU e GPU consumer, ampliando le opzioni per gli sviluppatori che utilizzano l'ecosistema ROCm.

2026-03-27 Fonte

📁 Frameworks AI generated

Rilasciato wlroots 0.20, Sway 1.12-rc1 in fase di test

È stato rilasciato wlroots 0.20, libreria di supporto Wayland utilizzata da alcuni compositori Wayland. Successivamente, è stata rilasciata la versione 1.12-rc1 di Sway per i test, un compositore Wayland ispirato al window manager i3.

2026-03-27 Fonte

📁 Frameworks AI generated

Copla: Automazione della compliance ISO 27001, SOC 2 e DORA

Copla offre una piattaforma per automatizzare i processi di compliance a standard come ISO 27001, SOC 2 e DORA, con supporto CISO. L'obiettivo è semplificare la raccolta di evidenze e la gestione delle policy, riducendo i tempi necessari per gli audit di compliance. Il servizio parte da 2.999 euro all'anno.

2026-03-26 Fonte

📁 Frameworks AI generated

Valutazione degli agenti AI: metriche e metodologie

La definizione di valutazioni (evals) mirate è cruciale per plasmare il comportamento degli agenti AI. L'articolo esplora come curare i dati, definire le metriche e condurre valutazioni per migliorare l'accuratezza e l'affidabilità degli agenti, con un focus sull'importanza di evals che riflettano i comportamenti desiderati in produzione.

2026-03-26 Fonte

📁 Frameworks AI generated

RotorQuant: Quantization vettoriale accelerata con Clifford Algebra

RotorQuant, una nuova tecnica di quantization vettoriale basata sull'algebra di Clifford, promette prestazioni superiori rispetto a TurboQuant. Implementata su CUDA e Metal shader, offre velocità superiori con un numero significativamente inferiore di parametri, mantenendo un'alta similarità coseno e ottimi risultati nei test needle-in-haystack.

2026-03-26 Fonte

📁 Frameworks AI generated

MCP e CLI: quale valore aggiunto per gli agenti AI?

Un utente si interroga sull'utilità di MCP (Meta-Control Protocol) e strumenti come MCPorter, considerando che le interfacce a riga di comando (CLI) già offrono funzionalità simili per interagire con servizi come GitHub e AWS. L'articolo esplora il potenziale valore aggiunto di MCP in termini di standardizzazione e astrazione per gli agenti AI.

2026-03-26 Fonte

📁 Frameworks AI generated

ITPO: Ottimizzazione implicita per interazioni AI proattive

Un nuovo approccio, Implicit Turn-wise Policy Optimization (ITPO), mira a migliorare le interazioni uomo-AI in scenari collaborativi multi-turno. ITPO utilizza un modello di ricompensa implicito per derivare ricompense granulari, incrementando la robustezza e la stabilità del training. I risultati mostrano convergenza migliorata in compiti come il tutoring matematico, la scrittura di documenti e la raccomandazione medica.

2026-03-26 Fonte

📁 Frameworks AI generated

Environment Maps: rappresentazioni ambientali strutturate per agenti long-horizon

Un nuovo approccio, chiamato Environment Maps, mira a migliorare l'automazione dei workflow software complessi. Utilizzando una rappresentazione strutturata dell'ambiente, consolida dati eterogenei per mitigare errori a cascata e migliorare le performance degli agenti in task di lunga durata, quasi raddoppiando il tasso di successo rispetto ai sistemi di riferimento.

2026-03-26 Fonte

📁 Frameworks AI generated

Liquid AI: LFM2-24B a 50 token/s su browser con WebGPU

Il modello LFM2-24B-A2B di Liquid AI, un modello MoE con 24 miliardi di parametri totali (2 miliardi attivi), raggiunge circa 50 token al secondo in un browser web utilizzando WebGPU. La variante 8B A1B supera i 100 token al secondo sullo stesso hardware. Sono disponibili demo e modelli ONNX ottimizzati.

2026-03-26 Fonte

📁 Frameworks AI generated

TurboQuant di Google: compressione lossless per memoria AI

Google presenta TurboQuant, un algoritmo di compressione lossless progettato per ridurre l'impronta di memoria dei modelli di intelligenza artificiale. L'algoritmo promette una compressione fino a 6 volte, ma al momento è solo un esperimento di laboratorio. La comunità online ha già soprannominato l'iniziativa "Pied Piper", in riferimento alla serie TV Silicio Valley.

2026-03-25 Fonte

📁 Frameworks AI generated

OpenAI definisce un framework pubblico per il comportamento dei modelli

OpenAI ha introdotto il Model Spec, un framework pubblico per definire il comportamento dei modelli di intelligenza artificiale. Questo approccio mira a bilanciare sicurezza, libertà dell'utente e responsabilità, diventando sempre più cruciale con l'evoluzione dei sistemi di AI.

2026-03-25 Fonte

📁 Frameworks AI generated

LangSmith Fleet: Skill Condivise per Agenti AI più Informati

LangSmith Fleet introduce le skill condivise, permettendo ai team di dotare gli agenti AI di conoscenze specialistiche. Le skill possono essere create da prompt, manualmente, da template o da chat precedenti, e condivise nel workspace, rimanendo automaticamente sincronizzate. Questo approccio mira a risolvere il problema della perdita di conoscenza aziendale quando i dipendenti lasciano l'azienda, codificando il sapere per un uso più ampio.

2026-03-25 Fonte

📁 Frameworks AI generated

JetBrains punta sullo sviluppo agentic con Central, abbandona il pair programming

JetBrains introduce Central per lo sviluppo software agentic basato su AI, dismettendo la funzionalità di pair programming Code With Me. L'azienda si concentra su nuove aree, evolvendo il proprio ecosistema di strumenti per sviluppatori.

2026-03-25 Fonte

📁 Frameworks AI generated

Alternative a LiteLLM dopo l'attacco alla supply chain

Dopo un attacco alla supply chain che ha compromesso le versioni 1.82.7 e 1.82.8 di LiteLLM su PyPI, sono state proposte diverse alternative open source. Tra queste, Bifrost, Kosong ed Helicone, che offrono funzionalità simili o estese, con diversi approcci all'astrazione di LLM e all'osservabilità.

2026-03-25 Fonte

← Prec 1 2 3 … 21 22 23 24 25 … 45 46 47 Succ →