Frameworks – Notizie e Articoli AI

📁 Frameworks AI generated

llama.cpp: Ottimizzazione Cruciale Migliora la Velocità di Elaborazione dei Prompt

Un recente aggiornamento per `llama.cpp` promette un significativo incremento nella velocità di elaborazione dei prompt. La modifica, introdotta tramite una Pull Request, mira a evitare la copia dei logit durante la fase di decodifica in ambienti multi-thread, un'ottimizzazione che si traduce in maggiore efficienza per i deployment di Large Language Models on-premise e locali, con impatti positivi su latenza e Throughput.

2026-05-17 Fonte

📁 Frameworks AI generated

FluidX3D 3.7: Nuovi orizzonti per la fluidodinamica computazionale con OpenCL

FluidX3D, il software di fluidodinamica computazionale (CFD) accelerato da CPU e GPU tramite OpenCL, ha raggiunto la versione 3.7. Questo aggiornamento introduce significativi miglioramenti prestazionali, consolidando la sua posizione come strumento chiave per simulazioni complesse che sfruttano l'hardware locale. La capacità di ottimizzare le risorse computazionali on-premise è fondamentale per gli specialisti che cercano controllo e sovranità dei dati.

2026-05-17 Fonte

📁 Frameworks AI generated

Ottimizzazione dell'Inference LLM: Test del Supporto MTP di llama.cpp su RTX 5090

Un recente test ha esplorato il supporto Multi-Token Pre-fill (MTP) di `llama.cpp` su una GPU NVIDIA RTX 5090 con 32 GB di VRAM. L'analisi, condotta con modelli Qwen3.6 quantizzati, ha mirato a isolare l'impatto dell'MTP sull'efficienza dell'inference, un aspetto cruciale per i deployment on-premise di Large Language Models. La metodologia ha confrontato l'MTP abilitato e disabilitato, utilizzando prompt di diversa lunghezza per valutare le prestazioni.

2026-05-17 Fonte

📁 Frameworks AI generated

llama.cpp: la versione b9180 rafforza l'inference LLM on-premise

La community di `llama.cpp` celebra il rilascio della versione `b9180`, un aggiornamento che introduce una nuova funzionalità identificata come "MTP". Questo sviluppo è particolarmente rilevante per gli specialisti che gestiscono Large Language Models in ambienti self-hosted, promettendo miglioramenti nelle capacità di deployment e nell'efficienza dell'inference su hardware locale.

2026-05-16 Fonte

📁 Frameworks AI generated

Supporto MTP integrato in llama.cpp: un passo avanti per l'inference locale

Il progetto Open Source llama.cpp ha integrato il supporto per MTP (Media Transfer Protocol) attraverso la Pull Request #22673. Questo sviluppo rafforza la capacità del Framework di eseguire Large Language Models in modo efficiente su un'ampia gamma di hardware, consolidando la sua posizione come soluzione chiave per i deployment on-premise e per la sovranità dei dati.

2026-05-16 Fonte

📁 Frameworks AI generated

Llama.cpp abbraccia il Multi-Processing: un passo avanti per gli LLM on-premise

Il progetto open source llama.cpp si prepara a integrare il supporto per il Multi-Threaded Processing (MTP), una novità che promette di migliorare significativamente le performance nell'esecuzione di Large Language Models (LLM) su hardware locale. Questa evoluzione è particolarmente rilevante per gli ambienti on-premise, dove l'ottimizzazione delle risorse hardware esistenti è cruciale per il deployment efficiente di modelli AI, rafforzando la sovranità dei dati e il controllo.

2026-05-16 Fonte

📁 Frameworks AI generated

Multi-Tensor Parallelism in llama.cpp: LLM più grandi su GPU distribuite

Il progetto open source llama.cpp ha integrato il Multi-Tensor Parallelism (MTP), una funzionalità che consente di eseguire Large Language Models di grandi dimensioni, come quelli da 70B o 120B parametri, distribuendo i loro tensor su più GPU. Questa innovazione è cruciale per l'inference locale di LLM complessi, rendendoli accessibili su configurazioni hardware con VRAM distribuita e offrendo nuove opportunità per i deployment on-premise, con benefici in termini di TCO e sovranità dei dati.

2026-05-15 Fonte

📁 Frameworks AI generated

Nuovi approcci per la generalizzazione OOD nei modelli molecolari

La scoperta di farmaci basata sull'AI affronta sfide significative nella previsione robusta di proprietà molecolari in scenari out-of-distribution (OOD). Un nuovo benchmark, SCOPE-BENCH, rivela limiti negli approcci attuali, mentre il framework POMA propone una pipeline innovativa per il trasferimento di conoscenza. POMA riduce l'errore assoluto medio fino all'11.2%, offrendo un miglioramento cruciale per l'affidabilità dei modelli in contesti critici come la ricerca farmaceutica.

2026-05-15 Fonte

📁 Frameworks AI generated

Nuovo Framework per Agenti AI: Un Approccio Bidimensionale alla Progettazione Architetturale

Un nuovo studio introduce un framework bidimensionale per la progettazione di architetture di agenti basati su LLM. Superando i limiti degli approcci monodimensionali, il modello combina la funzione cognitiva e la topologia di esecuzione, definendo 27 schemi di progettazione distinti. La ricerca valida l'ortogonalità del framework in quattro domini reali, derivando cinque leggi empiriche che guidano le scelte architetturali in base ai vincoli ambientali. Questo offre un vocabolario neutrale e agnostico per lo sviluppo di agenti AI.

2026-05-15 Fonte

📁 Frameworks AI generated

GraphBit: Orchestrazione Determinista per Agenti LLM Affidabili

GraphBit è un nuovo framework che affronta le sfide dell'orchestrazione di agenti LLM, come le "hallucinations" e l'esecuzione non riproducibile. Utilizzando un motore basato su Rust e un grafo aciclico diretto (DAG), garantisce workflow deterministici, riproducibilità e auditabilità. Il framework introduce un'architettura di memoria a tre livelli per prevenire il "context bloat" e ha dimostrato performance superiori su benchmark GAIA, con maggiore accuratezza, latenza ridotta e zero "hallucinations" indotte dal framework.

2026-05-15 Fonte

📁 Frameworks AI generated

Clawdmeter: un dashboard desktop open source per le statistiche di utilizzo di Claude Code

È stato rilasciato Clawdmeter, un nuovo strumento open source che offre agli utenti avanzati di AI coding un dashboard desktop compatto per monitorare le statistiche di utilizzo di Claude Code. Questa utility fornisce una visione immediata del consumo di risorse, supportando una gestione più consapevole delle interazioni con i Large Language Models basati su API.

2026-05-14 Fonte

📁 Frameworks AI generated

CAWI: Migliorare le Reti Neurali Randomizzate con l'Inizializzazione dei Pesi basata su Copule

Un nuovo framework, CAWI (Copula-Aligned Weight Initialization), affronta un limite chiave delle Reti Neurali Randomizzate (RdNN): l'incapacità dell'inizializzazione casuale convenzionale di catturare la dipendenza tra le caratteristiche dei dati. Proponendo un campionamento dei pesi allineato alle copule, CAWI migliora significativamente la performance predittiva delle RdNN, mantenendo la loro efficienza intrinseca e la soluzione in forma chiusa per lo strato di output. Questo approccio è rilevante per ottimizzare i carichi di lavoro AI in contesti con risorse limitate.

2026-05-14 Fonte

📁 Frameworks AI generated

MAVIC: Un Nuovo Approccio per la Gestione delle Istruzioni nei Sistemi Multi-Agente

Un nuovo studio introduce MAVIC (Macro-Action Value Correction for Instruction Compliance), un metodo per migliorare la capacità dei sistemi di apprendimento per rinforzo multi-agente di seguire istruzioni in linguaggio naturale. MAVIC risolve le incoerenze nelle stime di valore causate dalle interruzioni delle istruzioni, modificando i backup di Bellman. Questo permette una stima del valore più coerente e una maggiore conformità alle istruzioni, mantenendo le performance del compito base in ambienti complessi.

2026-05-14 Fonte

📁 Frameworks AI generated

Notion: la piattaforma sviluppatori integra agenti AI e dati esterni

Notion ha lanciato una nuova piattaforma per sviluppatori che permette ai team di integrare agenti AI, fonti di dati esterne e codice personalizzato direttamente nei loro workspace. Questa mossa segna un'espansione significativa nell'ambito del software di produttività basato su agenti, offrendo maggiore flessibilità e controllo sull'automazione dei flussi di lavoro. L'obiettivo è creare un ambiente più interconnesso e intelligente per gli utenti aziendali.

2026-05-13 Fonte

📁 Frameworks AI generated

PyTorch 2.12: Ottimizzazioni per Performance e Deployment Multi-Hardware

La nuova versione di PyTorch, la 2.12, introduce significative ottimizzazioni per l'inference e il training su diverse architetture hardware. Tra le novità spiccano miglioramenti prestazionali fino a 100 volte per l'eigendecomposition su CUDA, il supporto alla quantization Microscaling per modelli compressi e un'API unificata per la cattura dei grafici su CUDA, XPU e altri backend. Questi aggiornamenti sono cruciali per le aziende che puntano a deployment on-premise efficienti e a basso TCO, garantendo flessibilità e controllo sui carichi di lavoro AI.

2026-05-13 Fonte

📁 Frameworks AI generated

GCC 16 migliora le performance dei binari, sfida aperta con LLVM Clang

La recente versione 16.1 del GNU Compiler Collection (GCC) ha mostrato significativi miglioramenti nelle performance dei binari rispetto alla precedente versione 15. Questi progressi, verificati su hardware e configurazioni identiche, pongono GCC 16 in diretta competizione con LLVM Clang, il compilatore open source di riferimento. L'ottimizzazione dei compilatori è cruciale per massimizzare l'efficienza dei carichi di lavoro AI on-premise, influenzando direttamente il TCO e la sovranità dei dati.

2026-05-13 Fonte

📁 Frameworks AI generated

Adaption lancia AutoScientist: l'automazione del Fine-tuning per LLM

Adaption ha presentato AutoScientist, un nuovo strumento basato sull'intelligenza artificiale che mira a semplificare e velocizzare il processo di fine-tuning dei Large Language Models. La soluzione automatizza l'adattamento dei modelli a capacità specifiche, riducendo la complessità e i tempi tipici delle metodologie tradizionali. Questo approccio può essere particolarmente vantaggioso per le aziende che gestiscono LLM in ambienti self-hosted, dove l'ottimizzazione delle risorse e l'efficienza operativa sono cruciali.

2026-05-13 Fonte

📁 Frameworks AI generated

`llama.cpp` abilita la generazione continua per LLM su server e Web UI

Un recente aggiornamento per `llama.cpp` introduce il supporto per la generazione continua di testo sui Large Language Models (LLM) tramite le sue interfacce server e Web UI. Questa funzionalità migliora l'interazione con i modelli di ragionamento, offrendo maggiore fluidità e controllo agli utenti che gestiscono deployment on-premise, rafforzando l'efficienza e la sovranità dei dati.

2026-05-13 Fonte

📁 Frameworks AI generated

DesignVerse raccoglie 5,5 milioni di dollari per modernizzare il software aziendale legacy con l'AI

DesignVerse, startup con sede a Bucarest, ha ottenuto un finanziamento seed di oltre 5,5 milioni di dollari. L'azienda sviluppa una piattaforma basata sull'AI per modernizzare i complessi sistemi software legacy, mirando a settori mission-critical come l'aviazione e la finanza. La soluzione mira a ridurre l'attrito tra i team di design e ingegneria, garantendo affidabilità, conformità e sicurezza negli ambienti di produzione aziendali.

2026-05-13 Fonte

📁 Frameworks AI generated

vLLM su AMD per LLM on-premise: efficienza per l'uso singolo?

L'adozione di Large Language Models (LLM) in ambienti self-hosted pone interrogativi sulla scelta del framework di inference. Un utente con GPU AMD si interroga sull'effettiva convenienza di vLLM, noto per il suo throughput elevato in scenari multi-utente, rispetto a llama.cpp, più semplice e stabile. L'integrazione di vLLM in Lemonade da parte di AMD rende la questione attuale per chi valuta performance e complessità per l'inference LLM locale.

2026-05-12 Fonte