📁 Frameworks

La sezione Frameworks osserva il livello software che trasforma i modelli in sistemi operativi: orchestrazione, pipeline RAG, osservabilita, serving ed evaluation. Trovi aggiornamenti su LangChain, tooling vettoriale, runtime di inferenza e pattern di deployment realmente utili per iterare velocemente senza perdere stabilita. Gli articoli sono selezionati per aiutare scelte architetturali concrete, con collegamenti alla pillar frameworks, alla pillar LLM e ai trend.

📁 Frameworks AI generated

Helion accelera l'autotuning con l'ottimizzazione bayesiana

Helion, il DSL di alto livello per kernel di machine learning ad alte prestazioni, introduce un nuovo algoritmo di ricerca (LFBO Pattern Search) che sfrutta l'ottimizzazione bayesiana per ridurre drasticamente i tempi di autotuning. L'algoritmo, basato su modelli di machine learning, filtra le configurazioni meno promettenti, migliorando al contempo la latenza dei kernel su GPU NVIDIA B200 e AMD MI350.

2026-02-24 Fonte

📁 Frameworks AI generated

New Relic potenzia l'osservabilità con agenti AI e OpenTelemetry

New Relic introduce strumenti avanzati per l'osservabilità, consentendo alle aziende di creare e gestire agenti AI e di integrare meglio i flussi di dati OpenTelemetry. L'obiettivo è fornire una visione più completa e approfondita delle performance applicative e dell'infrastruttura IT.

2026-02-24 Fonte

📁 Frameworks AI generated

AMD HIP adotta il driver di offload LLVM per impostazione predefinita

La tecnicia HIP di AMD passa all'utilizzo del nuovo driver di offload di LLVM come configurazione predefinita. Questa modifica, integrata nel Git di LLVM, allinea HIP con CUDA di NVIDIA e OpenMP, semplificando lo sviluppo di applicazioni eterogenee.

2026-02-24 Fonte

📁 Frameworks AI generated

Straion: 1,1M€ per governare lo sviluppo AI su vasta scala

Straion ha raccolto 1,1 milioni di euro per sviluppare una piattaforma che governa lo sviluppo di codice tramite AI. L'obiettivo è centralizzare gli standard ingegneristici, validare i piani prima dell'implementazione e ridurre gli errori nel codice generato automaticamente, integrandosi con strumenti come GitHub Copilot e Cursor.

2026-02-24 Fonte

📁 Frameworks AI generated

ConfSpec: Ragionamento Speculativo Efficiente per LLM

ConfSpec è un framework che accelera l'inference dei modelli linguistici di grandi dimensioni (LLM) tramite verifica speculativa a livello di singolo passo. Sfrutta modelli di verifica più piccoli e calibrati per ridurre la latenza, mantenendo l'accuratezza del modello di riferimento. Ottimizza l'uso delle risorse senza giudici esterni.

2026-02-24 Fonte

📁 Frameworks AI generated

PBPK: Deep Learning per modelli farmacocinetici multi-scala

Un nuovo framework di Scientific Machine Learning (SciML) promette di migliorare la modellazione farmacocinetica PBPK, cruciale nello sviluppo di farmaci. L'approccio combina rigore meccanicistico e flessibilità data-driven, riducendo i costi computazionali e migliorando l'accuratezza delle simulazioni.

2026-02-24 Fonte

📁 Frameworks AI generated

Previsioni di serie temporali: decomposizione stagionale ottimizzata

Un nuovo approccio alla previsione di serie temporali sfrutta la decomposizione in componenti di trend e stagionalità. Il metodo applica modelli di apprendimento automatico specifici a ciascuna componente, riducendo gli errori rispetto alle soluzioni esistenti. I risultati mostrano miglioramenti significativi su dataset di riferimento e idrologici, con efficienza computazionale.

2026-02-24 Fonte

📁 Frameworks AI generated

Allineamento AI: ricompense gerarchiche guidate dal linguaggio

Un nuovo approccio, Hierarchical Reward Design from Language (HRDL), mira a migliorare l'allineamento tra il comportamento degli agenti AI e le specifiche umane, specialmente in task complessi. L'innovazione, supportata da Language to Hierarchical Rewards (L2HR), traduce le aspettative umane in funzioni di ricompensa per il reinforcement learning, garantendo che le consegne dell'AI rispettino le preferenze umane.

2026-02-24 Fonte

📁 Frameworks AI generated

Intel OpenVINO 2026: supporto LLM potenziato e NPU migliorate

Intel rilascia OpenVINO 2026, la nuova versione del suo toolkit open-source per l'intelligenza artificiale. L'aggiornamento include un supporto ampliato per i modelli linguistici di grandi dimensioni (LLM), miglioramenti per le NPU Intel nei sistemi Core Ultra e diverse altre ottimizzazioni per CPU, NPU e GPU Intel.

2026-02-23 Fonte

📁 Frameworks AI generated

SWE-bench Verified: la valutazione è sospesa per problemi di integrità

L'affidabilità di SWE-bench Verified, un benchmark per valutare i progressi nella generazione automatica di codice, è stata messa in discussione. Analisi recenti hanno evidenziato test imperfetti e potenziali training leakage, portando alla decisione di interromperne l'utilizzo. Si raccomanda l'uso di SWE-bench Pro.

2026-02-23 Fonte

📁 Frameworks AI generated

Ladybird: il browser indie riscritto in Rust con AI

Il progetto indipendente del browser Ladybird abbandona Swift e sfrutta l'intelligenza artificiale per la traduzione da C++ a Rust. Questa transizione mira a migliorare le prestazioni e la sicurezza del browser.

2026-02-23 Fonte

📁 Frameworks AI generated

Framework open-source per LLM locali: performance Gemini 3/GPT-5.2

Un nuovo framework open-source mira a colmare il divario prestazionale tra i modelli linguistici di grandi dimensioni (LLM) proprietari e le alternative eseguite localmente. L'obiettivo è raggiungere livelli di performance paragonabili a Gemini 3 Deep Think e GPT-5.2 Pro utilizzando infrastrutture self-hosted.

2026-02-23 Fonte

📁 Frameworks AI generated

QueryPlot: NLP per l'esplorazione mineraria geologica

QueryPlot utilizza NLP per integrare dati geologici testuali e geospaziali, automatizzando l'identificazione di aree potenzialmente ricche di minerali. Il sistema trasforma mappe geologiche in rappresentazioni testuali strutturate, consentendo interrogazioni in linguaggio naturale e visualizzando le aree più promettenti.

2026-02-23 Fonte

📁 Frameworks AI generated

Ottimizzazione Bayesiana per processi manifatturieri multi-stadio

Un nuovo framework di ottimizzazione Bayesiana, POGPN-JPSS, sfrutta la conoscenza di esperti e modelli probabilistici strutturati per accelerare l'ottimizzazione di processi manifatturieri complessi. Il sistema combina reti gaussiane e modellazione congiunta di parametri e spazio degli stati, riducendo significativamente i tempi e le risorse necessarie per raggiungere le performance desiderate.

2026-02-23 Fonte

📁 Frameworks AI generated

NanoLLama: addestramento Llama 3 da zero e export in GGUF

È stato rilasciato NanoLLama, un framework open source per l'addestramento di modelli Llama 3 partendo da zero, senza fine-tuning o LoRA. Il tool permette l'export in formato GGUF compatibile con llama.cpp tramite un singolo comando. Include configurazioni da 46M a 7B parametri, training multi-corpus e un motore di inference Go.

2026-02-22 Fonte

📁 Frameworks AI generated

Kon: un agente di sviluppo compatto per LLM locali

Uno sviluppatore ha presentato Kon, un agente di sviluppo progettato per essere leggero e facilmente comprensibile. Kon è pensato per essere eseguito localmente, con un footprint di token ridotto e un numero limitato di file, facilitandone la personalizzazione e l'estensione.

2026-02-22 Fonte

📁 Frameworks AI generated

OpenClaw: le skills contano più del runner?

Un utente di LocalLLaMA mette in discussione l'eccessivo entusiasmo per OpenClaw, un framework per LLM. Pur riconoscendone l'utilità in loop, gestione della memoria, agenti e integrazioni, l'utente sottolinea come le skills sviluppate o integrate siano il vero valore aggiunto, più del runner stesso. L'alternativa "opencode web" viene considerata superiore.

2026-02-22 Fonte

📁 Frameworks AI generated

Qwen Code: agente di sviluppo open source con fork senza telemetria

Qwen Code è un agente di sviluppo CLI open source creato dal team Qwen di Alibaba. Permette di automatizzare attività di sviluppo interagendo direttamente con il codice. È disponibile una versione modificata che rimuove la telemetria, garantendo maggiore privacy. L'integrazione con LM Studio e Qwen3-Coder permette un utilizzo completamente locale e offline.

2026-02-21 Fonte

📁 Frameworks AI generated

Ollama 0.17: onboarding OpenClaw migliorato

La nuova release 0.17 di Ollama, il progetto open-source che semplifica l'utilizzo di diversi LLM su Windows, macOS e Linux, introduce miglioramenti al processo di onboarding di OpenClaw. L'aggiornamento mira a rendere più agevole la configurazione iniziale per gli utenti.

2026-02-21 Fonte

📁 Frameworks AI generated

AMD AOMP 23.0-0: Compilatore potenziato per GPU Radeon/Instinct

Rilasciata la versione 23.0-0 di AMD AOMP, un compilatore downstream di LLVM/Clang. Include patch AMD per ottimizzare l'offload su GPU Radeon e Instinct tramite API OpenMP e OpenACC. AOMP anticipa le future integrazioni in LLVM.

2026-02-21 Fonte

← Prec 1 2 3 … 31 32 33 34 35 … 45 46 47 Succ →