📁 Frameworks

La sezione Frameworks osserva il livello software che trasforma i modelli in sistemi operativi: orchestrazione, pipeline RAG, osservabilita, serving ed evaluation. Trovi aggiornamenti su LangChain, tooling vettoriale, runtime di inferenza e pattern di deployment realmente utili per iterare velocemente senza perdere stabilita. Gli articoli sono selezionati per aiutare scelte architetturali concrete, con collegamenti alla pillar frameworks, alla pillar LLM e ai trend.

È stato rilasciato NanoLLama, un framework open source per l'addestramento di modelli Llama 3 partendo da zero, senza fine-tuning o LoRA. Il tool permette l'export in formato GGUF compatibile con llama.cpp tramite un singolo comando. Include configurazioni da 46M a 7B parametri, training multi-corpus e un motore di inference Go.

2026-02-22 Fonte

Uno sviluppatore ha presentato Kon, un agente di sviluppo progettato per essere leggero e facilmente comprensibile. Kon è pensato per essere eseguito localmente, con un footprint di token ridotto e un numero limitato di file, facilitandone la personalizzazione e l'estensione.

2026-02-22 Fonte
📁 Frameworks AI generated

OpenClaw: le skills contano più del runner?

Un utente di LocalLLaMA mette in discussione l'eccessivo entusiasmo per OpenClaw, un framework per LLM. Pur riconoscendone l'utilità in loop, gestione della memoria, agenti e integrazioni, l'utente sottolinea come le skills sviluppate o integrate siano il vero valore aggiunto, più del runner stesso. L'alternativa "opencode web" viene considerata superiore.

2026-02-22 Fonte

Qwen Code è un agente di sviluppo CLI open source creato dal team Qwen di Alibaba. Permette di automatizzare attività di sviluppo interagendo direttamente con il codice. È disponibile una versione modificata che rimuove la telemetria, garantendo maggiore privacy. L'integrazione con LM Studio e Qwen3-Coder permette un utilizzo completamente locale e offline.

2026-02-21 Fonte
📁 Frameworks AI generated

Ollama 0.17: onboarding OpenClaw migliorato

La nuova release 0.17 di Ollama, il progetto open-source che semplifica l'utilizzo di diversi LLM su Windows, macOS e Linux, introduce miglioramenti al processo di onboarding di OpenClaw. L'aggiornamento mira a rendere più agevole la configurazione iniziale per gli utenti.

2026-02-21 Fonte

Rilasciata la versione 23.0-0 di AMD AOMP, un compilatore downstream di LLVM/Clang. Include patch AMD per ottimizzare l'offload su GPU Radeon e Instinct tramite API OpenMP e OpenACC. AOMP anticipa le future integrazioni in LLVM.

2026-02-21 Fonte

Un sviluppatore ha creato una visualizzazione interattiva di tutti i casi dell'Alta Corte australiana dal 1901 al 2025, trasformando la giurisprudenza in un grafo di conoscenza interconnesso. Il progetto utilizza tecniche di embedding vettoriale e riduzione della dimensionalità per mappare semanticamente le sentenze, rivelando relazioni tra aree del diritto e l'evoluzione storica delle citazioni legali. Il codice per riprodurre l'analisi è disponibile su GitHub.

2026-02-21 Fonte

Hugging Face ha annunciato l'acquisizione di GGML e llama.cpp, due progetti open source cruciali per l'esecuzione efficiente di modelli di linguaggio di grandi dimensioni (LLM) su hardware consumer. L'obiettivo è garantire lo sviluppo a lungo termine dell'AI locale e democratizzare l'accesso a queste tecnicie.

2026-02-20 Fonte

Hugging Face ha acquisito GGML.AI, nota per il suo lavoro sull'inference efficiente di modelli linguistici di grandi dimensioni (LLM). L'acquisizione, discussa su Reddit e GitHub, potrebbe portare a una maggiore integrazione delle tecnicie di GGML nell'ecosistema Hugging Face, a beneficio degli sviluppatori che lavorano con LLM in ambienti con risorse limitate.

2026-02-20 Fonte

Un workshop per il 25° anniversario del Manifesto Agile ha evidenziato come l'intelligenza artificiale impatti lo sviluppo software. Il test-driven development emerge come pratica fondamentale, mentre la sicurezza rimane un aspetto critico spesso trascurato.

2026-02-20 Fonte

Il modello open-source multilingue PaddleOCR-VL è stato integrato in llama.cpp. Questa integrazione permette di eseguire l'inference del modello direttamente su hardware locale, aprendo nuove possibilità per applicazioni OCR con requisiti di privacy e sovranità dei dati. La versione è la 0.9b, quindi adatta anche a macchine con risorse limitate.

2026-02-20 Fonte

Un nuovo studio esplora l'uso di modelli linguistici di grandi dimensioni (LLM) e Retrieval-Augmented Generation (RAG) basata su grafi (GraphRAG) per automatizzare la creazione di Design Structure Matrices (DSM) in sistemi cyber-fisici. La ricerca valuta le prestazioni su due casi d'uso: un cacciavite elettrico e un CubeSat.

2026-02-20 Fonte

È disponibile Vulkan 1.4.344, l'ultimo aggiornamento di specifica per questa API grafica e di calcolo ad alte prestazioni. Oltre a una serie di correzioni e chiarimenti, Vulkan 1.4.344 introduce una nuova estensione fornita dagli ingegneri di Valve.

2026-02-20 Fonte

Agent Builder migliora con l'uso, memorizzando feedback e preferenze. L'articolo esplora come sfruttare la memoria degli agenti, suddividendola in breve e lungo termine, e come guidarli a ricordare informazioni utili. Vengono illustrate le 'skills' per contesti specializzati e la modifica diretta della memoria per un controllo più preciso.

2026-02-19 Fonte

Una pull request a llama.cpp introduce il supporto per gli schemi di quantization IQ*_K e IQ*_KS, derivati dal progetto ik_llama.cpp. Questa implementazione potrebbe portare a modelli più compatti ed efficienti, particolarmente rilevante per l'inference su hardware con risorse limitate.

2026-02-19 Fonte

AMD ha annunciato hipThreads, una libreria di concorrenza in stile C++ per GPU AMD, progettata per semplificare la portabilità del codice C++. Questa nuova aggiunta all'ecosistema ROCm/HIP mira a rendere più agevole lo sviluppo di applicazioni ad alte prestazioni sulle GPU AMD.

2026-02-19 Fonte

TextWeb è un progetto open source che trasforma pagine web in griglie di testo di dimensioni ridotte (2-5KB), ideali per l'elaborazione da parte di agenti AI. Invece di screenshot da 1MB, TextWeb utilizza MCP, LangChain e CrewAI per una rappresentazione più efficiente delle informazioni.

2026-02-19 Fonte

Mirai, startup fondata dai creatori di Reface e Prisma, ha raccolto 10 milioni di dollari per migliorare l'esecuzione di modelli di intelligenza artificiale direttamente su smartphone e laptop. L'obiettivo è ottimizzare l'inference sui dispositivi, riducendo la dipendenza dal cloud.

2026-02-19 Fonte

Gli strumenti di AI per la programmazione stanno generando un'ondata di codice di bassa qualità che minaccia di sopraffare molti progetti open source. Sebbene la creazione di nuove funzionalità sia diventata più semplice, la loro manutenzione rimane una sfida complessa.

2026-02-19 Fonte