È stato rilasciato NanoLLama, un framework open source per l'addestramento di modelli Llama 3 partendo da zero, senza fine-tuning o LoRA. Il tool permette l'export in formato GGUF compatibile con llama.cpp tramite un singolo comando. Include configurazioni da 46M a 7B parametri, training multi-corpus e un motore di inference Go.
Uno sviluppatore ha presentato Kon, un agente di sviluppo progettato per essere leggero e facilmente comprensibile. Kon è pensato per essere eseguito localmente, con un footprint di token ridotto e un numero limitato di file, facilitandone la personalizzazione e l'estensione.
Un utente di LocalLLaMA mette in discussione l'eccessivo entusiasmo per OpenClaw, un framework per LLM. Pur riconoscendone l'utilità in loop, gestione della memoria, agenti e integrazioni, l'utente sottolinea come le skills sviluppate o integrate siano il vero valore aggiunto, più del runner stesso. L'alternativa "opencode web" viene considerata superiore.
Qwen Code è un agente di sviluppo CLI open source creato dal team Qwen di Alibaba. Permette di automatizzare attività di sviluppo interagendo direttamente con il codice. È disponibile una versione modificata che rimuove la telemetria, garantendo maggiore privacy. L'integrazione con LM Studio e Qwen3-Coder permette un utilizzo completamente locale e offline.
La nuova release 0.17 di Ollama, il progetto open-source che semplifica l'utilizzo di diversi LLM su Windows, macOS e Linux, introduce miglioramenti al processo di onboarding di OpenClaw. L'aggiornamento mira a rendere più agevole la configurazione iniziale per gli utenti.
Rilasciata la versione 23.0-0 di AMD AOMP, un compilatore downstream di LLVM/Clang. Include patch AMD per ottimizzare l'offload su GPU Radeon e Instinct tramite API OpenMP e OpenACC. AOMP anticipa le future integrazioni in LLVM.
Un sviluppatore ha creato una visualizzazione interattiva di tutti i casi dell'Alta Corte australiana dal 1901 al 2025, trasformando la giurisprudenza in un grafo di conoscenza interconnesso. Il progetto utilizza tecniche di embedding vettoriale e riduzione della dimensionalità per mappare semanticamente le sentenze, rivelando relazioni tra aree del diritto e l'evoluzione storica delle citazioni legali. Il codice per riprodurre l'analisi è disponibile su GitHub.
Hugging Face ha annunciato l'acquisizione di GGML e llama.cpp, due progetti open source cruciali per l'esecuzione efficiente di modelli di linguaggio di grandi dimensioni (LLM) su hardware consumer. L'obiettivo è garantire lo sviluppo a lungo termine dell'AI locale e democratizzare l'accesso a queste tecnicie.
Hugging Face ha acquisito GGML.AI, nota per il suo lavoro sull'inference efficiente di modelli linguistici di grandi dimensioni (LLM). L'acquisizione, discussa su Reddit e GitHub, potrebbe portare a una maggiore integrazione delle tecnicie di GGML nell'ecosistema Hugging Face, a beneficio degli sviluppatori che lavorano con LLM in ambienti con risorse limitate.
Un workshop per il 25° anniversario del Manifesto Agile ha evidenziato come l'intelligenza artificiale impatti lo sviluppo software. Il test-driven development emerge come pratica fondamentale, mentre la sicurezza rimane un aspetto critico spesso trascurato.
Il modello open-source multilingue PaddleOCR-VL è stato integrato in llama.cpp. Questa integrazione permette di eseguire l'inference del modello direttamente su hardware locale, aprendo nuove possibilità per applicazioni OCR con requisiti di privacy e sovranità dei dati. La versione è la 0.9b, quindi adatta anche a macchine con risorse limitate.
Un nuovo studio esplora l'uso di modelli linguistici di grandi dimensioni (LLM) e Retrieval-Augmented Generation (RAG) basata su grafi (GraphRAG) per automatizzare la creazione di Design Structure Matrices (DSM) in sistemi cyber-fisici. La ricerca valuta le prestazioni su due casi d'uso: un cacciavite elettrico e un CubeSat.
È disponibile Vulkan 1.4.344, l'ultimo aggiornamento di specifica per questa API grafica e di calcolo ad alte prestazioni. Oltre a una serie di correzioni e chiarimenti, Vulkan 1.4.344 introduce una nuova estensione fornita dagli ingegneri di Valve.
Agent Builder migliora con l'uso, memorizzando feedback e preferenze. L'articolo esplora come sfruttare la memoria degli agenti, suddividendola in breve e lungo termine, e come guidarli a ricordare informazioni utili. Vengono illustrate le 'skills' per contesti specializzati e la modifica diretta della memoria per un controllo più preciso.
Reload ha annunciato un finanziamento di 2,275 milioni di dollari guidato da Anthemis e il lancio del suo primo agente AI, chiamato Epic. L'obiettivo è fornire agli agenti AI una memoria condivisa per migliorare la collaborazione e l'efficienza.
Una pull request a llama.cpp introduce il supporto per gli schemi di quantization IQ*_K e IQ*_KS, derivati dal progetto ik_llama.cpp. Questa implementazione potrebbe portare a modelli più compatti ed efficienti, particolarmente rilevante per l'inference su hardware con risorse limitate.
AMD ha annunciato hipThreads, una libreria di concorrenza in stile C++ per GPU AMD, progettata per semplificare la portabilità del codice C++. Questa nuova aggiunta all'ecosistema ROCm/HIP mira a rendere più agevole lo sviluppo di applicazioni ad alte prestazioni sulle GPU AMD.
TextWeb è un progetto open source che trasforma pagine web in griglie di testo di dimensioni ridotte (2-5KB), ideali per l'elaborazione da parte di agenti AI. Invece di screenshot da 1MB, TextWeb utilizza MCP, LangChain e CrewAI per una rappresentazione più efficiente delle informazioni.
Mirai, startup fondata dai creatori di Reface e Prisma, ha raccolto 10 milioni di dollari per migliorare l'esecuzione di modelli di intelligenza artificiale direttamente su smartphone e laptop. L'obiettivo è ottimizzare l'inference sui dispositivi, riducendo la dipendenza dal cloud.
Gli strumenti di AI per la programmazione stanno generando un'ondata di codice di bassa qualità che minaccia di sopraffare molti progetti open source. Sebbene la creazione di nuove funzionalità sia diventata più semplice, la loro manutenzione rimane una sfida complessa.