📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

In Iran, un prolungato blackout di internet, iniziato oltre 400 ore fa a causa di proteste, ha portato a severe restrizioni sull'accesso online. Solo pochi siti, tra cui Google e ChatGPT, sono stati inseriti in whitelist. In questo scenario, i modelli linguistici locali (LLM) non censurati, come Gemma3 e Qwen3, offrono una valida alternativa per accedere alle informazioni.

2026-01-25 Fonte

Un utente di Reddit cerca consigli per strutturare una guida per sviluppatori, dai principianti ai veterani, interessati all'ingegneria assistita dall'intelligenza artificiale. L'obiettivo è creare un ambiente di apprendimento collaborativo e identificare strumenti utili per hackathon e progetti a lungo termine. Il repository GitHub di riferimento è dedicato all'ingegneria del software basata sull'IA.

2026-01-25 Fonte

Una nuova ottimizzazione per GLM 4.7 Flash riduce l'utilizzo di VRAM della cache KV. La modifica, che consiste nella rimozione di 'Air', permette di gestire contesti molto più lunghi con la stessa configurazione hardware, risparmiando gigabyte di memoria video.

2026-01-25 Fonte

Un ricercatore ha rilasciato in open source il progetto Self-Organizing State Model (SOSM), un'architettura di modello linguistico che esplora alternative all'attenzione dei Transformer standard. SOSM utilizza routing basato su grafi, separa la rappresentazione semantica dall'apprendimento temporale e introduce un meccanismo gerarchico di attribuzione per una migliore interpretabilità.

2026-01-25 Fonte

ChatGPT è stato scoperto mentre cita Grokipedia nelle sue risposte, innescando un potenziale loop ricorsivo. Questo comportamento rischia di diffondere informazioni errate o allucinate, sollevando preoccupazioni sulla qualità e l'affidabilità delle risposte fornite dal modello linguistico.

2026-01-25 Fonte

Gli sviluppatori di Zerotap, un'app Android che permette all'AI di interagire con il telefono come farebbe un umano, chiedono feedback agli utenti. L'app supporta Ollama e modelli come OpenAI e Gemini. Tra le funzionalità in cantiere: connessione a servizi esterni, ricerca avanzata, gestione delle immagini e modelli on-device. Gli sviluppatori si interrogano sull'uso di Ollama: tramite rete locale o connessione internet?

2026-01-25 Fonte

Il modello visuale Moondream3, presentato l'anno scorso, sembra essere sparito dai radar. Nonostante una versione MLX sia disponibile, mancano implementazioni Llama.cpp e aggiornamenti pubblici. La comunità si interroga sul futuro di questo promettente progetto.

2026-01-25 Fonte

Un utente sta lavorando a una pipeline di dati sintetici per modelli image-to-image ad alta precisione. L'obiettivo è trasferire le capacità di ragionamento visivo di Gemini 3 Flash nel modello open source Qwen 3 VL 32B, per ottenere un motore locale di captioning sintetico ad alta scalabilità. L'articolo solleva interrogativi sulla possibilità di raggiungere questo obiettivo tramite il fine-tuning e sulle limitazioni dei modelli open source.

2026-01-25 Fonte

È stato presentato Stable-DiffCoder, un nuovo modello linguistico di grandi dimensioni (LLM) specializzato nella generazione di codice. Costruito a partire dal modello Seed-Coder, Stable-DiffCoder utilizza tecniche di diffusione per migliorare la qualità e la coerenza del codice prodotto. Il progetto è open source e disponibile per la comunità degli sviluppatori.

2026-01-25 Fonte

Il team di Qwen ha rilasciato Qwen3-TTS, un sistema di sintesi vocale open source che offre bassa latenza (97ms), clonazione vocale e compatibilità con le API di OpenAI. Supporta oltre 10 lingue e include voci di alta qualità. Può essere integrato facilmente in applicazioni esistenti grazie al server FastAPI compatibile con OpenAI.

2026-01-24 Fonte

Un utente di LocalLLaMA si interroga sull'evoluzione dei modelli di linguaggio di grandi dimensioni (LLM) eseguibili in locale. Nello specifico, chiede se, a distanza di nove mesi dal rilascio di Gemma 3 27b, siano disponibili alternative migliori, capaci di girare su una singola GPU 3090ti con 24GB di VRAM. L'utente cerca un modello generalista, adatto al dialogo e alla risposta a domande, con capacità di visione delle immagini.

2026-01-24 Fonte

L'edizione del World Economic Forum di questa settimana ha visto i leader del settore tecnicico discutere animatamente di intelligenza artificiale. L'evento si è trasformato, per alcuni momenti, in una vera e propria conferenza tech di alto livello, con i CEO che si sono confrontati su visioni e strategie future.

2026-01-24 Fonte

Disponibili versioni non censurate del modello GLM 4.7 Flash di Z.ai, un modello MoE da 30B con circa 3B di parametri attivi e un contesto di 200K token. Le varianti "Balanced", adatta per il coding agentico, e "Aggressive", per argomenti senza censure, sono offerte con quantizzazioni FP16, Q8_0, Q6_K e Q4_K_M. Compatibilità testata con llama.cpp, LM Studio, Jan e koboldcpp.

2026-01-24 Fonte

Un gruppo di ex dipendenti di Google ha sviluppato Sparkli, un'applicazione basata sull'intelligenza artificiale pensata per colmare le lacune dei sistemi educativi tradizionali. L'obiettivo è fornire ai bambini competenze in settori chiave come design, finanza ed imprenditoria attraverso un'esperienza di apprendimento interattiva.

2026-01-24 Fonte

La Corea del Sud si afferma come una delle nazioni leader nel campo dell'intelligenza artificiale, grazie anche alla Korean National Sovereign AI Initiative. Questo programma governativo incentiva lo sviluppo di modelli di intelligenza artificiale nazionali, finanziando i progetti più promettenti e garantendo l'accesso a risorse di calcolo avanzate.

2026-01-24 Fonte

MiniMax ha presentato M2-her, un modello linguistico di grandi dimensioni (LLM) progettato per role-play immersivo e conversazioni complesse. M2-her punta su coerenza di tono e personalità, supporta diversi ruoli nei messaggi e apprende da esempi di dialogo per adattarsi allo stile e al ritmo degli scenari. Ideale per storytelling, companion virtuali e interazioni in cui fluidità e vivacità sono essenziali.

2026-01-24 Fonte

Un sviluppatore ha creato un convertitore open source per trasformare PDF, EPUB e altri formati in audiolibri di alta qualità. Il tool utilizza Qwen3 TTS, un modello vocale open source, e supporta il voice cloning. L'obiettivo è offrire un'alternativa gratuita ai servizi a pagamento, sfruttando le capacità di sintesi vocale avanzate di Qwen3.

2026-01-24 Fonte

Un nuovo lettore multimediale basato su intelligenza artificiale promette di rivoluzionare la fruizione di contenuti video e audio direttamente nel browser. Senza necessità di installazione, offre sottotitoli automatici in oltre 100 lingue, traduzione, riassunti, dizionario integrato e la possibilità di interagire tramite chat con i video. Un'innovazione che punta a rendere l'esperienza multimediale più accessibile e interattiva.

2026-01-24 Fonte

Un utente condivide la propria esperienza pratica con il modello GLM 4.7 Flash Q6, focalizzandosi sulla sua capacità di gestire il codice Roo in progetti web personali. Il modello si è dimostrato più affidabile e preciso rispetto ad alternative come GPT-OSS 120b e GLM 4.5 Air, soprattutto nell'uso con tool agentici.

2026-01-24 Fonte

Bernard Lambeau, sviluppatore e fondatore di diverse aziende tech con sede in Belgio, ha creato il linguaggio di programmazione Elo. Per farlo, si è avvalso del supporto di Claude Code, l'assistente di programmazione di Anthropic, lavorando in una modalità di "pair programming" uomo-IA.

2026-01-24 Fonte