LLM – Notizie e Articoli AI

📁 LLM AI generated

Iran: blackout internet e modelli linguistici locali come alternativa

In Iran, un prolungato blackout di internet, iniziato oltre 400 ore fa a causa di proteste, ha portato a severe restrizioni sull'accesso online. Solo pochi siti, tra cui Google e ChatGPT, sono stati inseriti in whitelist. In questo scenario, i modelli linguistici locali (LLM) non censurati, come Gemma3 e Qwen3, offrono una valida alternativa per accedere alle informazioni.

2026-01-25 Fonte

📁 LLM AI generated

Idee di coding open source per l'ingegneria assistita da IA

Un utente di Reddit cerca consigli per strutturare una guida per sviluppatori, dai principianti ai veterani, interessati all'ingegneria assistita dall'intelligenza artificiale. L'obiettivo è creare un ambiente di apprendimento collaborativo e identificare strumenti utili per hackathon e progetti a lungo termine. Il repository GitHub di riferimento è dedicato all'ingegneria del software basata sull'IA.

2026-01-25 Fonte

📁 LLM AI generated

GLM 4.7 Flash: ottimizzazione della cache KV per contesti più lunghi

Una nuova ottimizzazione per GLM 4.7 Flash riduce l'utilizzo di VRAM della cache KV. La modifica, che consiste nella rimozione di 'Air', permette di gestire contesti molto più lunghi con la stessa configurazione hardware, risparmiando gigabyte di memoria video.

2026-01-25 Fonte

📁 LLM AI generated

SOSM: un'alternativa open source ai Transformer basata su grafi

Un ricercatore ha rilasciato in open source il progetto Self-Organizing State Model (SOSM), un'architettura di modello linguistico che esplora alternative all'attenzione dei Transformer standard. SOSM utilizza routing basato su grafi, separa la rappresentazione semantica dall'apprendimento temporale e introduce un meccanismo gerarchico di attribuzione per una migliore interpretabilità.

2026-01-25 Fonte

📁 LLM AI generated

ChatGPT pesca dati da contenuti generati da IA: un loop ricorsivo?

ChatGPT è stato scoperto mentre cita Grokipedia nelle sue risposte, innescando un potenziale loop ricorsivo. Questo comportamento rischia di diffondere informazioni errate o allucinate, sollevando preoccupazioni sulla qualità e l'affidabilità delle risposte fornite dal modello linguistico.

2026-01-25 Fonte

📁 LLM AI generated

Zerotap: l'app Android che vuole controllare il tuo telefono con l'AI

Gli sviluppatori di Zerotap, un'app Android che permette all'AI di interagire con il telefono come farebbe un umano, chiedono feedback agli utenti. L'app supporta Ollama e modelli come OpenAI e Gemini. Tra le funzionalità in cantiere: connessione a servizi esterni, ricerca avanzata, gestione delle immagini e modelli on-device. Gli sviluppatori si interrogano sull'uso di Ollama: tramite rete locale o connessione internet?

2026-01-25 Fonte

📁 LLM AI generated

Moondream3: che fine ha fatto il promettente modello visuale?

Il modello visuale Moondream3, presentato l'anno scorso, sembra essere sparito dai radar. Nonostante una versione MLX sia disponibile, mancano implementazioni Llama.cpp e aggiornamenti pubblici. La comunità si interroga sul futuro di questo promettente progetto.

2026-01-25 Fonte

📁 LLM AI generated

Qwen 3 VL: distillare il ragionamento visivo di Gemini 3 Flash

Un utente sta lavorando a una pipeline di dati sintetici per modelli image-to-image ad alta precisione. L'obiettivo è trasferire le capacità di ragionamento visivo di Gemini 3 Flash nel modello open source Qwen 3 VL 32B, per ottenere un motore locale di captioning sintetico ad alta scalabilità. L'articolo solleva interrogativi sulla possibilità di raggiungere questo obiettivo tramite il fine-tuning e sulle limitazioni dei modelli open source.

2026-01-25 Fonte

📁 LLM AI generated

Stable-DiffCoder: nuovo LLM per codice basato su Seed-Coder

È stato presentato Stable-DiffCoder, un nuovo modello linguistico di grandi dimensioni (LLM) specializzato nella generazione di codice. Costruito a partire dal modello Seed-Coder, Stable-DiffCoder utilizza tecniche di diffusione per migliorare la qualità e la coerenza del codice prodotto. Il progetto è open source e disponibile per la comunità degli sviluppatori.

2026-01-25 Fonte

📁 LLM AI generated

Qwen3-TTS: sintesi vocale a bassa latenza e clonazione vocale open source

Il team di Qwen ha rilasciato Qwen3-TTS, un sistema di sintesi vocale open source che offre bassa latenza (97ms), clonazione vocale e compatibilità con le API di OpenAI. Supporta oltre 10 lingue e include voci di alta qualità. Può essere integrato facilmente in applicazioni esistenti grazie al server FastAPI compatibile con OpenAI.

2026-01-24 Fonte

📁 LLM AI generated

LLM: quale modello locale su GPU 24GB nel 2026?

Un utente di LocalLLaMA si interroga sull'evoluzione dei modelli di linguaggio di grandi dimensioni (LLM) eseguibili in locale. Nello specifico, chiede se, a distanza di nove mesi dal rilascio di Gemma 3 27b, siano disponibili alternative migliori, capaci di girare su una singola GPU 3090ti con 24GB di VRAM. L'utente cerca un modello generalista, adatto al dialogo e alla risposta a domande, con capacità di visione delle immagini.

2026-01-24 Fonte

📁 LLM AI generated

Davos: i CEO del tech tra vanto e dispute sull'intelligenza artificiale

L'edizione del World Economic Forum di questa settimana ha visto i leader del settore tecnicico discutere animatamente di intelligenza artificiale. L'evento si è trasformato, per alcuni momenti, in una vera e propria conferenza tech di alto livello, con i CEO che si sono confrontati su visioni e strategie future.

2026-01-24 Fonte

📁 LLM AI generated

GLM 4.7 Flash: versioni non censurate "Balanced" e "Aggressive"

Disponibili versioni non censurate del modello GLM 4.7 Flash di Z.ai, un modello MoE da 30B con circa 3B di parametri attivi e un contesto di 200K token. Le varianti "Balanced", adatta per il coding agentico, e "Aggressive", per argomenti senza censure, sono offerte con quantizzazioni FP16, Q8_0, Q6_K e Q4_K_M. Compatibilità testata con llama.cpp, LM Studio, Jan e koboldcpp.

2026-01-24 Fonte

📁 LLM AI generated

Ex-Googler lanciano app con IA per l'istruzione dei più giovani

Un gruppo di ex dipendenti di Google ha sviluppato Sparkli, un'applicazione basata sull'intelligenza artificiale pensata per colmare le lacune dei sistemi educativi tradizionali. L'obiettivo è fornire ai bambini competenze in settori chiave come design, finanza ed imprenditoria attraverso un'esperienza di apprendimento interattiva.

2026-01-24 Fonte

📁 LLM AI generated

Corea del Sud: potenza emergente nell'intelligenza artificiale

La Corea del Sud si afferma come una delle nazioni leader nel campo dell'intelligenza artificiale, grazie anche alla Korean National Sovereign AI Initiative. Questo programma governativo incentiva lo sviluppo di modelli di intelligenza artificiale nazionali, finanziando i progetti più promettenti e garantendo l'accesso a risorse di calcolo avanzate.

2026-01-24 Fonte

📁 LLM AI generated

MiniMax lancia M2-her per role-play immersivo e conversazioni avanzate

MiniMax ha presentato M2-her, un modello linguistico di grandi dimensioni (LLM) progettato per role-play immersivo e conversazioni complesse. M2-her punta su coerenza di tono e personalità, supporta diversi ruoli nei messaggi e apprende da esempi di dialogo per adattarsi allo stile e al ritmo degli scenari. Ideale per storytelling, companion virtuali e interazioni in cui fluidità e vivacità sono essenziali.

2026-01-24 Fonte

📁 LLM AI generated

Audiobook fai-da-te: tool open source con Qwen3 e voice cloning

Un sviluppatore ha creato un convertitore open source per trasformare PDF, EPUB e altri formati in audiolibri di alta qualità. Il tool utilizza Qwen3 TTS, un modello vocale open source, e supporta il voice cloning. L'obiettivo è offrire un'alternativa gratuita ai servizi a pagamento, sfruttando le capacità di sintesi vocale avanzate di Qwen3.

2026-01-24 Fonte

📁 LLM AI generated

Lettore multimediale AI: sottotitoli automatici e chat video nel browser

Un nuovo lettore multimediale basato su intelligenza artificiale promette di rivoluzionare la fruizione di contenuti video e audio direttamente nel browser. Senza necessità di installazione, offre sottotitoli automatici in oltre 100 lingue, traduzione, riassunti, dizionario integrato e la possibilità di interagire tramite chat con i video. Un'innovazione che punta a rendere l'esperienza multimediale più accessibile e interattiva.

2026-01-24 Fonte

📁 LLM AI generated

Test sul campo di GLM 4.7 Flash Q6 con RTX 5090

Un utente condivide la propria esperienza pratica con il modello GLM 4.7 Flash Q6, focalizzandosi sulla sua capacità di gestire il codice Roo in progetti web personali. Il modello si è dimostrato più affidabile e preciso rispetto ad alternative come GPT-OSS 120b e GLM 4.5 Air, soprattutto nell'uso con tool agentici.

2026-01-24 Fonte

📁 LLM AI generated

Elo: un linguaggio sviluppato con l'aiuto dell'IA Claude

Bernard Lambeau, sviluppatore e fondatore di diverse aziende tech con sede in Belgio, ha creato il linguaggio di programmazione Elo. Per farlo, si è avvalso del supporto di Claude Code, l'assistente di programmazione di Anthropic, lavorando in una modalità di "pair programming" uomo-IA.

2026-01-24 Fonte