LLM – Notizie e Articoli AI

📁 LLM AI generated

GLM-4.7 flash: come eseguirlo con llama.cpp?

Un utente chiede se è possibile eseguire il nuovo modello GLM 4.7 flash con llama.cpp o strumenti simili. La domanda è stata posta su un forum dedicato ai modelli linguistici locali (LocalLLaMA), in attesa di risposte dalla comunità di sviluppatori e appassionati.

2026-01-19 Fonte

📁 LLM AI generated

Z-AI (GLM): Sviluppatori scelgono la via 'aggressiva'

Gli sviluppatori di Z-AI (GLM) hanno intrapreso una strategia di sviluppo definita 'aggressiva'. Un post su Reddit evidenzia questa scelta, suggerendo una competizione diretta con altri team, in particolare quelli di Qwen. La discussione online si concentra sulle implicazioni di questo approccio e sul suo potenziale impatto sull'ecosistema dei modelli linguistici.

2026-01-19 Fonte

📁 LLM AI generated

GLM-4.7-Flash: un modello da 30B impressionante nel BrowseComp

Un post su Reddit evidenzia le prestazioni del modello GLM-4.7-Flash da 30 miliardi di parametri nel contesto di BrowseComp, suggerendo che Qwen potrebbe dover recuperare terreno. Il confronto include anche GPT-OSS-20B. Il modello è disponibile su Hugging Face.

2026-01-19 Fonte

📁 LLM AI generated

Rilasciato GLM 4.7 Flash: incrementi prestazionali?

È stata annunciata la release di GLM 4.7 Flash. La comunità open source si interroga sui potenziali incrementi prestazionali rispetto a Qwen 30b, con particolare attenzione ai benchmark. Al momento mancano dati oggettivi a supporto.

2026-01-19 Fonte

📁 LLM AI generated

Ghost Engine: Llama-3-8B in soli 3GB di VRAM grazie alla generazione dinamica

Un nuovo motore di inferenza, chiamato Ghost Engine, promette di ridurre drasticamente il consumo di memoria durante l'esecuzione di modelli linguistici di grandi dimensioni (LLM). Invece di caricare i pesi statici, Ghost Engine li genera al volo, scambiando banda di memoria con potenza di calcolo. I primi test su Llama-3-8B mostrano risultati promettenti in termini di compressione e fedeltà.

2026-01-19 Fonte

📁 LLM AI generated

GLM-4.7-Flash: nuovo modello linguistico open-source su Hugging Face

È disponibile su Hugging Face il modello linguistico GLM-4.7-Flash. La notizia è stata diffusa su Reddit, aprendo un filone di discussione nella comunità LocalLLaMA. Il modello open-source promette nuove opportunità per lo sviluppo di applicazioni di intelligenza artificiale generativa e per la ricerca nel campo del trattamento del linguaggio naturale.

2026-01-19 Fonte

📁 LLM AI generated

Agente browser on-device con Qwen: demo in locale su Chrome

Una nuova demo mostra un agente browser locale, basato su Web GPU Liquid LFM e sui modelli Qwen di Alibaba, in esecuzione come estensione di Chrome. L'agente apre 'All in Podcast' su YouTube. Il codice sorgente è disponibile su GitHub per chi volesse approfondire e sviluppare ulteriormente questa tecnicia.

2026-01-19 Fonte

📁 LLM AI generated

Poliziotto sospeso per allucinazioni AI: il capo della polizia si dimette

Il capo della polizia delle West Midlands si è dimesso dopo che la sua forza di polizia ha utilizzato output fittizi di Microsoft Copilot per decidere di vietare ai tifosi israeliani di partecipare a una partita di calcio. L'agente aveva negato l'uso di sistemi di intelligenza artificiale, salvo poi scoprire il contrario.

2026-01-19 Fonte

📁 LLM AI generated

In arrivo GLM-4.7-Flash: indiscrezioni sul nuovo modello linguistico

Trapelano indizi su un possibile rilascio imminente di GLM-4.7-Flash. Un aggiornamento della collezione GLM-4.7, contenente un elemento nascosto, ha destato l'attenzione degli esperti. Le prime analisi suggeriscono che Zai stia preparando il lancio di questa nuova versione. Un commit su GitHub e un'immagine condivisa su Reddit alimentano le speculazioni, lasciando presagire novità in arrivo per la famiglia di modelli linguistici GLM.

2026-01-19 Fonte

📁 LLM AI generated

Top-K: algoritmo ottimizzato fino a 20x più veloce di PyTorch

Un tecnico ha sviluppato un'implementazione ottimizzata di Top-K, cruciale per il campionamento nei modelli linguistici di grandi dimensioni (LLM). L'ottimizzazione, basata su AVX2, surclassa le prestazioni di PyTorch su CPU da 4 a 20 volte, a seconda della dimensione del vocabolario. L'integrazione in llama.cpp ha portato a un'accelerazione del 63% nell'elaborazione dei prompt su un modello MoE da 120B.

2026-01-19 Fonte

📁 LLM AI generated

Flog: app iOS gratuita per il tracciamento nutrizionale con LLM locale

Uno sviluppatore ha creato Flog, un'app gratuita per iOS che tiene traccia dell'alimentazione tramite foto, sfruttando modelli LLM locali per stimare porzioni e nutrienti. L'app si integra con Apple Health e supporta modelli LLM eseguiti direttamente sul dispositivo o tramite LM Studio. Lo sviluppatore non prevede di monetizzare l'applicazione e garantisce che i dati rimangano sul dispositivo dell'utente.

2026-01-19 Fonte

📁 LLM AI generated

JARVIS: Aggiornamenti sullo sviluppo di un agente LLM

Un utente di Reddit ha condiviso un aggiornamento sullo sviluppo di JARVIS, un agente basato su modelli linguistici di grandi dimensioni (LLM). Il post originale include un link a un video dimostrativo del progetto. Lo sviluppo di agenti LLM rappresenta un'area di ricerca in rapida crescita, con l'obiettivo di creare sistemi in grado di automatizzare compiti complessi interagendo con il mondo esterno.

2026-01-19 Fonte

📁 LLM AI generated

Sviluppo LLM in locale: ha ancora senso con GPU da 16GB?

Un utente con una GPU Nvidia RTX 5070 Ti da 16GB si interroga sull'efficacia dello sviluppo di modelli linguistici di grandi dimensioni (LLM) in locale. L'esperienza con Kilo code e Qwen 2.5 coder 7B tramite Ollama ha evidenziato problemi con la gestione del contesto, che si esaurisce rapidamente anche con file di progetto di dimensioni modeste. La domanda è: come affrontano questa sfida altri sviluppatori con configurazioni simili?

2026-01-19 Fonte

📁 LLM AI generated

Europa: corsa all'erede di DeepSeek per l'autosufficienza nell'IA

L'alleanza tra Europa e Stati Uniti mostra segni di cedimento, spingendo l'UE ad accelerare i piani per raggiungere l'autosufficienza nel campo dell'intelligenza artificiale. L'obiettivo è creare un'alternativa europea a modelli avanzati come DeepSeek, riducendo la dipendenza tecnicica da altre nazioni.

2026-01-19 Fonte

📁 LLM AI generated

Agent conversazionali: la concisione ne riduce la competenza?

Un nuovo studio analizza gli effetti collaterali inattesi derivanti dall'uso di specifiche caratteristiche stilistiche nei prompt per agent conversazionali basati su modelli linguistici di grandi dimensioni (LLM). La ricerca rivela come la richiesta di concisione possa compromettere la percezione di competenza dell'agente, evidenziando l'interdipendenza tra diversi tratti stilistici e la necessità di approcci più sofisticati per un controllo stilistico efficace e sicuro.

2026-01-19 Fonte

📁 LLM AI generated

BYOL: un framework per LLM su misura per lingue a basse risorse

Un nuovo studio introduce BYOL, un framework per migliorare le prestazioni dei modelli linguistici di grandi dimensioni (LLM) in lingue con scarsa presenza digitale. BYOL classifica le lingue in base alle risorse disponibili e adatta le tecniche di training, inclusa la generazione di testo sintetico e l'affinamento tramite traduzione automatica, per ottimizzare i risultati. I primi test su chichewa, maori e inuktitut mostrano miglioramenti significativi rispetto ai modelli multilingue esistenti.

2026-01-19 Fonte

📁 LLM AI generated

Nuovi flussi normalizzanti analitici per trasformazioni più interpretabili

Un nuovo studio introduce tre famiglie di funzioni analitiche per i flussi normalizzanti, offrendo alternative più efficienti e interpretabili rispetto agli approcci esistenti. I vantaggi includono una maggiore stabilità nell'addestramento e la possibilità di ridurre drasticamente il numero di parametri necessari, aprendo nuove prospettive per problemi complessi in fisica e altri campi.

2026-01-19 Fonte

📁 LLM AI generated

LLM: come valutano l'affidabilità delle informazioni online?

I modelli linguistici di grandi dimensioni (LLM) stanno diventando sempre più importanti nei sistemi di ricerca e raccomandazione online. Una nuova ricerca analizza come questi modelli codificano l'affidabilità percepita nelle narrazioni web, rivelando che i modelli interiorizzano segnali di fiducia psicologicamente fondati senza supervisione esplicita. Questo studio apre la strada a sistemi di intelligenza artificiale più credibili e trasparenti.

2026-01-19 Fonte

📁 LLM AI generated

Giappone: sistema di agenti AI per la vaccinazione contro l'HPV

Un nuovo sistema di agenti basato su intelligenza artificiale è stato sviluppato in Giappone per affrontare le esitazioni sulla vaccinazione contro il papillomavirus umano (HPV). Il sistema fornisce informazioni verificate tramite un'interfaccia conversazionale e genera report analitici per le istituzioni mediche, monitorando il discorso pubblico sui social media. I primi test mostrano risultati promettenti in termini di pertinenza, correttezza e completezza delle informazioni fornite.

2026-01-19 Fonte

📁 LLM AI generated

OpenAI dovrebbe rilasciare GPT-4o in open source? Un'opinione

Un utente ha suggerito che OpenAI dovrebbe rilasciare il modello GPT-4o in open source. Nonostante le preoccupazioni relative alla sicurezza, l'iniziativa potrebbe coprire le attività open source di OpenAI per i prossimi mesi e consentirebbe di risparmiare sui costi di mantenimento del modello.

2026-01-19 Fonte