LLM – Notizie e Articoli AI

📁 LLM AI generated

Strix Halo come server LLM: quale distribuzione Linux scegliere?

Un utente sta valutando di utilizzare il proprio Strix Halo come server per modelli linguistici di grandi dimensioni (LLM) e media server, cercando la distribuzione Linux più adatta. Fedora 43 è già installata, ma si valutano alternative per un supporto RDP ottimale e una gestione efficiente degli LLM.

2026-01-19 Fonte

📁 LLM AI generated

DetLLM: strumento per garantire inferenza deterministica negli LLM

Uno sviluppatore ha creato DetLLM per risolvere il problema della non riproducibilità nell'inferenza degli LLM. Lo strumento verifica la ripetibilità a livello di token, genera un report e crea un pacchetto di riproduzione minimo per ogni esecuzione, includendo snapshot dell'ambiente e configurazione. Il codice è disponibile su GitHub e aperto al feedback della comunità.

2026-01-19 Fonte

📁 LLM AI generated

SLM e Prompt: come superare i modelli linguistici più grandi?

Un utente si chiede come ottenere il massimo dai modelli linguistici di dimensioni ridotte (SLM), in particolare quando sono ottimizzati per un argomento specifico. La sfida è che i prompt tradizionali, efficaci con i modelli linguistici di grandi dimensioni (LLM), spesso producono risultati incoerenti con gli SLM, anche se il prompt riguarda l'area di specializzazione del modello. Sarà necessario ripensare radicalmente le tecniche di prompting?

2026-01-19 Fonte

📁 LLM AI generated

GFN v2.5.0: inferenza O(1) e sequenze extrapolate 500x

Presentata la versione 2.5.0 di GFN (Geodesic Flow Networks), un'architettura che riformula il sequence modeling come dinamica di particelle. GFN offre inferenza O(1) e stabilità grazie all'integrazione simplettica. Dimostrata la generalizzazione zero-shot su task algoritmici con sequenze fino a 10.000 token, mantenendo un footprint di memoria di circa 60MB. Rispetto ai Transformer, GFN riduce l'overhead di memoria di 234x a L=1.000.

2026-01-19 Fonte

📁 LLM AI generated

Come si pronuncia "GGUF"? Il dilemma della pronuncia nell'AI

La pronuncia di "GGUF", un formato di file utilizzato nell'ambito dell'intelligenza artificiale, sta generando un acceso dibattito nella comunità. Le opzioni più comuni includono "jee-guff", "giguff" e "jee jee you eff". La discussione evidenzia le sfide di standardizzazione nella terminologia tecnica.

2026-01-18 Fonte

📁 LLM AI generated

Gli agenti LLM usano liste di cose da fare?

Un utente ha sollevato un interrogativo interessante riguardo all'architettura interna dei principali agenti basati su modelli linguistici di grandi dimensioni (LLM). Sembra che molti di questi agenti suddividano i compiti complessi in semplici liste di cose da fare, eseguendole in sequenza. Questa implementazione, se confermata, solleva questioni sull'effettiva intelligenza e capacità di ragionamento di tali sistemi.

2026-01-18 Fonte

📁 LLM AI generated

RLVR e GRPO: implementazione da zero con notebook

È disponibile un notebook di codice che illustra l'implementazione da zero di RLVR (Reinforcement Learning Value Retrieval) con GRPO (Gradient Ratio Policy Optimization). La risorsa, ospitata su GitHub, è stata condivisa su Reddit ed è pensata per chi desidera approfondire l'implementazione pratica di questi algoritmi.

2026-01-18 Fonte

📁 LLM AI generated

Confer: l'alternativa di Moxie Marlinspike a ChatGPT attenta alla privacy

Moxie Marlinspike, noto per il suo lavoro su Signal, ha lanciato Confer, un'alternativa a ChatGPT e Claude focalizzata sulla privacy. A differenza di questi ultimi, Confer assicura che le conversazioni degli utenti non vengano utilizzate per il training dei modelli o per scopi pubblicitari, offrendo un'esperienza simile ma con maggiori garanzie sulla riservatezza dei dati.

2026-01-18 Fonte

📁 LLM AI generated

Ministral 3 Reasoning Heretic: Modelli LLM senza censure e GGUF

Disponibili i modelli Ministral 3 Reasoning Heretic, versioni non censurate con capacità di visione. L'utente coder3101 ha rilasciato i modelli quantizzati (Q4, Q5, Q8, BF16) con MMPROJ per funzionalità di visione, accelerando i tempi di rilascio per la community. Sono disponibili versioni da 4B, 8B e 14B parametri.

2026-01-18 Fonte

📁 LLM AI generated

Newelle 1.2: l'assistente AI per Linux si aggiorna

È disponibile la versione 1.2 di Newelle, l'assistente AI progettato per Linux. L'aggiornamento include l'integrazione di llama.cpp, una nuova libreria di modelli per ollama/llama.cpp e una ricerca ibrida ottimizzata per la lettura dei documenti. Tra le altre novità, l'aggiunta di uno strumento di esecuzione comandi, tool group, gestione della memoria semantica e la possibilità di importare ed esportare chat. Migliorato anche il menu delle informazioni sui messaggi.

2026-01-18 Fonte

📁 LLM AI generated

Analisi di un milione di email per l'ingegneria del contesto

Un team ha elaborato oltre un milione di email per trasformarle in contesto strutturato per agenti di intelligenza artificiale. L'analisi ha rivelato che la ricostruzione dei thread è complessa, gli allegati sono fondamentali, le conversazioni multilingue sono frequenti e la conservazione dei dati è un ostacolo per le aziende. Le prestazioni raggiungono i 200ms per il recupero e circa 3 secondi per il primo token.

2026-01-18 Fonte

📁 LLM AI generated

OpenSlopware: progetto smaschera software open source creato da bot IA

Il progetto OpenSlopware, nato per identificare software open source generato da bot di intelligenza artificiale, ha avuto vita breve a causa di contestazioni. Nonostante la chiusura, alcune derivazioni del progetto continuano a esistere.

2026-01-18 Fonte

📁 LLM AI generated

Inferenza LLM più veloce con lo Speculative Decoding

Lo Speculative Decoding promette un'accelerazione da 2x a 3x nell'inferenza dei modelli linguistici di grandi dimensioni (LLM) senza sacrificare la precisione. Sfruttando un modello più piccolo per generare bozze di token, e verificandole poi in parallelo con il modello principale, si massimizza l'utilizzo dell'hardware e si converte un'operazione vincolata dalla memoria in una vincolata dal calcolo.

2026-01-18 Fonte

📁 LLM AI generated

CPA-Qwen3-8B-v0: il modello LLM specializzato per contabilità

AudCor ha rilasciato CPA-Qwen3-8B-v0, un modello linguistico di grandi dimensioni (LLM) specializzato e ottimizzato a partire da Qwen3-8B. Addestrato sul dataset Finance-Instruct-500k, si distingue dai modelli finanziari generici per la sua capacità di adottare il ruolo di un contabile pubblico certificato (CPA), fornendo risposte accurate e prudenti, in linea con gli standard professionali. Il modello dimostra una solida conoscenza di GAAP, IFRS e dei codici tributari, rendendolo adatto per interpretare requisiti di conformità complessi.

2026-01-18 Fonte

📁 LLM AI generated

LLM: l'addestramento esclusivo su dati sintetici funziona?

L'addestramento di modelli linguistici di grandi dimensioni (LLM) esclusivamente su dati sintetici è un tema dibattuto. Un recente studio ha evidenziato come l'uso ricorsivo di dati generati dall'intelligenza artificiale possa portare a un deterioramento della qualità del modello. Tuttavia, altri studi mostrano risultati positivi con dati sintetici di alta qualità. Qual è la verità?

2026-01-18 Fonte

📁 LLM AI generated

Un tool open source fa dibattere 5 IA per validare le risposte

Un sviluppatore ha creato una piattaforma open source che utilizza cinque modelli di linguaggio di grandi dimensioni (LLM) in un processo di dibattito e verifica incrociata dei fatti. L'obiettivo è ridurre la dipendenza cieca dalle risposte delle IA, promuovendo un approccio più critico e validato. Il codice è disponibile su GitHub per chi volesse testare e contribuire.

2026-01-18 Fonte

📁 LLM AI generated

Personal-Guru: il tutor AI open source e locale che crea un curriculum

Personal-Guru è un sistema di apprendimento open source che genera automaticamente un curriculum strutturato a partire da un argomento. Funziona localmente, senza abbonamenti, offrendo privacy e la possibilità di operare offline. Include quiz, flashcard e modalità audio/video per un apprendimento interattivo.

2026-01-18 Fonte

📁 LLM AI generated

Apple e Google: Gemini AI per Siri, svolta su privacy e personalizzazione

Apple starebbe collaborando con Google per integrare il modello di intelligenza artificiale Gemini in Siri. Questa partnership potrebbe portare a un approccio rinnovato per quanto riguarda la personalizzazione e la privacy dell'assistente vocale di Apple, segnando un cambiamento significativo nella sua strategia.

2026-01-18 Fonte

📁 LLM AI generated

Insider AI pianificano di avvelenare i dati di addestramento

Alcuni addetti ai lavori nel settore dell'intelligenza artificiale stanno valutando strategie per compromettere i set di dati utilizzati per addestrare i modelli di linguaggio. L'obiettivo è sabotare i modelli futuri, rendendoli meno affidabili e accurati. La discussione è emersa su Reddit e fa riferimento a un articolo di The Register.

2026-01-18 Fonte

📁 LLM AI generated

Ricerca di IA senza filtri (non per adulti)

Un utente sta cercando un'intelligenza artificiale realmente priva di censure e tecnicamente avanzata, capace di ragionare liberamente senza restrizioni eccessive. Molte IA etichettate come "senza filtri" sembrano ottimizzate per un utilizzo a basso sforzo rivolto agli adulti, piuttosto che per l'intelligenza e la profondità. L'utente è alla ricerca di modelli open source o piattaforme meno conosciute che si concentrino su ragionamento, creatività e problem-solving.

2026-01-17 Fonte