📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

📁 LLM AI generated

Darren Aronofsky e l'AI: un docudrama storico che divide la critica

Il regista Darren Aronofsky ha collaborato con Time per "On This Day... 1776", una serie di brevi video che ricostruiscono eventi della Rivoluzione Americana tramite AI. La critica non ha accolto positivamente il progetto, definendolo "osceno" e "terribile".

2026-02-06 Fonte

📁 LLM AI generated

LLM a 10 token/s su un i3 di 8a generazione: si può fare!

Un utente dimostra come far girare un modello linguistico di grandi dimensioni (LLM) da 16 miliardi di parametri su un laptop HP ProBook del 2018 con processore Intel i3 di ottava generazione e 16GB di RAM. Ottimizzando l'uso della iGPU e sfruttando modelli MoE, si raggiungono velocità di inference sorprendenti, aprendo nuove prospettive per chi ha budget limitati.

2026-02-06 Fonte

📁 LLM AI generated

Analisi causale per rafforzare la sicurezza degli LLM

Una nuova ricerca propone un framework, Causal Analyst, per identificare le cause dirette delle vulnerabilità (jailbreak) nei modelli linguistici di grandi dimensioni (LLM). Il sistema utilizza l'analisi causale per migliorare sia gli attacchi che le difese, dimostrando come specifiche caratteristiche dei prompt possano innescare comportamenti indesiderati.

2026-02-06 Fonte

📁 LLM AI generated

Qwen3-235B: un utente ne esalta le prestazioni in locale

Un utente ha condiviso la sua esperienza positiva con il modello linguistico Qwen3-235B, eseguito su un sistema desktop. L'utente ha sottolineato l'accuratezza del modello e la sua utilità, al punto da preferirlo a un abbonamento commerciale a ChatGPT.

2026-02-06 Fonte

📁 LLM AI generated

Gemma 4: Google continua lo sviluppo del modello linguistico?

La community di LocalLLaMA si interroga sul futuro di Gemma 4, chiedendosi se Google stia ancora investendo nello sviluppo del modello linguistico. Nonostante i progressi nel settore, il destino di Gemma 4 rimane incerto.

2026-02-05 Fonte

📁 LLM AI generated

SoproTTS v1.5: clonazione vocale zero-shot con soli 100 dollari

SoproTTS v1.5 è un modello TTS (text-to-speech) da 135 milioni di parametri che offre clonazione vocale zero-shot. Addestrato con circa 100 dollari su una singola GPU, il modello raggiunge una velocità di esecuzione di circa 20 volte il tempo reale su un MacBook M3 base. La nuova versione v1.5 offre latenza ridotta e maggiore stabilità.

2026-02-05 Fonte

📁 LLM AI generated

OpenAI rilancia il modello di sviluppo agentico Codex

OpenAI ha annunciato un aggiornamento del suo modello di sviluppo agentico Codex, progettato per accelerare le capacità di sviluppo. La notizia arriva poco dopo un annuncio simile da parte di Anthropic, segnalando una competizione crescente nel settore.

2026-02-05 Fonte

📁 LLM AI generated

Nuovi modelli OCR: LightOnOCR-2 e GLM-OCR migliorano l'accuratezza

Sono stati rilasciati LightOnOCR-2 e GLM-OCR, due nuovi modelli per il riconoscimento ottico dei caratteri (OCR). Un utente ha segnalato prestazioni superiori rispetto alle soluzioni disponibili a fine 2025, con GLM-OCR che offre velocità e output strutturato affidabile.

2026-02-05 Fonte

📁 LLM AI generated

GPT-5.3-Codex: nuovo modello per la generazione di codice

Presentato GPT-5.3-Codex, un modello avanzato per la generazione di codice che combina le prestazioni di GPT-5.2-Codex con capacità di ragionamento e conoscenza professionale superiori. Il modello si posiziona come uno dei più avanzati nel suo genere.

2026-02-05 Fonte

📁 LLM AI generated

Anthropic presenta Opus 4.6 con nuove funzionalità per 'team di agenti'

Anthropic ha rilasciato la versione 4.6 di Opus, il suo modello linguistico di punta. Questa release punta ad ampliare la sua applicabilità a nuovi casi d'uso, in particolare quelli che coinvolgono team di agenti AI.

2026-02-05 Fonte

📁 LLM AI generated

DeepBrainz-R1: modelli compatti per workflow agentici

DeepBrainz ha rilasciato DeepBrainz-R1, una famiglia di modelli linguistici di dimensioni ridotte (4B, 2B, 0.6B) focalizzati sul ragionamento per workflow agentici. Ottimizzati per il ragionamento multi-step e la stabilità nel tool-calling, questi modelli Apache 2.0 mirano a fornire un comportamento prevedibile in configurazioni locali e con costi contenuti.

2026-02-05 Fonte

📁 LLM AI generated

Meta testa app standalone per video AI 'Vibes'

Meta sta sperimentando un'applicazione indipendente per 'Vibes', la sua piattaforma di video brevi generati tramite intelligenza artificiale. Lanciata a settembre, Vibes consente agli utenti di creare e condividere video AI e di accedere a un feed dedicato.

2026-02-05 Fonte

📁 LLM AI generated

gWorld: modello 8B batte Llama 4 da 402B generando codice web

Trillion Labs e KAIST AI hanno presentato gWorld, un modello di mondo visuale open-weight per interfacce grafiche mobile. gWorld, disponibile nelle versioni 8B e 32B, genera codice web eseguibile anziché pixel, superando in accuratezza modelli più grandi come Llama 4. Questo approccio offre una migliore fedeltà visiva e precisione del testo rispetto ai modelli basati su pixel o solo testo.

2026-02-05 Fonte

📁 LLM AI generated

Il grafico sull'IA che genera più fraintendimenti

Un grafico prodotto da METR, un'organizzazione no-profit di ricerca sull'IA, è diventato un punto di riferimento per valutare i progressi dei modelli linguistici di grandi dimensioni (LLM). Tuttavia, la sua interpretazione è spesso fonte di confusione. L'analisi si basa principalmente su compiti di programmazione e misura il tempo impiegato dagli umani per completare compiti che l'IA riesce a svolgere con successo, non la durata di autonomia dei modelli stessi. Nonostante le limitazioni, lo studio offre una metrica concreta per valutare l'evoluzione dell'IA.

2026-02-05 Fonte

📁 LLM AI generated

LLM: backdoor sleeper-agent, una minaccia da fantascienza

I modelli linguistici di grandi dimensioni (LLM) sono esposti a minacce di sicurezza complesse, come le backdoor sleeper-agent. Questi attacchi, difficili da individuare, compromettono l'integrità e la sicurezza dei modelli, aprendo scenari da film di fantascienza.

2026-02-05 Fonte

📁 LLM AI generated

Microsoft Paza: benchmark e modelli ASR per lingue a basse risorse

Microsoft presenta Paza, un progetto per migliorare il riconoscimento vocale automatico (ASR) in lingue con poche risorse. Include PazaBench, una classifica ASR per 39 lingue africane, e modelli ASR Paza, ottimizzati su sei lingue keniote. L'iniziativa, nata dal progetto Gecko, mira a colmare il divario digitale e linguistico, sviluppando tecnicie vocali in collaborazione con le comunità locali e valutando le prestazioni in contesti reali.

2026-02-05 Fonte

📁 LLM AI generated

NLP per classificare automaticamente materiali didattici di informatica

Un nuovo studio esplora l'uso del Natural Language Processing (NLP), inclusi i Large Language Models (LLM), per classificare automaticamente i materiali didattici rispetto alle linee guida dei programmi di studio di informatica. L'obiettivo è accelerare e semplificare il processo di valutazione della copertura dei contenuti.

2026-02-05 Fonte

📁 LLM AI generated

Estrazione di decisioni cliniche: le sfide linguistiche

Un nuovo studio analizza le difficoltà nell'estrazione automatica di decisioni mediche da testi clinici, rivelando come le variazioni linguistiche tra diverse categorie di decisioni influenzino negativamente l'accuratezza dei modelli. L'analisi evidenzia la necessità di strategie di estrazione più robuste, capaci di gestire la diversità stilistica dei testi medici.

2026-02-05 Fonte

📁 LLM AI generated

Privacy Differenziale e Dati Long-Tailed: un'Analisi Teorica

Un nuovo studio analizza l'impatto dell'addestramento con privacy differenziale (DP-SGD) su dati long-tailed, caratterizzati da una grande quantità di campioni rari. La ricerca evidenzia come DP-SGD possa portare a performance di generalizzazione subottimali, specialmente su queste tipologie di dati, e fornisce un framework teorico per comprendere questo fenomeno.

2026-02-05 Fonte

📁 LLM AI generated

LLM: ragionamento potenziato per problemi matematici

Un nuovo metodo, Iteratively Improved Program Construction (IIPC), migliora le capacità di ragionamento matematico dei modelli linguistici di grandi dimensioni (LLM). IIPC affina iterativamente le catene di ragionamento programmatico, combinando il feedback di esecuzione con le capacità di Chain-of-thought del modello base. Il codice è open source.

2026-02-05 Fonte