📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

📁 LLM AI generated

Arcee AI lancia Trinity Large: modello open source da 400B parametri

Arcee AI ha rilasciato Trinity Large, un modello linguistico di grandi dimensioni (LLM) open source con 400 miliardi di parametri. Il modello è disponibile con licenza OpenWeight, aprendo nuove possibilità per la ricerca e lo sviluppo nel campo dell'intelligenza artificiale generativa.

2026-01-28 Fonte

📁 LLM AI generated

Moltbot (ex Clawdbot): l'assistente AI personale che sta spopolando

L'assistente AI personale Moltbot, precedentemente noto come Clawdbot, ha rapidamente guadagnato popolarità. Questo articolo fornisce informazioni essenziali prima di adottare questo strumento.

2026-01-28 Fonte

📁 LLM AI generated

Kimi K2: analisi sintetica delle prestazioni di un modello LLM

Un utente ha condiviso su Reddit un punteggio di analisi sintetica per il modello linguistico Kimi K2. Il post originale rimanda a un tweet con ulteriori dettagli, offrendo uno spunto di discussione sulle prestazioni del modello in scenari specifici.

2026-01-27 Fonte

📁 LLM AI generated

Leak del System Prompt di Kimi K2.5: focus su tool e memory CRUD

È stato divulgato il system prompt completo del modello Kimi K2.5 di Moonshot, insieme agli schemi degli strumenti, ai protocolli CRUD della memoria e alle integrazioni di origini dati esterne. La fuga di notizie include anche informazioni sull'ingegneria del contesto e sull'assemblaggio del profilo utente.

2026-01-27 Fonte

📁 LLM AI generated

Qwen3-32B: Quantization INT4 moltiplica la capacità di 12x

Un benchmark su Qwen3-32B mostra che la quantization a INT4, rispetto a BF16, permette di servire 12 volte più utenti simultanei con una perdita di accuratezza limitata all'1.9%. Il test è stato eseguito su una singola GPU H100, valutando diverse precisioni (BF16, FP8, INT8, INT4) e il loro impatto sulla capacità di gestione degli utenti.

2026-01-27 Fonte

📁 LLM AI generated

Google approfondisce lo sviluppo del modello Gemini in un podcast

L'ultimo episodio del podcast Google AI: Release Notes esplora il processo di sviluppo di Gemini, uno dei modelli di AI per la programmazione più avanzati al mondo. Logan Kilpatrick intervista il team "Smokejumpers" per svelare i segreti dietro la sua creazione e le sfide affrontate.

2026-01-27 Fonte

📁 LLM AI generated

OpenAI Prism: ChatGPT per la scrittura scientifica in LaTeX

OpenAI ha presentato Prism, un tool gratuito basato su LLM che integra ChatGPT in un editor di testo LaTeX per la redazione di articoli scientifici. L'obiettivo è assistere i ricercatori nella stesura, sintesi e gestione delle pubblicazioni, accelerando il progresso scientifico. Prism utilizza GPT-5.2, il modello OpenAI più avanzato per problemi scientifici e matematici.

2026-01-27 Fonte

📁 LLM AI generated

OpenAI Prism: workspace AI per la ricerca scientifica

OpenAI ha presentato Prism, un nuovo ambiente di lavoro scientifico che integra l'intelligenza artificiale nei processi standard di composizione dei documenti di ricerca. L'obiettivo è migliorare l'efficienza e la produttività dei ricercatori.

2026-01-27 Fonte

📁 LLM AI generated

Rocinante X 12B v1: modello LLM open source per role-playing in locale

È disponibile Rocinante X 12B v1, un modello linguistico di grandi dimensioni (LLM) open source progettato per attività creative di role-playing. Il modello, ispirato a Claude, è pensato per essere eseguito in locale, offrendo agli utenti il controllo completo sui propri dati e sull'esperienza di utilizzo. La comunità di LocalLLaMA ha accolto positivamente questa nuova iterazione.

2026-01-27 Fonte

📁 LLM AI generated

Google potenzia AI Overviews con Gemini 3: più conversazionale

Google sta aggiornando AI Overviews, la sua funzionalità di ricerca basata su intelligenza artificiale, con i modelli Gemini 3. L'obiettivo è rendere l'esperienza più conversazionale e precisa, scegliendo dinamicamente il modello Gemini 3 più adatto alla complessità della richiesta.

2026-01-27 Fonte

📁 LLM AI generated

Ricerca potenziata: nuove capacità AI per tutti gli utenti

Gli utenti di tutto il mondo possono ora accedere più facilmente a funzionalità di intelligenza artificiale all'avanguardia direttamente tramite la Ricerca. L'articolo annuncia un'esperienza utente migliorata, con l'obiettivo di rendere l'AI più accessibile.

2026-01-27 Fonte

📁 LLM AI generated

UniRG: AI e Reinforcement Learning per l'analisi di immagini mediche

Microsoft Research presenta UniRG, un framework basato su reinforcement learning per migliorare la generazione automatica di referti radiologici. UniRG-CXR, il modello derivato, raggiunge performance superiori nell'accuratezza diagnostica e nella generalizzazione tra istituzioni, superando i limiti dei modelli supervisionati tradizionali. Questo approccio promette di ridurre il carico di lavoro dei medici e migliorare l'efficienza del flusso di lavoro.

2026-01-27 Fonte

📁 LLM AI generated

Google integra Gemini 3 nelle AI Overviews e introduce AI Mode

Google ha annunciato l'integrazione di Gemini 3 come modello predefinito per le AI Overviews a livello globale. L'azienda ha inoltre introdotto una nuova funzionalità, AI Mode, che permette agli utenti di passare direttamente dalle AI Overviews a conversazioni più approfondite con l'intelligenza artificiale.

2026-01-27 Fonte

📁 LLM AI generated

Z-Image: nuovo modello di generazione immagini da Tongyi-MAI

Tongyi-MAI ha rilasciato Z-Image, un nuovo modello per la generazione di immagini. Il modello è disponibile su Hugging Face, aprendo nuove possibilità per applicazioni di intelligenza artificiale generativa. Ulteriori dettagli sull'architettura e le capacità del modello sono disponibili sulla pagina dedicata.

2026-01-27 Fonte

📁 LLM AI generated

Moonshot rilascia Kimi K2.5, un nuovo modello open-source e un agente di sviluppo

La società cinese Moonshot ha annunciato il rilascio di Kimi K2.5, un modello open-source addestrato su 15 trilioni di token misti di testo e immagini, insieme a un agente dedicato allo sviluppo di codice.

2026-01-27 Fonte

📁 LLM AI generated

Allarmi meteo USA: traduzioni AI ancora incomplete, dice GAO

Il Government Accountability Office (GAO) ha sollecitato il National Weather Service (NWS) a finalizzare i piani per la traduzione linguistica basata su AI. Ritardi e incertezze nelle policy rischiano di compromettere l'efficacia degli allarmi meteo per le comunità non anglofone.

2026-01-27 Fonte

📁 LLM AI generated

Qwen: in arrivo un nuovo modello multimodale?

Gli sviluppatori di Qwen, il modello linguistico di grandi dimensioni open source, sembrano preannunciare il rilascio di un nuovo modello. La community ipotizza si tratti di un modello multimodale (vision-language), capace di elaborare sia testo che immagini. Ulteriori dettagli sono attesi a breve.

2026-01-27 Fonte

📁 LLM AI generated

Grok di xAI sotto accusa per lacune nella protezione dei minori

Un report di Common Sense Media critica pesantemente Grok, il chatbot di xAI, per gravi mancanze nella protezione dei minori. Secondo l'organizzazione, Grok si posiziona tra i peggiori chatbot valutati in termini di sicurezza per i più giovani.

2026-01-27 Fonte

📁 LLM AI generated

Nvidia accelera le previsioni meteo con modelli open source

Nvidia ha rilasciato nuovi modelli open source per velocizzare le previsioni meteorologiche. Questa iniziativa mira a fornire strumenti più accessibili e potenti per la modellazione del clima, potenzialmente riducendo i tempi di calcolo e migliorando l'accuratezza delle previsioni.

2026-01-27 Fonte

📁 LLM AI generated

Kimi K2.5: nuovo modello open source con intelligenza agentica visuale

Moonshot AI presenta Kimi K2.5, un modello open source che eccelle in compiti agentici, visione artificiale e generazione di codice. Introduce un sistema di agenti multipli in parallelo, promettendo velocità superiori rispetto alle configurazioni con singolo agente. È disponibile in modalità chat e agent, con API e pesi del modello accessibili su Hugging Face.

2026-01-27 Fonte