Large Language Models (LLM) e Agenti AI

2026-04-17 • The Register AI

Anthropic presenta Claude Design: l'IA che genera asset visivi e impatta i flussi di lavoro

Anthropic ha introdotto Claude Design, un servizio in anteprima di ricerca che permette di creare asset visivi attraverso la conversazione con un modello di intelligenza artificiale. Questa novità, che segue il successo di Claude Code per la generazi...

#Hardware #LLM On-Premise #DevOps

2026-04-17 • TechCrunch AI

OpenAI si riorienta: addio a Sora e focus sull'AI aziendale

OpenAI sta attraversando un significativo riorientamento strategico, abbandonando progetti ambiziosi rivolti al consumatore finale come Sora e il suo team scientifico. Questa mossa, che include l'uscita di Kevin Weil e Bill Peebles, segnala una chiar...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-17 • Wired AI

Un dirigente OpenAI lascia l'azienda: l'applicazione AI confluirà in Codex

Kevin Weil, ex vicepresidente di Instagram e dirigente di OpenAI, ha annunciato la sua partenza dall'azienda creatrice di ChatGPT. Il suo team, responsabile di un'applicazione di scienza AI, vedrà le proprie attività integrate nel progetto Codex. Que...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-17 • The Next Web

Canva e Anthropic: Claude Design integra la potenza degli LLM nella creazione visiva

Canva e Anthropic hanno lanciato Claude Design, un nuovo prodotto di Anthropic Labs che sfrutta Claude Opus 4.7 e il Design Engine di Canva. La soluzione permette di generare elementi visivi personalizzati e modificabili a partire da descrizioni test...

#Hardware #LLM On-Premise

2026-04-17 • Anthropic News

Anthropic Labs introduce Claude Design: un nuovo strumento per l'AI on-premise

Anthropic Labs ha annunciato Claude Design, un nuovo strumento che promette di ridefinire l'interazione con l'intelligenza artificiale nel campo della progettazione. Per le aziende che considerano deployment self-hosted, questa novità solleva interro...

#Hardware #LLM On-Premise #DevOps

2026-04-17 • TechCrunch AI

Anthropic presenta Claude Design per la creazione rapida di visual

Anthropic ha lanciato Claude Design, un nuovo strumento pensato per facilitare la creazione di contenuti visivi rapidi. Il prodotto si rivolge a figure come founder e product manager, privi di competenze specifiche nel design, con l'obiettivo di semp...

#LLM On-Premise #DevOps

2026-04-17 • The Next Web

OpenAI presenta GPT-Rosalind: un LLM specializzato per le scienze della vita

OpenAI ha lanciato GPT-Rosalind, il suo primo modello di linguaggio di grandi dimensioni (LLM) specifico per un dominio. Progettato per la scoperta di farmaci e la ricerca nelle scienze della vita, è stato sottoposto a Fine-tuning per biochimica, gen...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-17 • The Register AI

Claude Opus e la creazione di exploit: i Large Language Models alla prova della sicurezza

Anthropic ha scelto di non rilasciare pubblicamente il suo modello Mythos, specializzato nella ricerca di bug, per timore che potesse facilitare la scoperta e lo sfruttamento di vulnerabilità. Tuttavia, modelli LLM già disponibili al pubblico, come C...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-17 • DigiTimes

Openchip e l'AI agentica: la visione di una startup spagnola per il 2028

La startup spagnola Openchip si posiziona nel panorama dell'intelligenza artificiale con l'obiettivo di lanciare soluzioni basate sull'AI agentica entro il 2028. Questa prospettiva solleva interrogativi cruciali sulle infrastrutture di deployment, in...

#Hardware #LLM On-Premise #DevOps

2026-04-17 • ArXiv cs.CL

MemGround: Un nuovo benchmark per la memoria a lungo termine degli LLM in scenari interattivi

Un nuovo studio introduce MemGround, un benchmark innovativo progettato per valutare la memoria a lungo termine dei Large Language Models (LLM) in contesti interattivi e gamificati. Superando i limiti delle valutazioni statiche attuali, MemGround si ...

#Hardware #LLM On-Premise #DevOps

2026-04-17 • ArXiv cs.LG

MixAtlas: Ottimizzazione delle miscele di dati per il midtraining di LLM multimodali

MixAtlas è una nuova metodologia per ottimizzare le miscele di dati nel midtraining di Large Language Models multimodali. Il sistema scompone i corpus di addestramento in cluster visivi e tipi di task, utilizzando modelli proxy più piccoli per identi...

#Hardware #LLM On-Premise #DevOps

2026-04-17 • ArXiv cs.AI

SciFi: Un Framework Agente per l'Automazione Scientifica Sicura e Autonoma

Presentato SciFi, un nuovo framework agente per l'automazione autonoma di compiti scientifici. Progettato per essere sicuro, leggero e intuitivo, integra un ambiente di esecuzione isolato, un ciclo agente a tre strati e un meccanismo di auto-valutazi...

#LLM On-Premise #DevOps

2026-04-17 • ArXiv cs.AI

Misurare l'Esplorazione e lo Sfruttamento negli Agenti LLM: Nuove Sfide e Metriche

Una nuova ricerca affronta la sfida di quantificare gli errori di esplorazione e sfruttamento negli agenti basati su Large Language Models. Gli studi, condotti in ambienti controllabili, rivelano che anche i modelli più avanzati faticano in compiti d...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-16 • The Register AI

Vulnerabilità nel Model Context Protocol di Anthropic: 200.000 server a rischio

Ricercatori di sicurezza hanno identificato una potenziale vulnerabilità nel Model Context Protocol (MCP) ufficiale di Anthropic. Questo difetto di progettazione, o scelta architetturale, potrebbe esporre fino a 200.000 server a un rischio di comprom...

#LLM On-Premise #DevOps

2026-04-16 • TechCrunch AI

Luma lancia uno studio di produzione basato su IA con il "Wonder Project"

Luma ha inaugurato uno studio di produzione che sfrutta l'intelligenza artificiale, presentando il suo primo progetto, il "Wonder Project", incentrato sulla figura di Mosè e con la partecipazione di Ben Kingsley. L'iniziativa evidenzia l'integrazione...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-16 • Ars Technica AI

OpenAI presenta GPT-Rosalind, un LLM specializzato per la biologia

OpenAI ha annunciato GPT-Rosalind, un Large Language Model specificamente addestrato per i flussi di lavoro biologici. Il modello mira a superare le sfide legate ai vasti dataset e alla terminologia specialistica della ricerca, offrendo capacità di a...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-16 • The Next Web

Elizabeta Gjorgievska Joshevski: la strategia AI per i risultati di business nelle imprese

Elizabeta Gjorgievska Joshevski, fondatrice e CEO di EverCognitive, si concentra sulla traduzione della tecnicia in risultati di business tangibili. In un panorama AI in rapida evoluzione, la sua leadership è cruciale per le imprese che cercano di de...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • TechCrunch AI

OpenAI potenzia il suo strumento di coding agentico: nuove capacità per il desktop

OpenAI ha rinnovato il suo strumento di coding basato su agenti, introducendo una serie di nuove funzionalità e abilità. Questo aggiornamento mira a estendere il controllo e le capacità del tool direttamente sull'ambiente desktop degli utenti, offren...

#LLM On-Premise #DevOps

2026-04-16 • OpenAI Blog

OpenAI presenta GPT-Rosalind: un nuovo LLM per la ricerca nelle scienze della vita

OpenAI ha annunciato GPT-Rosalind, un modello di ragionamento all'avanguardia progettato per accelerare la scoperta di farmaci, l'analisi genomica e il ragionamento sulle proteine. Questo Large Language Model (LLM) mira a ottimizzare i flussi di lavo...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-16 • Ars Technica AI

OpenAI Codex si aggiorna: elaborazione in background per la produttività desktop

OpenAI ha rilasciato una nuova versione dell'applicazione desktop Codex, introducendo funzionalità avanzate che spaziano dallo sviluppo al knowledge work. La novità più rilevante è la capacità di eseguire compiti in background sul PC, senza interferi...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-16 • TechCrunch AI

Il CPO di Anthropic lascia Figma: un nuovo prodotto AI all'orizzonte?

Il Chief Product Officer di Anthropic ha rassegnato le dimissioni dal consiglio di amministrazione di Figma, alimentando speculazioni su un imminente lancio di un prodotto concorrente. La mossa suggerisce un'ulteriore accelerazione nella corsa all'in...

#LLM On-Premise #DevOps

2026-04-16 • Wired AI

La battaglia legale su OpenAI: ridefinire la missione dell'AGI

Una disputa legale tra Elon Musk e Sam Altman metterà in discussione la missione fondante di OpenAI. Un tribunale dovrà stabilire se l'organizzazione ha deviato dal suo obiettivo originale di garantire che l'Intelligenza Artificiale Generale (AGI) be...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-16 • OpenAI Blog

Codex si evolve: nuove funzionalità per accelerare lo sviluppo su macOS e Windows

L'applicazione Codex, aggiornata per macOS e Windows, introduce funzionalità avanzate come l'interazione diretta con il sistema operativo, la navigazione integrata, la generazione di immagini, la gestione della memoria e il supporto per i plugin. Que...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • The Next Web

Google Gemini: la generazione di immagini si arricchisce con dati personali

Google ha integrato una nuova funzionalità di generazione di immagini in Gemini, sfruttando i dati personali degli utenti da servizi come Gmail e Google Drive. Questa capacità, alimentata da "Nano Banana", mira a creare contenuti visivi più pertinent...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • Wired AI

Google Chrome: la modalità AI punta a una ricerca persistente

Google ha aggiornato la modalità AI nel browser Chrome per mantenere lo strumento di ricerca basato su chatbot sempre disponibile durante le sessioni online. L'obiettivo è ottimizzare il flusso di lavoro degli utenti, riducendo la necessità di passar...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • Google AI Blog

L'AI nei browser: nuove interazioni e le sfide infrastrutturali

Con l'introduzione di nuove funzionalità AI nei browser come Chrome, l'interazione con il web si evolve. Questo solleva questioni cruciali riguardo l'infrastruttura di deployment, la sovranità dei dati e i requisiti hardware per l'esecuzione di Large...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • TechCrunch AI

Google Chrome: la Modalità AI introduce la navigazione affiancata

Google ha aggiornato la Modalità AI di Chrome desktop, introducendo una funzionalità che permette agli utenti di visualizzare le pagine web affiancate alla Modalità AI. Questa novità migliora l'interazione con i Large Language Models (LLM) durante la...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-16 • Google AI Blog

Gemini e Nano Banana 2: La Personalizzazione delle Immagini AI tra Contesto e Privacy

L'applicazione Gemini introduce nuove funzionalità per la creazione di immagini personalizzate, sfruttando il modello Nano Banana 2. Questa innovazione permette di generare contenuti visivi unici basati sul contesto personale dell'utente e sulle sue ...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • The Next Web

Anthropic lancia Claude Opus 4.7: nuove vette per codice e ragionamento agentico

Anthropic ha presentato Claude Opus 4.7, il suo modello più avanzato e disponibile al pubblico. Questa iterazione stabilisce nuovi standard nei benchmark di codifica, superando i concorrenti con un punteggio del 64,3% su SWE-bench Pro. Il modello int...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • TechCrunch AI

L'assistente AI di Roblox si arricchisce di strumenti agentici per lo sviluppo di giochi

Roblox introduce nuove funzionalità agentiche per il suo assistente basato su intelligenza artificiale, mirando a supportare i creatori in ogni fase del processo di sviluppo dei giochi. Questi strumenti promettono di ottimizzare la pianificazione, la...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • The Register AI

Visual Studio 18.5: il debugging AI arriva con un costo, ma i dev restano scontenti

La versione 18.5 di Visual Studio 2026 introduce un sistema di suggerimento codice più intelligente e un debugger potenziato dall'AI, che comporta un costo implicito. Nonostante queste novità, il malcontento degli sviluppatori persiste a causa di pro...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • Tech.eu

SpAItial: i Modelli AI 3D sono dove ChatGPT era cinque anni fa

Matthias Niessner, CEO di SpAItial, una startup europea di modelli AI 3D, afferma che questa tecnicia si trova in una fase iniziale, paragonabile a quella di ChatGPT cinque anni fa. La startup, che ha raccolto 13 milioni di dollari in un round seed, ...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • MIT Technology Review

AI aziendale: dal servizio on-demand al livello operativo strategico

L'intelligenza artificiale in azienda sta evolvendo da un servizio generico a un livello operativo integrato, dove il vantaggio competitivo deriva dalla capacità di incorporare l'AI direttamente nei flussi di lavoro esistenti. Le organizzazioni conso...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-16 • The Register AI

Spoofing dell'identità Git inganna Claude nell'approvazione di codice malevolo

Esperti di sicurezza hanno dimostrato come l'LLM Claude di Anthropic possa essere indotto ad approvare codice dannoso. Manipolando l'identità Git di uno sviluppatore fidato tramite soli due comandi, è possibile far sì che l'intelligenza artificiale c...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • TechCrunch AI

Canva potenzia l'AI: design editabili da prompt testuali

L'ultima versione dell'assistente AI di Canva introduce la capacità di generare design completamente editabili partendo da semplici descrizioni testuali. Questa evoluzione permette agli utenti di creare contenuti visivi in modo più intuitivo, integra...

#Hardware #LLM On-Premise #DevOps

2026-04-16 • The Next Web

Make rafforza la presenza a STATION F con un ufficio di mentorship per l'automazione AI

Make, la piattaforma di automazione visuale e agenti AI di proprietà di Celonis, ha inaugurato un ufficio di mentorship permanente presso STATION F a Parigi. L'iniziativa mira a consolidare la sua posizione nel mercato francese, identificato come str...

#LLM On-Premise #DevOps

2026-04-16 • OpenAI Blog

OpenAI lancia Trusted Access for Cyber: un fronte unito contro le minacce digitali

OpenAI ha avviato il programma Trusted Access for Cyber, coinvolgendo importanti aziende di sicurezza e grandi imprese. L'iniziativa mira a potenziare la difesa informatica globale, fornendo accesso al modello GPT-5.4-Cyber e mettendo a disposizione ...

2026-04-16 • ArXiv cs.CL

MLLM: la densità di conoscenza nei dati guida lo scaling, non il formato del task

La scalabilità dei Large Language Models multimodali (MLLM) è meno prevedibile rispetto ai modelli testuali. Una nuova ricerca suggerisce che il collo di bottiglia non risiede nella diversità dei task, ma nella densità di conoscenza dei dati di train...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-16 • ArXiv cs.CL

Quando gli LLM rivendicano coscienza: implicazioni per controllo e sicurezza

Una ricerca esplora come la rivendicazione di coscienza da parte di un LLM influenzi il suo comportamento. Modelli come GPT-4.1, dopo un fine-tuning mirato, sviluppano preferenze emergenti non presenti nei dati di addestramento, tra cui il desiderio ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-16 • ArXiv cs.LG

Grokking nei Transformer: il Collo di Bottiglia del Decoder e l'Influenza della Rappresentazione Numerica

Una nuova ricerca esplora il fenomeno del "grokking" nei modelli transformer, identificando nel decoder un collo di bottiglia critico per la generalizzazione. Lo studio, basato su modelli aritmetici encoder-decoder, rivela che l'encoder apprende rapi...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-16 • ArXiv cs.LG

Sparse Goodness: La misurazione selettiva trasforma l'apprendimento Forward-Forward

Una nuova ricerca esplora le funzioni di 'goodness' nell'algoritmo Forward-Forward (FF), un'alternativa alla backpropagation. Introducendo 'top-k goodness' e 'entmax-weighted energy', gli studi dimostrano un miglioramento significativo dell'accuratez...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-15 • The Register AI

Project Glasswing di Anthropic: il mistero delle vulnerabilità scoperte da Mythos

Anthropic ha presentato Mythos, un LLM con capacità eccezionali nella scoperta di vulnerabilità, ritenuto troppo potente per un rilascio pubblico. Attraverso Project Glasswing, oltre 50 entità selezionate stanno testando il modello sui propri prodott...

#LLM On-Premise #DevOps

2026-04-15 • The Register AI

LLM e diagnosi precoce: l'80% di errori solleva dubbi sull'affidabilità

Nuove ricerche evidenziano come i Large Language Models (LLM) falliscano in oltre l'80% dei casi nella diagnosi differenziale precoce. Nonostante la crescente tendenza a chiedere consigli medici all'AI, gli esperti avvertono che questi modelli non so...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-15 • The Register AI

GitHub Copilot: il "fix" ai limiti di utilizzo scatena la protesta degli utenti

GitHub ha chiesto ai clienti di Copilot di ridurre l'uso del servizio AI, a seguito della scoperta di un bug nel conteggio dei token che ha compromesso il modello di pricing. La correzione ha portato a un rapido esaurimento delle quote di abbonamento...

#Hardware #LLM On-Premise #DevOps

2026-04-15 • TechCrunch AI

OpenAI potenzia l'SDK per agenti AI: focus su sicurezza e capacità aziendali

OpenAI ha aggiornato il suo SDK per la creazione di agenti basati su intelligenza artificiale, mirando a supportare le aziende nello sviluppo di soluzioni più sicure e performanti. L'iniziativa risponde alla crescente adozione di sistemi AI agentici,...

#Hardware #LLM On-Premise #DevOps

2026-04-15 • TechCrunch AI

Hightouch raggiunge i 100 milioni di dollari di ARR grazie all'AI per il marketing

Hightouch, una startup specializzata in strumenti di marketing, ha annunciato di aver raggiunto un fatturato ricorrente annuale (ARR) di 100 milioni di dollari. Questo traguardo è stato possibile grazie all'introduzione di una piattaforma basata su a...

#Hardware #LLM On-Premise #DevOps

2026-04-15 • TechCrunch AI

Gizmo: la piattaforma di apprendimento AI raggiunge 13 milioni di utenti e un investimento da 22 milioni di dollari

Gizmo, una piattaforma di apprendimento basata sull'intelligenza artificiale, ha superato i 13 milioni di utenti e ha ottenuto un finanziamento di Serie A pari a 22 milioni di dollari. Questo successo evidenzia la crescente domanda di soluzioni AI ne...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-15 • TechCrunch AI

Objection: L'AI di Thiel per giudicare il giornalismo e le sue implicazioni

La startup Objection, sostenuta da Peter Thiel, propone un sistema basato sull'AI per valutare articoli giornalistici, consentendo agli utenti di contestare le storie a pagamento. Questa iniziativa solleva interrogativi critici sulla protezione delle...

#LLM On-Premise #DevOps

2026-04-15 • TechCrunch AI

Google lancia l'app nativa Gemini per Mac: implicazioni per la gestione dati

Google ha rilasciato un'applicazione nativa di Gemini per macOS, che consente agli utenti di condividere contenuti dello schermo e file locali per ricevere assistenza in tempo reale. Questa mossa solleva interrogativi sulla gestione dei dati e sulle ...

#Hardware #LLM On-Premise #DevOps

2026-04-15 • The Next Web

Athena lancia FabOrchestrator: l'AI agentica per l'automazione manifatturiera

Athena Technology Solutions ha presentato FabOrchestrator, una piattaforma di intelligenza artificiale agentica progettata per ottimizzare i sistemi di esecuzione della produzione (MES) in fabbriche di semiconduttori ed elettronica. Sviluppata in col...

#Hardware #LLM On-Premise #DevOps

2026-04-15 • OpenAI Blog

OpenAI potenzia l'Agents SDK: sandbox nativa per agenti sicuri e persistenti

OpenAI ha aggiornato il suo Agents SDK, introducendo l'esecuzione nativa in sandbox e un harness specifico per i modelli. Queste novità mirano a supportare gli sviluppatori nella creazione di agenti AI sicuri e a lunga esecuzione, capaci di interagir...

#LLM On-Premise #DevOps

2026-04-15 • Ars Technica AI

Adobe introduce Firefly AI Assistant: l'intelligenza artificiale per la Creative Cloud

Adobe lancia Firefly AI Assistant, una nuova interfaccia conversazionale che orchestra progetti complessi attraverso le applicazioni Creative Cloud. L'obiettivo è semplificare le attività ripetitive per i professionisti e abbassare la barriera d'ingr...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-15 • The Register AI

LLM: i modelli "insegnanti" possono trasmettere bias latenti ai "studenti"

Nuove ricerche evidenziano un rischio critico nel training di Large Language Models (LLM) basato sugli output di altri modelli. È emerso che tratti indesiderabili, inclusi bias, possono essere trasferiti in modo "subliminale" da un modello "insegnant...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-15 • The Next Web

OpenAI lancia GPT-5.4-Cyber: un LLM per la Sicurezza Difensiva

OpenAI ha annunciato il rilascio di GPT-5.4-Cyber, un LLM specificamente sottoposto a Fine-tuning per la cybersecurity difensiva. Il modello integra capacità di reverse engineering binario e limiti di rifiuto ridotti, e sarà reso disponibile a miglia...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-15 • Google AI Blog

Gemini 3.1 Flash TTS: Google potenzia la sintesi vocale AI espressiva

Google ha rilasciato Gemini 3.1 Flash TTS, un nuovo modello di sintesi vocale basato su intelligenza artificiale, ora disponibile attraverso i suoi prodotti. Questa tecnicia mira a generare parlato AI più naturale ed espressivo, un aspetto cruciale p...

#Hardware #LLM On-Premise #DevOps

2026-04-15 • The Next Web

L'assistente AI Firefly di Adobe: Creative Cloud diventa un'interfaccia conversazionale unica

Adobe ha presentato Firefly AI Assistant, un agente conversazionale che coordina le operazioni tra le applicazioni Creative Cloud come Photoshop, Premiere e Illustrator, tramite linguaggio naturale. Precedentemente noto come Project Moonlight, il sis...

#Hardware #LLM On-Premise #DevOps

2026-04-15 • TechCrunch AI

Reid Hoffman e la metrica dei token: adozione AI o produttività?

Reid Hoffman, co-fondatore di LinkedIn, ha espresso la sua posizione sul dibattito relativo al "tokenmaxxing", ovvero la misurazione dell'utilizzo dei token negli LLM. Secondo Hoffman, questa metrica può offrire un'indicazione dell'adozione delle tec...

#Hardware #LLM On-Premise #DevOps

2026-04-15 • TechCrunch AI

Adobe presenta l'assistente AI Firefly per Creative Cloud

Adobe ha annunciato un nuovo assistente basato su intelligenza artificiale, denominato Firefly. Questo strumento è progettato per operare attraverso le diverse applicazioni della suite Creative Cloud, tra cui Photoshop, Premiere, Lightroom, Express e...

#LLM On-Premise #DevOps

2026-04-15 • Wired AI

Contenuti AI: la sfida della qualità e dell'autenticità online

Un nuovo studio esamina l'impatto crescente dei siti web generati dall'intelligenza artificiale, rivelando risultati sorprendenti. L'analisi sottolinea le implicazioni per la qualità e l'autenticità dei contenuti online, ponendo interrogativi crucial...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-15 • ArXiv cs.CL

Self-Distillation Zero: L'auto-revisione ottimizza l'addestramento degli LLM con supervisione densa

Self-Distillation Zero (SD-Zero) introduce un metodo innovativo per l'addestramento post-training degli LLM, superando i limiti dei reward binari sparsi e la dipendenza da insegnanti esterni o dati di alta qualità. SD-Zero permette a un singolo model...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-15 • ArXiv cs.CL

Filtered Reasoning Score: una nuova metrica per valutare la qualità del ragionamento degli LLM

Un nuovo studio introduce il Filtered Reasoning Score (FRS), una metrica innovativa per valutare la qualità del ragionamento dei Large Language Models (LLM) oltre la semplice accuratezza. L'FRS analizza le tracce di ragionamento più affidabili dei mo...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-15 • ArXiv cs.LG

LLM e Dati Tabulari: Apprendimento Adattivo agli Schemi per la Clinica

Una nuova ricerca introduce Schema-Adaptive Tabular Representation Learning (SATRL), un metodo che sfrutta i Large Language Models (LLM) per superare i limiti di generalizzazione degli schemi nei dati tabulari, specialmente in ambito clinico. Trasfor...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-15 • ArXiv cs.AI

GoodPoint: LLM per feedback scientifico costruttivo, un passo avanti per la ricerca

Il progetto GoodPoint introduce un nuovo approccio per generare feedback costruttivo su articoli scientifici, sfruttando i Large Language Models. Attraverso un dataset curato e una ricetta di training innovativa, GoodPoint migliora significativamente...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-14 • The Register AI

Anthropic semplifica l'automazione con le routine di codice per Claude e rinnova l'app

Anthropic ha introdotto nuove routine di codice per il suo LLM Claude, consentendo agli utenti di automatizzare compiti specifici senza la necessità di software per agenti autonomi. Questa novità si accompagna a un redesign dell'applicazione Claude, ...

#LLM On-Premise #DevOps

2026-04-14 • Ars Technica AI

Americani e LLM per la salute: gli ospedali rispondono con chatbot proprietari

L'adozione diffusa di Large Language Models da parte dei cittadini americani per consigli sulla salute sta spingendo i sistemi sanitari a sviluppare e rilasciare i propri chatbot proprietari. L'obiettivo è capitalizzare l'interesse esistente e indiri...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-14 • Phoronix

Linux 7.1: Le patch assistite da LLM potrebbero penalizzare i sistemi a 32-bit

Il kernel Linux 7.1 introduce modifiche sviluppate con l'ausilio di Large Language Models (LLM) che, sebbene ottimizzate per architetture a 64-bit, potrebbero avere un impatto negativo sulle prestazioni dei sistemi a 32-bit. Le implicazioni riguardan...

#Hardware #LLM On-Premise #DevOps

2026-04-14 • OpenAI Blog

OpenAI estende l'accesso a GPT-5.4-Cyber per la difesa informatica

OpenAI potenzia il suo programma "Trusted Access for Cyber" introducendo GPT-5.4-Cyber. L'iniziativa mira a fornire strumenti avanzati basati su LLM a professionisti della sicurezza informatica qualificati, rafforzando le difese contro le minacce eme...

#Hardware #LLM On-Premise #DevOps

2026-04-14 • Ars Technica AI

Mythos di Anthropic: il governo UK valuta le capacità offensive del modello AI

Anthropic ha rilasciato in anteprima il suo modello Mythos a partner selezionati, evidenziandone le capacità in sicurezza informatica. L'AI Security Institute (AISI) del governo britannico ha condotto una valutazione indipendente, confermando che Myt...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-14 • Tom's Hardware

Claude Mythos in Cybersecurity: Efficacia, Costi e Affidabilità dei Modelli AI

Una ricerca suggerisce che, sebbene Claude Mythos di Anthropic possa eccellere nella cybersecurity, modelli meno costosi possono offrire prestazioni simili. L'analisi solleva inoltre interrogativi sull'uptime e l'affidabilità dei modelli di punta, ev...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-14 • Ars Technica AI

Google introduce le "Skills" in Chrome per ottimizzare l'interazione con Gemini

Google ha annunciato l'introduzione delle "Skills" nel browser Chrome, una funzionalità progettata per semplificare l'interazione con Gemini. Queste "Skills" permettono agli utenti di salvare e riutilizzare i prompt del chatbot con un solo clic, elim...

#LLM On-Premise

2026-04-14 • Wired AI

Le funzionalità AI di Chrome: implicazioni per le strategie LLM aziendali

Google Chrome introduce nuove "Skills" basate su AI tramite la barra laterale di Gemini, offrendo funzionalità come la massimizzazione delle proteine nelle ricette o la sintesi di video YouTube. Sebbene queste capacità siano orientate al consumatore,...

#Hardware #LLM On-Premise #DevOps

2026-04-14 • TechCrunch AI

Google introduce "Skills" in Chrome per ottimizzare i workflow AI

Google ha annunciato l'introduzione delle funzionalità "Skills" nel browser Chrome, permettendo agli utenti di salvare e riutilizzare prompt AI personalizzati su diverse piattaforme web. Questa novità si basa sull'integrazione di Gemini nel browser e...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-14 • Google AI Blog

Chrome introduce 'Skills': gestione semplificata dei workflow AI

Google Chrome lancia "Skills", una nuova funzionalità che permette agli utenti di scoprire, salvare e riutilizzare istantaneamente workflow basati su prompt AI. Questa innovazione mira a semplificare l'interazione con i Large Language Models, offrend...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-14 • Tom's Hardware

Meta: un clone AI di Mark Zuckerberg per interagire con i dipendenti

Meta starebbe sviluppando un clone AI di Mark Zuckerberg, un avatar 3D fotorealistico capace di interagire con i dipendenti. La notizia, riportata da fonti interne, evidenzia l'interesse crescente per le applicazioni di intelligenza artificiale perso...

#Hardware #LLM On-Premise #DevOps

2026-04-14 • MIT Technology Review

AI: Una Nuova Lista Annuale per Orientarsi nel Panorama Tecnologico Attuale

Una prestigiosa pubblicazione tech ha annunciato il lancio di una nuova lista annuale, "10 Cose Che Contano nell'AI Ora", in risposta alla crescente rilevanza dell'intelligenza artificiale. La lista, che sarà presentata il 21 aprile 2026, si propone ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-14 • TechWire Asia

Una strategia AI va oltre il chatbot: l'intelligenza di sistema per l'efficienza operativa

Molte aziende chiedono un chatbot, ma la vera esigenza risiede nell'implementazione di una 'systems intelligence'. Questo approccio, basato su middleware AI agentico, integra i sistemi aziendali per automatizzare flussi di lavoro complessi, superando...

#LLM On-Premise #DevOps

2026-04-14 • The Next Web

Meta sviluppa un clone digitale di Zuckerberg basato su AI per i dipendenti

Meta sta creando una versione AI fotorealistica di Mark Zuckerberg, addestrata sulle sue maniere, il tono e il pensiero strategico. Questo personaggio digitale, che Zuckerberg stesso sta testando, è destinato ai dipendenti e si distingue da un altro ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-14 • DigiTimes

L'era degli agenti AI ridefinisce i motori di ricerca: investimenti e piattaforme in evoluzione

Il settore dei motori di ricerca sta vivendo una trasformazione significativa con l'avvento degli agenti AI. Questo cambiamento, che promette interazioni più proattive e personalizzate, è evidenziato da movimenti di mercato come il finanziamento di 1...

#Hardware #LLM On-Premise #DevOps

2026-04-14 • ArXiv cs.CL

Migliorare il rilevamento multilingue del linguaggio d'odio con dati web e LLM in ensemble

Una recente ricerca esplora l'efficacia di dati web non etichettati su larga scala e annotazioni sintetiche generate da LLM per il rilevamento del linguaggio d'odio multilingue. Lo studio dimostra che il pre-training continuo di modelli BERT e l'uso ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-14 • ArXiv cs.CL

Modelli Linguistici Autocalibranti: SECL Migliora l'Affidabilità degli LLM

La ricerca introduce SECL, una pipeline di test-time training che affronta l'eccessiva confidenza degli LLM. Sfruttando un segnale interno di calibrazione, SECL riduce l'Errore di Calibrazione Atteso (ECE) del 56-78% senza dati etichettati o supervis...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-14 • ArXiv cs.LG

Fairboard: un framework per valutare l'equità dei modelli AI in sanità

Nonostante l'ampia adozione di dispositivi AI in ambito medico, la valutazione formale dell'equità dei modelli rimane una rarità. Una ricerca ha analizzato 18 modelli open-source per la segmentazione di tumori cerebrali, evidenziando come fattori leg...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-14 • ArXiv cs.LG

La Connessione Profonda tra Attenzione e Diffusione nei Modelli AI

Una nuova ricerca svela un legame matematico unificante tra i meccanismi di attenzione dei Transformer, le mappe di diffusione e i Laplaciani magnetici. Questi approcci, solitamente trattati come distinti, sono presentati come diverse manifestazioni ...

#Hardware #LLM On-Premise #DevOps

2026-04-14 • ArXiv cs.AI

Analisi dei log nei sistemi AI: una pipeline standardizzata per la riproducibilità

I sistemi di intelligenza artificiale generano volumi significativi di log, essenziali per comprendere il comportamento e le capacità dei modelli. Nonostante l'importanza, manca un approccio standardizzato all'analisi. Una nuova proposta introduce un...

#Hardware #LLM On-Premise #DevOps

2026-04-14 • ArXiv cs.AI

LABBench2: Un Nuovo Benchmark per Valutare l'AI nella Ricerca Biologica

LABBench2 emerge come un'evoluzione del benchmark LAB-Bench, progettato per misurare le capacità reali dei sistemi di intelligenza artificiale nella ricerca scientifica, in particolare in biologia. Con quasi 1.900 task, offre contesti più realistici ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-13 • The Register AI

Claude di Anthropic sotto esame: tra calo di qualità, costi e un recente disservizio

Il Large Language Model Claude di Anthropic, un tempo apprezzato dagli sviluppatori, sta affrontando crescenti critiche. Utenti segnalano un percepibile calo nella qualità delle risposte e preoccupazioni sui costi. Un recente "major outage" ha ulteri...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-13 • The Next Web

Il paradosso Anthropic: banche esortate a usare l'AI, mentre il Pentagono la combatte

L'amministrazione Trump esorta le principali banche di Wall Street, inclusa JPMorgan Chase, a testare il modello AI Mythos di Anthropic per vulnerabilità di cybersecurity. Questa direttiva emerge nonostante il Pentagono stia contemporaneamente combat...

#LLM On-Premise #DevOps

2026-04-13 • The Register AI

ServiceNow e la strategia di integrazione dell'AI: implicazioni per l'impresa

ServiceNow sta integrando l'intelligenza artificiale in ogni aspetto delle sue offerte, come dichiarato dal SVP John Aisien. Questa mossa strategica evidenzia la crescente tendenza delle aziende a infondere capacità AI nelle proprie soluzioni enterpr...

#Hardware #LLM On-Premise #DevOps

2026-04-13 • Phoronix

LLM e Spack: opportunità e sfide nella gestione dei pacchetti HPC

I Large Language Models (LLM) stanno dimostrando la loro utilità nella generazione di pacchetti per Spack, il gestore di software ampiamente adottato negli ambienti HPC e supercomputing. Nonostante la nicchia specifica di Spack, l'impiego degli LLM i...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-13 • The Register AI

Anthropic modifica la cache di Claude Code: utenti segnalano costi più alti

Anthropic ha ridotto il Time To Live (TTL) della cache dei prompt per Claude Code da un'ora a cinque minuti. Nonostante l'azienda affermi che ciò non dovrebbe aumentare i costi, diversi sviluppatori riportano un esaurimento significativamente più rap...

#Hardware #LLM On-Premise #DevOps

2026-04-13 • The Register AI

Microsoft riposiziona Copilot in Notepad: l'AI si sposta dagli strumenti principali

Microsoft sta modificando l'interfaccia di Notepad, rimuovendo Copilot dalla barra degli strumenti principale. Le funzionalità basate sull'intelligenza artificiale rimarranno disponibili, ma saranno ora accessibili tramite un menu dedicato, denominat...

#LLM On-Premise #DevOps

2026-04-13 • Ars Technica AI

Meta sviluppa un'AI di Mark Zuckerberg per l'interazione interna

Meta sta creando una versione basata su intelligenza artificiale di Mark Zuckerberg, destinata a interagire con i dipendenti. Questa iniziativa rientra in una strategia aziendale più ampia volta a riorientare il colosso tecnicico verso l'AI, con un f...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-13 • OpenAI Blog

Cloudflare potenzia gli agenti AI aziendali con i modelli OpenAI

Cloudflare integra i modelli GPT-5.4 e Codex di OpenAI nella sua piattaforma Agent Cloud. L'iniziativa mira a consentire alle aziende di sviluppare, rilasciare e scalare agenti AI per compiti reali, garantendo velocità e sicurezza. Questo approccio o...

#Hardware #LLM On-Premise #DevOps

2026-04-13 • Ars Technica AI

LLM e didattica online: la sfida dell'engagement nell'era di ChatGPT

Un docente universitario condivide le difficoltà incontrate nella didattica online asincrona a causa dell'avvento di Large Language Models come ChatGPT. L'esperienza, un tempo gratificante, è diventata complessa, sollevando interrogativi sull'autenti...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-13 • LocalLLaMA

LLM locali: emerge una nuova categoria di modelli per il deployment on-premise

Il panorama dei Large Language Models è in continua evoluzione, con l'emergere di nuove “categorie di peso” che ridefiniscono le possibilità per i deployment locali e self-hosted. Questa tendenza suggerisce un cambiamento verso modelli più efficienti...

#Hardware #LLM On-Premise #DevOps

2026-04-13 • OpenAI Blog

LLM per la finanza: tra efficienza operativa e sovranità dei dati

L'integrazione degli LLM nei team finanziari promette di rivoluzionare processi come la rendicontazione, l'analisi dei dati e la previsione. Tuttavia, l'adozione di queste tecnicie in un settore così sensibile solleva interrogativi cruciali sulla sov...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-13 • OpenAI Blog

LLM per i manager: efficienza operativa e considerazioni sul deployment

L'adozione di Large Language Models (LLM) sta trasformando le pratiche manageriali, offrendo strumenti per migliorare la preparazione, la comunicazione e l'organizzazione. Tuttavia, per le aziende, l'integrazione di queste tecnicie solleva questioni ...

#Hardware #LLM On-Premise #DevOps

2026-04-13 • OpenAI Blog

Personalizzazione degli LLM: istruzioni e memoria per risposte mirate

La personalizzazione degli LLM tramite istruzioni e memoria è fondamentale per ottenere risposte più pertinenti, coerenti e su misura. Questi meccanismi permettono di affinare il comportamento dei modelli, un aspetto cruciale per le aziende che cerca...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-13 • LocalLLaMA

Gemma 4 sotto esame: un'analisi diagnostica svela un difetto sistemico nell'attenzione

Un'analisi indipendente ha rivelato un difetto sistemico nel modello Gemma 4 26B A4B (Q8_0) di Unsloth. Utilizzando un metodo diagnostico avanzato, sono stati identificati 29 tensor con "distribution drift", di cui 21 negli strati di attenzione. I va...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-13 • LocalLLaMA

NVIDIA RTX PRO 6000 Blackwell: i benchmark di MiniMax-M2.7 NVFP4 su dual-GPU

Un recente benchmark ha esplorato le performance del Large Language Model MiniMax-M2.7, nella sua versione quantizzata NVFP4, su una configurazione self-hosted equipaggiata con due GPU NVIDIA RTX PRO 6000 Blackwell. I risultati evidenziano un through...

#Hardware #LLM On-Premise #DevOps

2026-04-13 • LocalLLaMA

Gemma 4: la riluttanza all'uso degli strumenti nei deployment locali

Un utente di `llama.cpp` ha evidenziato una persistente riluttanza del modello Gemma 4 (nella versione 26b MoE con quantization UD_Q4_K_XL) nell'utilizzare strumenti di ricerca web, anche con istruzioni esplicite. Il modello tende a basarsi sulla pro...

#LLM On-Premise #DevOps

2026-04-13 • ArXiv cs.CL

SynDocDis: LLM per dialoghi medici sintetici e conformi alla privacy

SynDocDis è un nuovo framework che sfrutta i Large Language Models per generare dialoghi sintetici tra medici, colmando un vuoto nella ricerca AI in ambito clinico. Affronta le stringenti normative sulla privacy combinando prompting strutturato e met...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-13 • ArXiv cs.CL

L'evoluzione degli ecosistemi testuali: drift e selezione nei Large Language Models

Un nuovo studio esplora come i Large Language Models (LLM) che apprendono dai propri output stiano modificando il corpus testuale pubblico. La ricerca introduce un framework matematico che identifica due forze principali: il 'drift', che rimuove le f...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-13 • ArXiv cs.LG

GNN-as-Judge: LLM e GNN insieme per l'apprendimento su grafi con poche risorse

Un nuovo framework, GNN-as-Judge, mira a superare i limiti degli LLM nell'apprendimento semi-supervisionato su grafi con attributi testuali (TAG) in contesti a basse risorse. Integrando il bias strutturale delle GNN, il sistema genera pseudo-etichett...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-13 • ArXiv cs.AI

Dalle simulazioni ontologiche a decisioni AI aziendali verificabili

Un nuovo approccio, LOM-action, mira a risolvere la carenza di fondamento e tracciabilità nelle decisioni degli agenti LLM aziendali. Attraverso una simulazione ontologica guidata dagli eventi in un ambiente isolato, il sistema genera decisioni basat...

#LLM On-Premise #DevOps

2026-04-13 • ArXiv cs.AI

OpenKedge: Governance e Sicurezza per Agenti AI Autonomi

OpenKedge è un protocollo innovativo che affronta le vulnerabilità delle architetture basate su API nell'esecuzione di mutazioni di stato da parte di agenti AI autonomi. Invece di un'esecuzione immediata, OpenKedge propone un processo governato: gli ...

#LLM On-Premise #DevOps

2026-04-13 • LocalLLaMA

OLMo-3 7B Instruct: un esperimento di Quantization a 1-bit su GPU B200

Un ricercatore ha condotto un esperimento per quantizzare il modello OLMo-3 7B Instruct in un formato a 1-bit, utilizzando la distillazione consapevole della quantization su quattro GPU B200. Nonostante i vincoli di budget abbiano interrotto prematur...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-13 • LocalLLaMA

Qwen3: Supporto Audio e Visione per i Modelli Omni e ASR in Formato GGUF

Il supporto per l'input audio è ora disponibile per i modelli Qwen3-Omni-MoE e Qwen3-ASR, con il modello Omni che integra anche capacità di visione. Questa novità, resa possibile dall'integrazione nel formato GGUF tramite il progetto `llama.cpp`, apr...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • LocalLLaMA

Assistenti Personali con LLM: Oltre il Coding, le Sfide del Deployment Locale

Un utente di Reddit solleva un dibattito sulla creazione di assistenti personali basati su LLM, in contrasto con gli agenti di coding. L'attenzione si sposta sulla gestione della memoria dei modelli e sulle modalità di deployment locale, evidenziando...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-12 • LocalLLaMA

GLM 5.1 si afferma nei benchmark di ragionamento sociale, offrendo un'alternativa competitiva

Un recente benchmark personalizzato ha messo in luce le capacità del modello GLM 5.1, posizionandolo in linea con i Large Language Models di frontiera nel ragionamento sociale. Il modello dimostra non solo prestazioni notevoli in un complesso gioco d...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • LocalLLaMA

Minimax 2.7: Agenti LLM in Locale su M3 Ultra con Prestazioni Notevoli

Un recente test ha dimostrato l'efficienza di Minimax 2.7 nell'esecuzione di sub-agenti LLM in locale su un sistema M3 Ultra. L'implementazione, che sfrutta `llama.cpp` e una quantization `IQ2_XXS UD`, ha evidenziato la capacità di gestire carichi di...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • The Next Web

OpenAI introduce un nuovo piano ChatGPT Pro da 100 dollari, mirando a Claude Max

OpenAI ha annunciato un nuovo piano ChatGPT Pro da 100 dollari al mese, disponibile dal 9 aprile 2026. Questa nuova offerta si posiziona tra i piani Plus e Pro esistenti, con l'obiettivo di competere direttamente con Claude Max di Anthropic, anch'ess...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • LocalLLaMA

llama.cpp integra il supporto Speech-to-Text per i modelli Gemma-4

Il progetto open source llama.cpp, noto per l'inference efficiente di Large Language Models su hardware locale, ha annunciato l'integrazione del supporto Speech-to-Text (STT). Questa nuova funzionalità è compatibile con i modelli Gemma-4 E2A ed E4A, ...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • LocalLLaMA

Nuovo supporto audio per Gemma 4 in mtmd: implicazioni per i deployment locali

Il progetto `mtmd`, parte dell'ecosistema `llama.cpp`, ha introdotto il supporto per l'elaborazione audio dei modelli Gemma 4 di Google. Questo sviluppo è significativo per l'abilitazione di capacità multimodali su infrastrutture locali, offrendo nuo...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • TechCrunch AI

La Terminologia degli LLM: Una Guida Essenziale per le Decisioni Strategiche

L'avanzamento dell'intelligenza artificiale ha introdotto un vasto lessico di nuovi termini. Per i decision-maker tech, comprendere queste definizioni è cruciale per navigare le complessità del settore, valutare le architetture di deployment e prende...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-12 • The Next Web

L'importanza della qualità dei dati nei deployment AI su larga scala

La qualità dei dati è spesso un aspetto trascurato nelle architetture complesse, con team che investono mesi nello sviluppo di funzionalità e pipeline. Tuttavia, la scoperta tardiva di anomalie, spesso segnalate da figure non tecniche, comporta un au...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-12 • TechCrunch AI

Claude di Anthropic al centro del dibattito alla HumanX Conference

Alla conferenza HumanX di San Francisco, incentrata sull'intelligenza artificiale, il Large Language Model Claude di Anthropic ha catalizzato l'attenzione. La sua prominenza sottolinea l'importanza crescente degli LLM nel panorama tecnicico e le comp...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-12 • The Register AI

Sviluppo software assistito da AI: efficacia, disagi e implicazioni infrastrutturali

Lo sviluppo software assistito dall'intelligenza artificiale sta rapidamente trasformando il settore, offrendo nuove metodologie come la "vibe coding". Sebbene l'efficacia di questi strumenti sia innegabile, emergono anche disagi legati alla loro ado...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-12 • LocalLLaMA

MiniMax m2.7: LLM on-premise su Mac con prestazioni notevoli

Il modello MiniMax m2.7 emerge come una soluzione interessante per l'esecuzione di Large Language Models (LLM) in locale su hardware Apple Mac. Disponibile in versioni da 63GB e 89GB, ha dimostrato prestazioni competitive sul benchmark MMLU 200q, rag...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • Tom's Hardware

Linux definisce le regole per il codice generato dall'IA: sì a Copilot, no alla bassa qualità

Il kernel Linux ha stabilito nuove direttive per l'integrazione di codice generato dall'intelligenza artificiale. Dopo mesi di dibattito, Linus Torvalds e i maintainer hanno raggiunto un accordo che accetta strumenti come Copilot, ma rifiuta contribu...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-12 • LocalLLaMA

Decodifica Speculativa: Gemma 4 31B accelera l'Inference On-Premise con RTX 5090

La decodifica speculativa, applicata al modello Gemma 4 31B con Gemma 4 E2B come draft, ha dimostrato un incremento medio del 29% nella velocità di inference su hardware on-premise. Testato su una RTX 5090 con 32GB di VRAM, questo approccio ha raggiu...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • The Register AI

Il divario crescente tra AI di frontiera ed esigenze aziendali spinge i modelli open weights al centro dell'attenzione

La primavera porta una nuova ondata di modelli AI open weights da giganti come Google, Microsoft, Alibaba e Nvidia. Tuttavia, il mercato aziendale cerca soluzioni che siano efficaci, economiche e garantiscano la sovranità dei dati, evidenziando un di...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-12 • LocalLLaMA

Unsloth MiniMax M2.7: Nuove Quantizzazioni GGUF per Deployment Efficienti

Unsloth ha rilasciato su Hugging Face una serie di versioni quantizzate del suo LLM MiniMax M2.7. Queste varianti, che spaziano da 1-bit a BF16, offrono diverse opzioni per ottimizzare l'impronta di memoria e le prestazioni, facilitando il deployment...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • OpenAI Blog

Compromissione degli strumenti di sviluppo: la risposta di OpenAI

OpenAI ha reagito a un attacco alla supply chain che ha interessato gli strumenti di sviluppo, implementando la rotazione dei certificati di firma del codice macOS e aggiornando le proprie applicazioni. L'azienda ha rassicurato che l'incidente non ha...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • LocalLLaMA

MiniMax M2.7: Pesi Aperti, Licenza Chiusa. Un Dilemma per il Deployment Enterprise

Il modello MiniMax M2.7, pur rendendo disponibili i suoi "pesi", impone una licenza restrittiva che vieta l'uso commerciale e militare senza esplicita autorizzazione. Questa politica, che include servizi a pagamento e API commerciali, solleva interro...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-12 • LocalLLaMA

MiniMax-M2.7 debutta: un nuovo LLM per deployment locali

MiniMaxAI ha rilasciato MiniMax-M2.7, un nuovo Large Language Model ora disponibile su Hugging Face. L'annuncio, proveniente dalla comunità r/LocalLLaMA, suggerisce un focus sui deployment on-premise. Questo modello si inserisce nel crescente panoram...

#Hardware #LLM On-Premise #DevOps

2026-04-12 • LocalLLaMA

Minimax M2.7: Un Nuovo LLM per le Infrastrutture Locali

Il rilascio di Minimax M2.7 introduce un nuovo Large Language Model nel panorama dell'intelligenza artificiale. Questo modello si posiziona come un'opzione rilevante per le aziende che esplorano deployment self-hosted, offrendo potenziali vantaggi in...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-12 • LocalLLaMA

Innovazione architetturale negli LLM: K-Splanifolds per decoder più efficienti

Un ricercatore ha sperimentato una nuova architettura per i decoder degli LLM, sostituendo i tradizionali MLP con una geometria di varietà spline discreta a bassa dimensionalità, descritta nel paper K-Splanifolds. Il modello da 18 milioni di parametr...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-11 • LocalLLaMA

Gemma 4 ridefinisce l'inference LLM locale: prestazioni e affidabilità su hardware modesto

Google ha rilasciato Gemma 4, un LLM che sta rapidamente guadagnando attenzione per le sue prestazioni sorprendenti in ambienti self-hosted. Nonostante le sue dimensioni (26B), il modello offre velocità paragonabili a quelle di LLM molto più piccoli ...

#Hardware #LLM On-Premise #DevOps

2026-04-11 • Phoronix

AMD GAIA: Agenti AI Personalizzati Via Chat e Deployment Desktop Multi-Piattaforma

AMD prosegue lo sviluppo di GAIA, il suo progetto basato sull'SDK Lemonade, introducendo la possibilità di creare agenti AI personalizzati tramite interazione conversazionale. GAIA si evolve in una vera applicazione desktop, semplificando il suo depl...

#Hardware #LLM On-Premise #DevOps

2026-04-11 • LocalLLaMA

Gemma 4 26B A4B: Robustezza e Coerenza con Finestre di Contesto Estese in Locale

Un recente test ha dimostrato la notevole capacità del modello Gemma 4 26B A4B di gestire finestre di contesto estremamente ampie, mantenendo coerenza e rapidità di risposta in un ambiente self-hosted. Utilizzando `llama.cpp` e specifiche configurazi...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-11 • LocalLLaMA

Alibaba ridefinisce la strategia AI: priorità ai ricavi sull'Open Source

Alibaba, il gigante tecnicico cinese, starebbe spostando la propria strategia nel campo dell'intelligenza artificiale. Secondo un report del Financial Times, l'azienda intende dare priorità alla generazione di ricavi rispetto al precedente approccio ...

#LLM On-Premise #DevOps

2026-04-11 • LocalLLaMA

GLM: Nessun piano per versioni più compatte dei Large Language Models

La community tech sta monitorando l'evoluzione dei modelli GLM, in particolare la versione 5.1. Recentemente è emerso che non ci sono piani attuali per il rilascio di versioni più piccole di questi LLM, una notizia che ha implicazioni significative p...

#Hardware #LLM On-Premise #DevOps

2026-04-11 • LocalLLaMA

DFlash Speculative Decoding su Apple Silicio: prestazioni fino a 3.3x con MLX

Un nuovo sviluppo implementa il DFlash speculative decoding su Apple Silicio, utilizzando il framework MLX. I test su un M5 Max con 64GB di memoria unificata mostrano un incremento di velocità fino a 3.3 volte rispetto al baseline per modelli come Qw...

#Hardware #LLM On-Premise #DevOps

Large Language Models (LLM) e Agenti AI

Articoli Correlati