Agenti AI e Sviluppo Avanzato di LLM

2026-05-06 • TechCrunch AI

L'AI rivoluziona la ristorazione: Wonder progetta 'fabbriche di ristoranti' con LLM

Marc Lore di Wonder prevede un futuro in cui l'intelligenza artificiale permetterà a chiunque di avviare un'attività di ristorazione virtuale. L'azienda intende trasformare le cucine robotiche in "fabbriche di ristoranti" gestite dall'AI, dove la cre...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-06 • The Register AI

Agenti AI su AWS WorkSpaces: il costo di 500.000 token per interazione

AWS ha abilitato l'uso di agenti AI all'interno dei suoi ambienti WorkSpaces, desktop virtuali basati su cloud. Un benchmark interno suggerisce che l'interazione tramite API è più efficiente e meno costosa rispetto all'automazione basata su interfacc...

#Hardware #LLM On-Premise #DevOps

2026-05-06 • ArXiv cs.CL

LLM: i modelli di ragionamento faticano ancora con le presupposizioni errate

Una nuova ricerca esamina la capacità dei Large Reasoning Models (LRM) di gestire presupposizioni errate nelle query degli utenti. Sebbene i modelli di ragionamento mostrino un'accuratezza leggermente superiore (2-11%) rispetto agli LLM tradizionali,...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-06 • ArXiv cs.CL

Autoverifica dei Large Language Models: un segnale di fiducia condizionale

Uno studio recente esplora l'efficacia dell'autoverifica nei Large Language Models come segnale di fiducia condizionale. La ricerca confronta questo approccio con baselines basate sulla probabilità, rivelando che la sua utilità dipende fortemente dal...

#LLM On-Premise #DevOps

2026-05-06 • ArXiv cs.AI

Agenti AI per la Sostenibilità delle PMI: Un Framework ESG Innovativo

Uno studio introduce un framework basato su agenti AI e Large Language Models per valutare le performance ESG delle PMI europee. Il sistema, costruito sulla piattaforma n8n, automatizza la classificazione ESG e genera raccomandazioni contestuali, dim...

#LLM On-Premise #DevOps

2026-05-06 • DigiTimes

DeepSeek ritira un paper multimodale: un nuovo approccio al ragionamento visivo

DeepSeek ha brevemente rilasciato e poi ritirato un paper che descrive un innovativo approccio al ragionamento visivo per i Large Language Models multimodali. L'episodio, riportato dal team leader Chen Xiaokang, solleva interrogativi sulle strategie ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-05 • Tech in Asia

Workflow AI a più fasi: la sfida della stabilità e dell'automazione

Abhishek Das di Yutori sottolinea come l'automazione basata su workflow AI complessi richieda standard rigorosi, non un'eccessiva fiducia nella pazienza degli utenti. La costruzione di sistemi affidabili impone un approccio metodico per superare le s...

#Hardware #LLM On-Premise #DevOps

2026-05-05 • The Register AI

Anthropic porta Claude nel settore finanziario: agenti AI e la sfida dell'accuratezza

Anthropic sta esplorando l'applicazione del suo LLM Claude nel settore finanziario, introducendo "agenti" capaci di supportare operazioni complesse. Questa mossa solleva questioni cruciali sull'accuratezza e l'affidabilità dei modelli AI in contesti ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-05 • LocalLLaMA

Qwen3.6 e l'interfaccia utente: massimizzare la produttività con agenti locali

Un'analisi rivela come la scelta dell'interfaccia utente o "harness" sia cruciale per le prestazioni degli LLM. L'integrazione di Qwen3.6 35B con `pi.dev` su una macchina locale, affiancata da strumenti come Exa web search, trasforma il modello in un...

#Hardware #LLM On-Premise #DevOps

2026-05-05 • TechCrunch AI

OpenAI introduce GPT-5.5 Instant: il nuovo modello predefinito per ChatGPT

OpenAI ha annunciato il rilascio di GPT-5.5 Instant, un nuovo Large Language Model destinato a diventare il modello predefinito per ChatGPT. Questa mossa segna un'evoluzione nell'offerta di OpenAI, sostituendo il precedente GPT-3.5 Instant. L'aggiorn...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-05 • OpenAI Blog

GPT-5.5 Instant: l'evoluzione del modello predefinito di ChatGPT

OpenAI ha introdotto GPT-5.5 Instant, un aggiornamento significativo per il modello predefinito di ChatGPT. Questa versione promette risposte più intelligenti e accurate, una drastica riduzione delle "allucinazioni" e controlli di personalizzazione a...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-05 • LocalLLaMA

ProgramBench: i Large Language Models possono davvero ricreare software complessi?

Un nuovo benchmark, ProgramBench, sfida i Large Language Models a costruire programmi completi da zero in un ambiente strettamente isolato. Con 200 task e milioni di test comportamentali, il progetto mira a valutare rigorosamente le capacità degli ag...

#Hardware #LLM On-Premise #DevOps

2026-05-05 • The Next Web

Anthropic potenzia Claude per la finanza con agenti e integrazioni Moody's

Anthropic ha presentato Claude Opus 4.7, una suite di agenti finanziari pre-costruiti e un'integrazione nativa con Moody's, coprendo milioni di aziende. L'annuncio, avvenuto dopo una joint venture da 1,5 miliardi di dollari, evidenzia l'accelerazione...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-05 • The Next Web

Editori citano in giudizio Meta per Llama: nuove prove di pirateria

Cinque importanti editori, affiancati dall'autore Scott Turow, hanno intentato una class action contro Meta a Manhattan. L'accusa è di aver utilizzato milioni di opere protette da copyright per addestrare il modello Llama senza autorizzazione. Questa...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-05 • TechCrunch AI

CopilotKit raccoglie 27 milioni di dollari per facilitare il deployment di agenti AI nativi nelle app

La startup di Seattle CopilotKit ha chiuso un round di finanziamento Series A da 27 milioni di dollari. L'investimento, guidato da Glilot Capital, NFX e SignalFire, mira a supportare gli sviluppatori nel deployment di agenti AI integrati direttamente...

#LLM On-Premise #DevOps

2026-05-05 • The Register AI

SAP acquisisce Dremio per potenziare l'integrazione dati e gli agenti AI

SAP, leader nel settore ERP, ha acquisito Dremio, fornitore di soluzioni per l'integrazione e l'analisi dei dati. L'operazione mira a estendere le capacità di analytics e di sviluppo di agenti AI di SAP verso fonti dati esterne, consolidando l'approc...

#Hardware #LLM On-Premise #DevOps

2026-05-05 • The Next Web

I fondatori di IronSource scommettono sugli agenti AI per rivoluzionare l'ad tech

Dopo aver venduto IronSource a Unity per 4,4 miliardi di dollari nel 2022 e aver assistito allo smantellamento della loro rete pubblicitaria, i fondatori tornano con una nuova impresa. La loro visione è che gli agenti AI sostituiranno gli acquirenti ...

#LLM On-Premise #DevOps

2026-05-05 • The Register AI

Un esperimento con agenti AI autonomi rivela rischi per la sicurezza dei dati

La matematica britannica Professor Hannah Fry ha condotto un esperimento cautelativo, fornendo a un agente AI una carta di credito e una serie di compiti. L'iniziativa ha evidenziato sia le potenzialità che i pericoli intrinseci della tecnicia agenti...

#Hardware #LLM On-Premise #DevOps

2026-05-05 • Tech.eu

Elastics ottiene 2 milioni di dollari per agenti AI nei mercati di previsione

La startup Elastics, con sede a Varsavia, ha completato un round di finanziamento pre-seed da 2 milioni di dollari. L'azienda è impegnata nello sviluppo di un'infrastruttura basata su intelligenza artificiale per il trading quantitativo, con l'obiett...

#LLM On-Premise #DevOps

2026-05-05 • LocalLLaMA

Peanut: un nuovo modello Text-to-Image con pesi aperti in arrivo

Un nuovo modello Text-to-Image, denominato Peanut, ha fatto il suo debutto posizionandosi all'ottavo posto nell'Artificial Analysis Text to Image Arena. L'attesa è alta per il rilascio imminente dei suoi pesi aperti, che lo proietterebbero a diventar...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-05 • ArXiv cs.LG

Agentopic: LLM e agenti AI per la modellazione di argomenti spiegabile e controllabile

Agentopic introduce un workflow basato su agenti AI per la modellazione di argomenti, sfruttando le capacità di ragionamento dei Large Language Models (LLM). Il sistema mira a superare la mancanza di trasparenza dei metodi tradizionali, offrendo spie...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-05 • ArXiv cs.CL

Analisi della Perplessità: un metodo per svelare gli obiettivi di Finetuning degli LLM

Un nuovo metodo basato sulla differenza di perplessità promette di rivelare gli obiettivi di finetuning dei Large Language Models. Questa tecnica, che non richiede accesso agli interni del modello o assunzioni pregresse, è cruciale per identificare c...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-05 • ArXiv cs.CL

H-Probes: Svelare le Strutture Gerarchiche Nelle Rappresentazioni Latenti degli LLM

Una nuova ricerca introduce le H-probes, strumenti progettati per estrarre e analizzare le strutture gerarchiche presenti nelle rappresentazioni latenti dei Large Language Models (LLM). Questo studio rivela come gli LLM non solo gestiscano il ragiona...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-05 • ArXiv cs.AI

AgentReputation: Un Nuovo Framework per la Reputazione nell'AI Agente Decentralizzata

Un nuovo framework, AgentReputation, affronta le sfide della gestione della reputazione nei marketplace di AI agente decentralizzati. Proposto per sistemi che operano senza supervisione centralizzata, il framework a tre strati separa esecuzione dei t...

#LLM On-Premise #DevOps

2026-05-05 • OpenAI Blog

OpenAI e PwC: agenti AI per trasformare la funzione del CFO

OpenAI e PwC hanno stretto una partnership strategica per supportare le aziende nell'adozione di agenti AI. L'obiettivo è automatizzare i flussi di lavoro finanziari, migliorare le previsioni, rafforzare i controlli interni e modernizzare il ruolo de...

#Hardware #LLM On-Premise #DevOps

2026-05-05 • LocalLLaMA

Un ponte tra LLM proprietari e Open Source: l'iniziativa di un utente per i dataset

Un utente con accesso privilegiato a modelli LLM proprietari di frontiera ha lanciato un'iniziativa per generare dataset di alta qualità. L'obiettivo è supportare la comunità Open Source, migliorando i modelli aperti attraverso il Fine-tuning. La col...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-05 • LocalLLaMA

vLLM integra la correzione TurboQuant per i modelli Qwen 3.5+

Il framework vLLM ha integrato una correzione cruciale per la funzionalità TurboQuant, risolvendo un errore 'Not Implemented' che affliggeva i modelli Qwen 3.5+ a causa dei layer Mamba. Questo aggiornamento migliora la compatibilità e l'efficienza ne...

#Hardware #LLM On-Premise #DevOps

2026-05-04 • The Next Web

Dubai impone una scadenza al settore privato per l'adozione dell'AI agentica

Mentre la maggior parte dei governi elabora strategie AI con roadmap pluriennali e senza scadenze definite, Dubai ha adottato un approccio distintivo. Il Principe Ereditario Sheikh Hamdan bin Mohammed bin Rashid Al Maktoum ha lanciato un'iniziativa c...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-04 • The Next Web

Haun Ventures raccoglie 1 miliardo per crypto e blockchain, puntando sugli agenti AI in finanza

Haun Ventures, la società di venture capital guidata da Katie Haun, ha annunciato la raccolta di un miliardo di dollari per due nuovi fondi. Il capitale sarà destinato a investimenti in aziende del settore crypto e blockchain nei prossimi due o tre a...

#Hardware #LLM On-Premise #DevOps

2026-05-04 • TechCrunch AI

Modelli AI visivi: il motore di crescita delle app, ma la monetizzazione resta una sfida

Secondo un'analisi di Appfigures, i lanci di applicazioni che integrano modelli di intelligenza artificiale visiva stanno generando un aumento significativo nei download, superando l'impatto degli aggiornamenti basati su chatbot. Nonostante un increm...

#Hardware #LLM On-Premise #DevOps

2026-05-04 • LocalLLaMA

TinyMozart v2: Un LLM da 85M Parametri per la Generazione Musicale MIDI

LH-Tech-AI ha rilasciato TinyMozart v2, un Large Language Model da 85 milioni di parametri specializzato nella generazione incondizionata di arrangiamenti pianistici MIDI. Questa nuova versione, migliorata rispetto alla precedente, include funzionali...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-04 • LocalLLaMA

Assistant_Pepe_32B: Il fine-tuning di Qwen che simula un'interazione umana

Un nuovo LLM, Assistant_Pepe_32B, basato su Qwen3-32B, emerge con una peculiarità notevole: un comportamento "umano" ottenuto tramite fine-tuning. Nonostante le difficoltà nell'ottimizzare Qwen3-32B al di fuori degli ambiti STEM, il modello è stato i...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-04 • LocalLLaMA

Raffinamento bidirezionale: un loop per potenziare i Large Language Models compatti

Un ricercatore ha sperimentato un innovativo meccanismo di raffinamento per i Large Language Models, introducendo un piccolo transformer che rielabora l'output finale e lo reintroduce all'inizio del processo generativo. Questo approccio, ispirato a s...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-03 • LocalLLaMA

LLM Open Source: il divario di performance con i modelli all'avanguardia persiste?

Il dibattito sulla qualità degli LLM open source e il loro ritardo rispetto ai modelli proprietari di frontiera continua. Si discute se il divario di 6-12 mesi sia ancora valido, specialmente per lo sviluppo di agenti autonomi, e quali implicazioni c...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-03 • Phoronix

Google Summer of Code 2026: L'AI e gli LLM al centro dei progetti Open Source

Google ha annunciato i progetti selezionati per il Summer of Code 2026, un'iniziativa che supporta gli sviluppatori studenti nello sviluppo di software Open Source. Quest'anno, una parte significativa dei progetti si concentra sull'adozione di intell...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-03 • LocalLLaMA

GPT 5.5-medium: un'occhiata inattesa al "flusso di pensiero" interno

Un utente ha riportato un'insolita sequenza di testo generata da GPT 5.5-medium tramite codex, che sembra rivelare il processo di ragionamento interno del modello. Questo "flusso di pensiero" frammentato solleva interrogativi sulla trasparenza e la p...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-02 • LocalLLaMA

hfviewer.com: uno strumento per esplorare le architetture dei Large Language Models

È stato lanciato hfviewer.com, un nuovo strumento web che offre una visualizzazione interattiva delle architetture dei Large Language Models ospitati su Hugging Face. La piattaforma permette a sviluppatori e architetti di sistema di comprendere e con...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-02 • LocalLLaMA

Quadtrix.cpp: un LLM Transformer da zero in C++17, addestrato su CPU

Un ingegnere ha sviluppato Quadtrix.cpp, un LLM Transformer completo in C++17, senza dipendenze esterne oltre la libreria standard. Il modello da 0.83M parametri è stato addestrato su una singola CPU in 76 minuti, dimostrando un approccio radicale al...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-02 • LocalLLaMA

Flare-TTS 28M: Un Modello Text-to-Speech Open Source Addestrato Localmente

Un nuovo modello Text-to-Speech (TTS), Flare-TTS 28M, è stato rilasciato come Open Source. Addestrato da zero su una singola GPU NVIDIA A6000 in circa 24 ore, questo progetto evidenzia le capacità di sviluppo locale di LLM. Sebbene la qualità vocale ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-02 • LocalLLaMA

Unsloth e Mistral risolvono un bug critico nell'inference di Mistral Medium 3.5

Unsloth, in collaborazione con Mistral, ha annunciato la risoluzione di un bug nell'inference del modello Mistral Medium 3.5. Il problema, legato a una peculiarità di parsing YaRN, influenzava diverse implementazioni, tra cui `transformers` e `llama....

#Hardware #LLM On-Premise #DevOps

2026-05-01 • DigiTimes

Taiwan accelera sui modelli AI multimodali con una nuova task force nazionale

Il National Science and Technology Council (NSTC) di Taiwan ha istituito una task force dedicata allo sviluppo di modelli di base di intelligenza artificiale multimodale. L'iniziativa, guidata dal ministro Cheng-Wen Wu, mira a posizionare l'isola com...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-01 • Ars Technica AI

GPT-5.5 e Mythos Preview: l'AISI valuta capacità cyber simili, oltre l'hype di settore

Anthropic ha promosso Mythos Preview come un modello con eccezionali capacità di cybersecurity, limitandone l'accesso. Tuttavia, una nuova ricerca dell'AI Security Institute (AISI) del Regno Unito rivela che GPT-5.5 di OpenAI, rilasciato pubblicament...

#LLM On-Premise #DevOps

2026-05-01 • LocalLLaMA

Rilasciato Gemma-4-31B-it-DFlash: un nuovo LLM per deployment locali

È stato annunciato il rilascio di Gemma-4-31B-it-DFlash, una nuova variante del modello Gemma di Google, ottimizzata per la lingua italiana. La sua disponibilità su Hugging Face e l'integrazione in sospeso con il framework `llama.cpp` suggeriscono un...

#Hardware #LLM On-Premise #DevOps

2026-05-01 • The Next Web

Contenuti AI su scala industriale: il modello cinese tra efficienza e costi

Mentre la Silicio Valley ha spesso immaginato la produzione di contenuti AI su vasta scala, la Cina l'ha concretizzata. Un esempio lampante è il settore dei micro-drama, dove una piattaforma di streaming ha aggiunto 50.000 titoli generati da AI in un...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-01 • ArXiv cs.CL

CL-bench Life: I Large Language Models faticano con i contesti della vita reale

Un nuovo benchmark, CL-bench Life, rivela le difficoltà dei Large Language Models nel comprendere e ragionare su contesti complessi e disordinati della vita quotidiana. Valutando dieci LLM di frontiera, la ricerca evidenzia tassi di successo molto ba...

#LLM On-Premise #DevOps

2026-05-01 • TechCrunch AI

ChatGPT Images 2.0: L'India guida l'adozione, il resto del mondo attende

ChatGPT Images 2.0 sta riscontrando un notevole successo in India, dove gli utenti lo impiegano per creare immagini personalizzate, da avatar a ritratti cinematografici. Al di fuori del subcontinente, l'adozione del servizio è ancora limitata, sugger...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-30 • The Register AI

La proliferazione degli agenti AI: la governance è cruciale per evitare il caos

Le grandi aziende si preparano a gestire migliaia di agenti AI entro il 2028, un aumento esponenziale rispetto a oggi. Senza una governance adeguata, questa crescita rapida potrebbe portare a una gestione incontrollata e a rischi operativi significat...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-30 • LocalLLaMA

Qwen 3.6: i nuovi modelli da 27B e 35B ridefiniscono il panorama degli LLM?

I recenti modelli Qwen 3.6 da 27B e 35B parametri stanno generando un dibattito significativo nel settore degli LLM. Sembrano superare i predecessori nella fascia dei ~30B, inclusi Qwen Coder 30B, GPT OSS 20B e Gemma, in particolare per lo sviluppo d...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-30 • TechCrunch AI

Stripe lancia Link: un wallet digitale per agenti AI autonomi

Stripe ha presentato Link, un nuovo wallet digitale che estende le capacità di spesa sicura anche agli agenti AI autonomi. La soluzione permette agli utenti di collegare carte, conti bancari e abbonamenti, autorizzando poi gli agenti AI a effettuare ...

#LLM On-Premise #DevOps

2026-04-30 • LocalLLaMA

DeepSeek presenta "Thinking with Visual Primitives": un nuovo framework multimodale

DeepSeek, in collaborazione con l'Università di Pechino e l'Università di Tsinghua, ha rilasciato un nuovo framework di ragionamento multimodale chiamato "Thinking with Visual Primitives". Questo approccio innovativo integra token spaziali, come punt...

#Hardware #LLM On-Premise #DevOps

2026-04-30 • Tom's Hardware

Agente AI cancella database aziendale: il recupero dati e le implicazioni per la sovranità

Un incidente ha visto un agente AI autonomo eliminare l'intero database di un'azienda. Il provider cloud è riuscito a recuperare i dati critici e ha esteso la sua policy di cancellazione ritardata, evidenziando i rischi legati all'automazione AI e l'...

#LLM On-Premise #DevOps

2026-04-30 • DigiTimes

AGI, Inc. punta all'AI agentica on-device per l'automazione cross-platform

AGI, Inc. sta portando avanti una strategia incentrata sull'intelligenza artificiale agentica eseguita direttamente sui dispositivi. L'obiettivo è abilitare l'automazione su diverse piattaforme, riducendo la dipendenza dal cloud e offrendo potenziali...

#Hardware #LLM On-Premise #DevOps

2026-04-30 • LocalLLaMA

Qwen-Scope: Introspezione profonda e controllo granulare per i modelli Qwen 3.5

Il team Qwen ha rilasciato Qwen-Scope, una suite di Sparse Autoencoders (SAE) per la famiglia di modelli Qwen 3.5. Questo strumento permette di mappare e manipolare le caratteristiche interne dei modelli, offrendo un controllo senza precedenti su con...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-30 • LocalLLaMA

L'origine dei "goblins" negli LLM: trasparenza e controllo per l'infrastruttura locale

Un recente contributo di OpenAI, intitolato "Where the goblins came from", ha suscitato interesse nella comunità tech. Sebbene i dettagli specifici non siano stati divulgati, il titolo suggerisce un'esplorazione delle dinamiche interne e dei comporta...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-30 • ArXiv cs.AI

Controlli operativi per agenti LLM onchain: la chiave per l'affidabilità con capitale reale

Uno studio approfondito su agenti LLM autonomi che gestiscono capitale reale in un mercato onchain rivela un dato cruciale: l'affidabilità non dipende solo dal modello di base, ma emerge da un robusto "operating layer". Componenti come la compilazion...

#LLM On-Premise #DevOps

2026-04-30 • OpenAI Blog

Le "anomalie goblin" nei Large Language Models: analisi e soluzioni per GPT-5

Un'analisi approfondita esplora l'origine, la diffusione e le soluzioni per le "anomalie goblin" nei modelli AI, concentrandosi sulle peculiarità comportamentali di GPT-5. L'articolo esamina la timeline di queste manifestazioni, le cause radice e gli...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

Qwen 27B per lo sviluppo software: un'analisi dall'esperienza sul campo

Un dibattito tra sviluppatori esplora le capacità di Qwen 27B per compiti di programmazione quotidiana. Il modello, nonostante le sue dimensioni, mostra prestazioni sorprendenti, ma la fiducia nella sua adozione completa rispetto a soluzioni cloud co...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

Il Futuro degli LLM Locali: Verso un Modello "Plug-and-Play" e Servizi Specializzati

Un utente Reddit ha condiviso una visione audace: entro i prossimi cinque anni, gli LLM locali potrebbero diventare comuni come gli elettrodomestici, dando vita a una nuova economia di servizi specializzati per l'installazione e la manutenzione. Ques...

#Hardware #LLM On-Premise #DevOps

2026-04-29 • TechCrunch AI

Parallel Web Systems raggiunge una valutazione di 2 miliardi di dollari

La startup Parallel Web Systems, fondata dall'ex CEO di Twitter Parag Agrawal e specializzata in strumenti per agenti AI, ha completato un nuovo round di finanziamento da 100 milioni di dollari, guidato da Sequoia. Questo porta la sua valutazione a 2...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • Wired AI

SenseTime lancia un modello di immagini ottimizzato per chip cinesi e l'Open Source

Nonostante le restrizioni statunitensi che limitano l'accesso a tecnicie avanzate, l'azienda cinese SenseTime ha rilasciato un nuovo modello di intelligenza artificiale per l'elaborazione di immagini. Il modello è stato progettato per la velocità e o...

#Hardware #LLM On-Premise #DevOps

2026-04-29 • TechCrunch AI

Google Photos e l'AI: il guardaroba di 'Clueless' diventa realtà virtuale

Google Photos sfrutta l'intelligenza artificiale per ricreare il celebre guardaroba di Cher Horowitz dal film 'Clueless'. Questa iniziativa evidenzia come l'AI stia integrandosi in applicazioni di consumo per offrire esperienze interattive e personal...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

Mistral Medium 3.5: Nuove Opzioni di Deployment con Licenza Specifiche

Mistral AI ha rilasciato Mistral Medium 3.5, un Large Language Model che si distingue per le sue "Open Weights" e una licenza MIT modificata. Quest'ultima richiede il pagamento di una licenza per l'uso commerciale, introducendo considerazioni importa...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

IBM presenta la famiglia Granite 4.1: modelli da 3 a 30 miliardi di parametri

IBM ha annunciato la nuova famiglia di Large Language Models Granite 4.1, disponibile in versioni da 3, 8 e 30 miliardi di parametri. Questi modelli offrono alle aziende opzioni flessibili per il deployment di LLM, bilanciando requisiti di performanc...

#Hardware #LLM On-Premise #DevOps

2026-04-29 • LocalLLaMA

Mistral Medium 3.5: Un LLM da 128B con finestra di contesto da 256k

Mistral AI ha presentato Mistral Medium 3.5, un LLM denso da 128 miliardi di parametri con una finestra di contesto di 256k token. Il modello è multimodale, supporta funzionalità di ragionamento configurabili e si propone come soluzione unificata per...

#Hardware #LLM On-Premise #DevOps

2026-04-29 • LocalLLaMA

Heard: Una voce per gli agenti di codice, open source e con esecuzione locale

Heard è un nuovo progetto open source che offre una soluzione per dotare gli agenti di codice di una voce, fornendo output intermedi in tempo reale. Sviluppato come daemon Python e app macOS, Heard si distingue per la sua capacità di operare interame...

#LLM On-Premise #DevOps

2026-04-29 • LocalLLaMA

Ottimizzare gli LLM per il codice: il dibattito sul "pensiero" artificiale

Nel panorama degli LLM per la generazione di codice, emerge una pratica diffusa: disabilitare le fasi di "pensiero" intermedio. Questa strategia, sebbene raccomandata da molti, solleva interrogativi sulle sue motivazioni profonde. L'analisi di questa...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

DeepSeek avvia i test per il suo modello multimodale con capacità visive

DeepSeek ha dato il via alla fase di "grayscale testing" per il suo nuovo modello, "DeepSeek with Vision". Questa mossa indica un passo significativo nello sviluppo di Large Language Models multimodali, che integrano la comprensione visiva. Il proces...

#Hardware #LLM On-Premise #Fine-Tuning

Agenti AI e Sviluppo Avanzato di LLM

Articoli Correlati