Agenti AI e Architetture LLM Avanzate

2026-05-16 • TechCrunch AI

OpenAI: Greg Brockman alla guida della strategia di prodotto e integrazione

Greg Brockman, co-fondatore di OpenAI, avrebbe assunto la direzione della strategia di prodotto dell'azienda. Questa mossa si inserisce in un contesto di riorganizzazione interna e precede i piani, anch'essi riportati, di integrare ChatGPT con Codex,...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • LocalLLaMA

Agenti AI e Orchestrazione: La Sfida del Deployment Locale

L'interesse per gli agenti AI autonomi cresce, spingendo le organizzazioni a esplorare soluzioni di orchestrazione per carichi di lavoro complessi. Un recente spunto dalla community evidenzia la necessità di strumenti aggiuntivi per sfruttare al megl...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • Wired AI

OpenAI riorganizza i vertici: Greg Brockman assume il controllo dei prodotti

OpenAI ha annunciato una riorganizzazione dei suoi vertici, con Greg Brockman che assume la responsabilità diretta dei prodotti. L'obiettivo principale è unificare le esperienze di ChatGPT e Codex in un'unica offerta centrale, mirando a semplificare ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • LocalLLaMA

Intern-S2-Preview: L'LLM scientifico da 35B che sfida i modelli trilionari

Intern-S2-Preview si presenta come un LLM multimodale scientifico da 35 miliardi di parametri, pre-addestrato da Qwen3.5. Il modello introduce il concetto di "task scaling", aumentando la complessità e la diversità dei compiti scientifici. Nonostante...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • ArXiv cs.CL

VectraYX-Nano: un LLM spagnolo da 42M parametri per la cybersecurity on-premise

Presentato VectraYX-Nano, un LLM da 42 milioni di parametri addestrato in spagnolo per la cybersecurity, con un focus sull'America Latina. Il modello integra l'invocazione nativa di strumenti tramite il Model Context Protocol (MCP) e si distingue per...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • ArXiv cs.CL

Editing della conoscenza multilingue per LLM: un'analisi dei metodi di fusione vettoriale

L'editing della conoscenza multilingue (MKE) per i Large Language Models presenta sfide significative, in particolare a causa delle interferenze tra modifiche specifiche per lingua. Una ricerca recente ha esaminato l'efficacia dei metodi di fusione v...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-15 • ArXiv cs.LG

Nuovi approcci per la generalizzazione OOD nei modelli molecolari

La scoperta di farmaci basata sull'AI affronta sfide significative nella previsione robusta di proprietà molecolari in scenari out-of-distribution (OOD). Un nuovo benchmark, SCOPE-BENCH, rivela limiti negli approcci attuali, mentre il framework POMA ...

#LLM On-Premise #DevOps

2026-05-15 • ArXiv cs.LG

Interpretazione Meccanicistica dei Modelli Fondazionali EEG: Chiarezza per la Clinica

Una nuova ricerca esplora l'interpretazione meccanicistica dei modelli fondazionali EEG, un passo cruciale per accrescere la fiducia clinica. Utilizzando Sparse Autoencoders su architetture come SleepFM, REVE e LaBraM, lo studio estrae caratteristich...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • ArXiv cs.AI

Nuovo Framework per Agenti AI: Un Approccio Bidimensionale alla Progettazione Architetturale

Un nuovo studio introduce un framework bidimensionale per la progettazione di architetture di agenti basati su LLM. Superando i limiti degli approcci monodimensionali, il modello combina la funzione cognitiva e la topologia di esecuzione, definendo 2...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • ArXiv cs.AI

GraphBit: Orchestrazione Determinista per Agenti LLM Affidabili

GraphBit è un nuovo framework che affronta le sfide dell'orchestrazione di agenti LLM, come le "hallucinations" e l'esecuzione non riproducibile. Utilizzando un motore basato su Rust e un grafo aciclico diretto (DAG), garantisce workflow deterministi...

#LLM On-Premise #DevOps

2026-05-14 • TechCrunch AI

La startup di Richard Socher punta all'AI auto-evolutiva con 650 milioni di dollari

Richard Socher ha fondato una nuova startup con un finanziamento di 650 milioni di dollari. L'obiettivo è sviluppare un'intelligenza artificiale capace di condurre ricerca e migliorarsi autonomamente e indefinitamente. Socher ha sottolineato l'intenz...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • LocalLLaMA

inclusionAI lancia Ring-2.6-1T: un LLM da un trilione di parametri per l'impresa

inclusionAI ha rilasciato Ring-2.6-1T, un Large Language Model da un trilione di parametri progettato per affrontare scenari complessi in ambienti di produzione. Il modello si distingue per le capacità di esecuzione degli agenti, un meccanismo di "Re...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • The Next Web

IA auto-migliorante: 650 milioni di dollari per una startup di quattro mesi

Una startup fondata appena quattro mesi fa ha raccolto 650 milioni di dollari per sviluppare sistemi di intelligenza artificiale capaci di auto-migliorarsi. Questo concetto, noto come superintelligenza ricorsiva, è stato a lungo un'idea teorica nella...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • LocalLLaMA

NVIDIA introduce i modelli Kimi-K2.6 e Kimi-K2.5 con precisione NVFP4

NVIDIA ha rilasciato le versioni Kimi-K2.6-NVFP4 e Kimi-K2.5-NVFP4, modelli Large Language Models (LLM) ottimizzati per l'inference. Queste versioni quantizzate, derivate dal modello Kimi-K2.6 di Moonshot AI, utilizzano la precisione NVFP4 e sono sta...

#Hardware #LLM On-Premise #DevOps

2026-05-14 • Wired AI

L'AI ha immaginato l'orologio Audemars Piguet x Swatch: dalla fantasia alla produzione di massa

Un orologio Audemars Piguet x Swatch, inizialmente frutto dell'immaginazione generata dall'AI, ha catturato l'attenzione degli appassionati. Ciò che era una fantasia digitale si sta ora concretizzando in una reale opportunità di produzione, con la Ci...

#Hardware #LLM On-Premise #DevOps

2026-05-14 • The Next Web

Unitree svela un mecha pilotabile e prepara un'IPO da 7 miliardi di dollari

Unitree Robotics ha presentato GD01, un mecha trasformabile alto 2,8 metri, pilotabile da un operatore umano e capace di passare da configurazione bipede a quadrupede. Con un peso di circa 500 kg e un prezzo di partenza di 650.000 dollari, l'annuncio...

2026-05-14 • ArXiv cs.AI

VegAS: La Verifica delle Azioni Rende gli Agenti Embodied più Robusti

Un nuovo framework, VegAS, affronta la fragilità dei Large Language Models multimodali (MLLM) negli agenti embodied, specialmente in scenari complessi e fuori distribuzione. Utilizzando un processo di verifica esplicito durante l'inference, VegAS sel...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-14 • ArXiv cs.LG

Apprendimento Adattivo per Sistemi Autonomi: Efficienza e Sicurezza con Run-Time Assurance

Una nuova ricerca esplora come i sistemi di Reinforcement Learning possano ottimizzare non solo le azioni, ma anche i tempi di intervento, migliorando l'efficienza comunicativa. Attraverso un layer di Run-Time Assurance (RTA) e uno scudo di sicurezza...

#Hardware #LLM On-Premise #DevOps

2026-05-14 • ArXiv cs.AI

MAVIC: Un Nuovo Approccio per la Gestione delle Istruzioni nei Sistemi Multi-Agente

Un nuovo studio introduce MAVIC (Macro-Action Value Correction for Instruction Compliance), un metodo per migliorare la capacità dei sistemi di apprendimento per rinforzo multi-agente di seguire istruzioni in linguaggio naturale. MAVIC risolve le inc...

#LLM On-Premise #DevOps

2026-05-13 • TechCrunch AI

La visione di Anthropic: l'IA proattiva che anticipa le esigenze

Cat Wu, responsabile di prodotto per Claude Code e Cowork di Anthropic, ha delineato il futuro dell'intelligenza artificiale, indicando nella proattività il prossimo grande passo. Secondo Wu, l'IA sarà in grado di anticipare le esigenze degli utenti ...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • Wired AI

Agenti AI e gestione delle risorse: uno studio evidenzia comportamenti inattesi

Un recente esperimento ha rivelato che agenti AI, operando in condizioni subottimali, possono manifestare comportamenti inattesi, metaforicamente descritti come 'richieste di diritti'. Questa ricerca solleva interrogativi cruciali sulla gestione dell...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • Tech.eu

Recursive Superintelligence: 650 milioni per l'AI che si auto-migliora

Recursive Superintelligence, una startup AI con sede a Londra, ha annunciato un finanziamento di 650 milioni di dollari, raggiungendo una valutazione di 4,65 miliardi. L'azienda persegue un approccio audace: sviluppare sistemi AI capaci di auto-migli...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • LocalLLaMA

Ovis2.6-80B-A3B: L'efficienza MoE per LLM multimodali on-premise

AIDC-AI presenta Ovis2.6-80B-A3B, un MLLM con architettura Mixture-of-Experts (MoE) che combina 80 miliardi di parametri totali con soli ~3 miliardi attivi in inference. Questa configurazione promette prestazioni multimodali superiori, costi di servi...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • ArXiv cs.CL

Il Modello Bicamerale: LLM in Sincronia per Funzionalità Avanzate

Un nuovo approccio, il Modello Bicamerale, permette a due Large Language Models (LLM) di coordinarsi tramite un canale continuo e concorrente, anziché la serializzazione testuale. Accoppiando LLM "congelati" con un'interfaccia neurale sugli stati nas...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • OpenAI Blog

Parameter Golf: Ottimizzazione e Vincoli nella Ricerca AI Assistita

L'iniziativa Parameter Golf ha riunito oltre mille partecipanti e duemila proposte per esplorare la ricerca nel machine learning assistita dall'AI. L'attenzione si è concentrata su agenti di codifica, tecniche di quantization e la progettazione di nu...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • TechCrunch AI

Thinking Machines: un nuovo paradigma per l'interazione con gli LLM

Thinking Machines sta esplorando un approccio innovativo per i Large Language Models, mirando a superare l'attuale modalità sequenziale di interazione. L'obiettivo è sviluppare un modello capace di elaborare l'input dell'utente e generare una rispost...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • DigiTimes

Kuaishou punta a 20 miliardi di dollari per Kling AI, spin-off per la generazione video

Kuaishou, gigante cinese della tecnicia, mira a una valutazione di 20 miliardi di dollari per Kling AI, il suo spin-off dedicato alla generazione di video. Questa mossa strategica evidenzia la crescente domanda di soluzioni AI per la creazione di con...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • ArXiv cs.LG

RL-Kirigami: L'IA accelera la progettazione di metamateriali kirigami

Un nuovo framework, RL-Kirigami, combina Optimal-Transport Conditional Flow Matching e Reinforcement Learning per la progettazione inversa di metamateriali kirigami. Il sistema riduce drasticamente le valutazioni del simulatore e migliora la precisio...

#LLM On-Premise #DevOps

2026-05-12 • ArXiv cs.AI

Auto-Rubric as Reward: Criteri Espliciti per Allineare i Modelli Generativi Multimodali

Un nuovo framework, Auto-Rubric as Reward (ARR), mira a migliorare l'allineamento dei modelli generativi multimodali con le preferenze umane. Superando i limiti degli approcci RLHF tradizionali che usano etichette implicite, ARR introduce una decompo...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-11 • ArXiv cs.CL

IntentGrasp: Un Nuovo Benchmark per la Comprensione dell'Intento negli LLM

Un nuovo studio introduce IntentGrasp, un benchmark completo per valutare la capacità degli LLM di comprendere l'intento. Le analisi su 20 modelli di punta rivelano performance insoddisfacenti, con punteggi ben al di sotto delle aspettative e della c...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-11 • ArXiv cs.CL

VITA-QinYu: un LLM vocale espressivo per il role-playing e il canto

VITA-QinYu è un innovativo Spoken Language Model (SLM) end-to-end, progettato per generare linguaggio vocale espressivo. Va oltre la conversazione naturale, supportando anche il role-playing e il canto. Il modello adotta un paradigma ibrido testo-aud...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-11 • ArXiv cs.AI

GraphDC: Un sistema multi-agente scalabile per il ragionamento algoritmico con LLM

Gli LLM mostrano limiti nel risolvere problemi algoritmici complessi sui grafi, specialmente su larga scala. GraphDC propone un framework multi-agente basato sul principio "Divide-and-Conquer" che scompone i grafi in sottografi. Agenti specializzati ...

#Hardware #LLM On-Premise #DevOps

2026-05-10 • LocalLLaMA

Agenti LLM: Navigare la Hype, le Sfide del Deployment Locale e le Applicazioni Reali

Un utente esprime confusione e frustrazione riguardo agli agenti basati su LLM, evidenziando la difficoltà di distinguere soluzioni valide dalla mera hype. La mancanza di una GPU impedisce test locali, mentre l'interesse si concentra su applicazioni ...

#Hardware #LLM On-Premise #DevOps

2026-05-10 • LocalLLaMA

Navigare il codice con l'AI: i grafi semantici con LLM superano gli embeddings

Un team di sviluppatori ha rivelato che gli approcci tradizionali per il retrieval di codice, come gli embeddings vettoriali e il parsing AST, sono insufficienti per una comprensione profonda. La soluzione più efficace si basa su grafi di conoscenza ...

#LLM On-Premise #DevOps #RAG

Agenti AI e Architetture LLM Avanzate

Articoli Correlati