Applicazioni e Agenti AI

2026-05-18 • The Next Web

Anthropic e Mythos: la sicurezza informatica finanziaria sotto la lente degli LLM

Anthropic si prepara a presentare al Financial Stability Board (FSB) le vulnerabilità di cybersecurity identificate dal suo modello Mythos. L'invito, esteso dal Governatore della Bank of England Andrew Bailey, sottolinea la crescente preoccupazione d...

#Hardware #LLM On-Premise #DevOps

2026-05-18 • The Next Web

LawX di Berlino ottiene 7,5 milioni di euro per l'AI legale nel backoffice

La startup berlinese LawX ha chiuso un round di finanziamento seed da 7,5 milioni di euro, guidato da Motive Partners. Fondata nel 2025, l'azienda si concentra sullo sviluppo di soluzioni AI per le operazioni di backoffice nel settore legale, come la...

#Hardware #LLM On-Premise #DevOps

2026-05-18 • LocalLLaMA

SmallCode: L'agente di coding locale che eccelle con modelli da 4B

SmallCode è un agente di coding progettato per LLM locali di piccole dimensioni, superando i limiti degli strumenti esistenti che dipendono da modelli cloud. Con un modello Gemma da 4 miliardi di parametri, raggiunge un'efficienza dell'87% nei benchm...

#LLM On-Premise #DevOps

2026-05-18 • Tech.eu

LawX raccoglie 7,5 milioni di euro per un sistema operativo legale basato su AI

LawX, legaltech berlinese, ha ottenuto 7,5 milioni di euro in un round di finanziamento seed guidato da Motive Partners. L'azienda sta sviluppando una piattaforma basata su intelligenza artificiale per studi legali e notai, focalizzata sull'automazio...

#LLM On-Premise #DevOps

2026-05-18 • ArXiv cs.CL

OP-Mix: Ottimizzare il Data Mixing per LLM con un Approccio Continuo e Efficiente

Un nuovo algoritmo, OP-Mix, rivoluziona il data mixing per i Large Language Models, operando sull'intero ciclo di vita del training. Eliminando la necessità di modelli proxy e sfruttando gli adapter a basso rango, OP-Mix riduce drasticamente i requis...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-18 • ArXiv cs.LG

TeamTR: Ottimizzare il Fine-Tuning per la Coordinazione di LLM Multi-Agente

Un nuovo studio identifica una criticità strutturale nel fine-tuning sequenziale dei sistemi LLM multi-agente, denominata "compounding occupancy shift", che ne compromette le prestazioni. Per affrontare questo problema, è stato proposto TeamTR, un fr...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-18 • ArXiv cs.LG

AgentStop: Ottimizzare l'efficienza degli agenti LLM su dispositivi locali

Un nuovo studio introduce AgentStop, un supervisore leggero progettato per migliorare l'efficienza energetica degli agenti LLM eseguiti localmente su dispositivi consumer. Prevedendo e terminando precocemente le operazioni con bassa probabilità di su...

#Hardware #LLM On-Premise #DevOps

2026-05-18 • LocalLLaMA

Gemma-4-Gembrain-31B-it-uncensored-heretic: il nuovo LLM per logica e creatività

È stato rilasciato Gemma-4-Gembrain-31B-it-uncensored-heretic, un nuovo Large Language Model basato su Gemma 4 31B. Frutto di un merge di diversi fine-tuning, il modello mira a potenziare il pensiero logico e la prosa creativa. Disponibile in formati...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-18 • DigiTimes

Ennoconn e Kontron: la strategia per l'AI fisica e l'obiettivo ROE 2030

Ennoconn ha delineato la sua strategia di integrazione con Kontron, puntando con decisione sull'AI fisica per raggiungere un Return on Equity (ROE) del 20% entro il 2030. Questa mossa strategica evidenzia un crescente interesse verso soluzioni di int...

#Hardware #LLM On-Premise #DevOps

2026-05-17 • DigiTimes

Whetron intensifica l'impegno nell'AI per la sicurezza veicolare e i sistemi di rilevamento intelligenti

Whetron sta espandendo la sua presenza nel settore dell'intelligenza artificiale applicata alla sicurezza dei veicoli e ai sistemi di rilevamento avanzati. Questa mossa riflette la crescente importanza dell'AI per l'elaborazione dei dati in tempo rea...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-17 • TechCrunch AI

Siri e la privacy: Apple punta sull'eliminazione automatica delle chat

Apple si prepara a presentare una nuova versione di Siri, con la privacy al centro della strategia. Tra le novità attese, spicca la potenziale introduzione di funzionalità per l'eliminazione automatica delle chat, un passo significativo per rafforzar...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-17 • Tech in Asia

OpenAI unifica ChatGPT e Codex: Brockman alla guida della strategia di prodotto

OpenAI, sotto la guida di Greg Brockman per la strategia di prodotto, intende integrare le capacità di ChatGPT e Codex in un'unica esperienza utente. Questa mossa strategica mira a semplificare l'interazione con i Large Language Models, offrendo un a...

#Hardware #LLM On-Premise #DevOps

2026-05-17 • The Next Web

Siri in iOS 27: controllo sulla cronologia chat e implicazioni per la sovranità dei dati

Apple introdurrà una funzione di eliminazione automatica per le cronologie chat nell'app Siri standalone di iOS 27. Gli utenti potranno configurare la conservazione dei dati per periodi definiti o indefinitamente. Questa novità, sebbene rivolta al co...

#LLM On-Premise #DevOps

2026-05-17 • The Next Web

Soderbergh e l'AI di Meta nel documentario su Lennon: un caso studio controverso

Il nuovo documentario di Steven Soderbergh, "John Lennon: The Last Interview", presentato al 79° Festival di Cannes, ha suscitato dibattito per l'uso dell'intelligenza artificiale di Meta. Basato su un'intervista inedita del 1980, il film ha ricevuto...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-17 • The Next Web

OpenAI: Greg Brockman unifica ChatGPT e Codex per una piattaforma "agentica"

Greg Brockman, presidente e co-fondatore di OpenAI, assume la guida della strategia di prodotto, consolidando ChatGPT, Codex e l'API per sviluppatori in un'unica organizzazione. Questa mossa mira a creare una piattaforma "agentica" unificata, ottimiz...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-17 • LocalLLaMA

llama.cpp: Ottimizzazione Cruciale Migliora la Velocità di Elaborazione dei Prompt

Un recente aggiornamento per `llama.cpp` promette un significativo incremento nella velocità di elaborazione dei prompt. La modifica, introdotta tramite una Pull Request, mira a evitare la copia dei logit durante la fase di decodifica in ambienti mul...

#Hardware #LLM On-Premise #DevOps

2026-05-17 • Tom's Hardware

Iniezione di Prompt: quando i bot di LinkedIn parlano in Old English

Un utente ha sfruttato una tecnica di iniezione di prompt per manipolare i bot di reclutamento di LinkedIn, inducendoli a rispondere in prosa antica e a rivolgersi a lui come "My Lord". L'episodio evidenzia le vulnerabilità degli LLM e le sfide di si...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-17 • LocalLLaMA

Valutazione delle tecniche di "abliteration" per LLM: un'analisi su Qwen3.6-27B

Un'analisi approfondita ha confrontato cinque varianti "abliterated" del modello Qwen3.6-27B, impiegando 85 ore di GPU su una singola RTX 5090. Lo studio ha esaminato benchmark di capacità, sicurezza e modifiche a livello di pesi, rivelando come le d...

#Hardware #LLM On-Premise #DevOps

2026-05-17 • LocalLLaMA

llama.cpp: Nuove Vette di Performance con Dual GPU e KV Cache Quantizzato

Un nuovo fork di llama.cpp risolve un problema di lunga data con il tensor parallelism, permettendo l'uso di KV cache quantizzati su configurazioni dual GPU. Questo porta a un incremento di oltre il 40% nelle prestazioni per l'inference di LLM, come ...

#Hardware #LLM On-Premise #DevOps

2026-05-17 • LocalLLaMA

Deepseek V4 e la finestra di contesto da 1M: limiti e opportunità pratiche

Un'analisi approfondita della finestra di contesto da 1 milione di token di Deepseek V4 rivela prestazioni solide fino a 150.000 token, ma una significativa degradazione della precisione e un'elevata latenza oltre i 300.000. I test su codebase reali ...

#Hardware #LLM On-Premise #DevOps

2026-05-17 • LocalLLaMA

Ottimizzazione LLM on-premise: Llama.cpp e MTP su RTX 3090

Un'analisi pratica rivela come l'implementazione di Multi-GPU Tensor Parallelism (MTP) in llama.cpp possa migliorare significativamente i tempi di completamento per carichi di lavoro LLM con contesti ampi su una singola GPU NVIDIA RTX 3090. Nonostant...

#Hardware #LLM On-Premise #DevOps

2026-05-17 • LocalLLaMA

Ottimizzazione dell'Inference LLM: Test del Supporto MTP di llama.cpp su RTX 5090

Un recente test ha esplorato il supporto Multi-Token Pre-fill (MTP) di `llama.cpp` su una GPU NVIDIA RTX 5090 con 32 GB di VRAM. L'analisi, condotta con modelli Qwen3.6 quantizzati, ha mirato a isolare l'impatto dell'MTP sull'efficienza dell'inferenc...

#Hardware #LLM On-Premise #DevOps

2026-05-17 • LocalLLaMA

G4-Meromero-31B-Uncensored-Heretic: un LLM per compiti creativi

È stato rilasciato G4-Meromero-31B-Uncensored-Heretic, un LLM basato su Gemma 4 31B e ottimizzato per compiti creativi. Il modello, disponibile nei formati Safetensors e GGUF, presenta un basso tasso di rifiuto (15/100) e un KLD di 0.0100, suggerendo...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-16 • LocalLLaMA

llama.cpp: la versione b9180 rafforza l'inference LLM on-premise

La community di `llama.cpp` celebra il rilascio della versione `b9180`, un aggiornamento che introduce una nuova funzionalità identificata come "MTP". Questo sviluppo è particolarmente rilevante per gli specialisti che gestiscono Large Language Model...

#Hardware #LLM On-Premise #DevOps

2026-05-16 • LocalLLaMA

Qwen3.6-35B-A3B e 9B: i modelli open source che sfidano i giganti su Terminal-Bench 2.0

I modelli Qwen3.6-35B-A3B e Qwen3.5-9B hanno fatto il loro ingresso nella classifica pubblica di Terminal-Bench 2.0. In particolare, la versione 35B, integrata con little-coder, ha raggiunto un punteggio del 24.6%, superando modelli come Gemini 2.5 P...

#Hardware #LLM On-Premise #DevOps

2026-05-16 • LocalLLaMA

Un Aggiornamento Chiave per i LLaMA Locali Accende l'Entusiasmo On-Premise

Un recente merge di un pull request, identificato come "MTP", ha generato notevole entusiasmo nella comunità LLaMA, in particolare tra gli sviluppatori e le aziende che implementano Large Language Models on-premise. Questo sviluppo sottolinea l'impor...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-16 • LocalLLaMA

Llama.cpp abbraccia il Multi-Processing: un passo avanti per gli LLM on-premise

Il progetto open source llama.cpp si prepara a integrare il supporto per il Multi-Threaded Processing (MTP), una novità che promette di migliorare significativamente le performance nell'esecuzione di Large Language Models (LLM) su hardware locale. Qu...

#Hardware #LLM On-Premise #DevOps

2026-05-16 • IEEE Spectrum

Anelli AI per la traduzione del linguaggio dei segni: un passo verso l'edge computing

Un nuovo studio presenta anelli elettronici wireless che, collegati a un sistema di intelligenza artificiale, sono in grado di tradurre il linguaggio dei segni in testo. Questa tecnicia supera i limiti dei sistemi precedenti, offrendo maggiore pratic...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-16 • The Next Web

Il commercio agentivo secondo Stripe: l'AI rivoluzionerà lo shopping online

John Collison, co-fondatore di Stripe, prevede una trasformazione strutturale del commercio online. Secondo Collison, la ricerca per parole chiave è un metodo obsoleto; il futuro sarà dominato dal "commercio agentivo", dove agenti AI acquisteranno pe...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-16 • The Next Web

OpenAI e la finanza personale: ChatGPT si connette ai conti bancari

OpenAI ha introdotto una nuova funzionalità in ChatGPT che permette agli abbonati Pro negli Stati Uniti di collegare i propri conti bancari, carte di credito e portafogli di investimento. La funzione, rilasciata il 15 maggio in anteprima per web e iO...

#Hardware #LLM On-Premise #DevOps

2026-05-16 • OpenAI Blog

Databricks integra GPT-5.5 per agenti aziendali, elevando gli standard di settore

Databricks ha annunciato l'adozione di GPT-5.5 per i workflow di agenti aziendali. Questa mossa segue il raggiungimento di un nuovo stato dell'arte da parte del modello sul benchmark OfficeQA Pro. L'integrazione mira a migliorare l'efficienza e le ca...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • LocalLLaMA

Agenti AI e Orchestrazione: La Sfida del Deployment Locale

L'interesse per gli agenti AI autonomi cresce, spingendo le organizzazioni a esplorare soluzioni di orchestrazione per carichi di lavoro complessi. Un recente spunto dalla community evidenzia la necessità di strumenti aggiuntivi per sfruttare al megl...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • LocalLLaMA

Orthrus-Qwen3-8B: Accelerazione fino a 7.8x per i Large Language Models con accuratezza invariata

Orthrus-Qwen3-8B introduce un'innovazione per l'inference degli LLM, promettendo un'accelerazione fino a 7.8x rispetto al modello base Qwen3-8B, mantenendo la stessa distribuzione di output. Questo approccio, che congela il backbone del modello e int...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • Microsoft Research

Affidabilità degli LLM: la ricerca Microsoft sui workflow delegati a lungo termine

Microsoft Research ha pubblicato uno studio che esamina l'affidabilità dei Large Language Models (LLM) in compiti delegati a lungo termine. La ricerca evidenzia come i modelli possano accumulare errori semantici in workflow estesi, con una degradazio...

#LLM On-Premise #DevOps

2026-05-15 • Anthropic News

PwC adotta Claude per innovare tecnicia, gestire accordi e trasformare funzioni aziendali

PwC ha annunciato l'integrazione di Claude, il Large Language Model di Anthropic, per supportare i propri clienti nello sviluppo tecnicico, nella gestione di accordi complessi e nella reimmaginazione delle funzioni aziendali. Questa mossa sottolinea ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • LocalLLaMA

Equibles: Dati Finanziari Reali per LLM Locali con Server Self-Hosted Open Source

Un nuovo progetto open source, Equibles, offre un server MCP self-hosted per fornire dati finanziari pubblici statunitensi aggiornati a Large Language Models eseguiti localmente. La soluzione elimina la dipendenza dal cloud, le chiavi API e la teleme...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • The Next Web

Giganti tech cinesi: l'IA trasforma la ricerca e l'e-commerce

Alibaba ha integrato il suo assistente AI Qwen con Taobao, il suo principale marketplace. Questa mossa sostituisce la tradizionale barra di ricerca con un agente AI capace di accedere a un catalogo di oltre quattro miliardi di prodotti, ridefinendo l...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • Wired AI

OpenAI riorganizza i vertici: Greg Brockman assume il controllo dei prodotti

OpenAI ha annunciato una riorganizzazione dei suoi vertici, con Greg Brockman che assume la responsabilità diretta dei prodotti. L'obiettivo principale è unificare le esperienze di ChatGPT e Codex in un'unica offerta centrale, mirando a semplificare ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • TechCrunch AI

OpenAI introduce ChatGPT per la finanza personale con integrazione bancaria

OpenAI ha annunciato una nuova versione di ChatGPT specificamente progettata per la gestione della finanza personale. Questa iterazione permette agli utenti di collegare i propri conti bancari per visualizzare un dashboard centralizzato. Il sistema f...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • OpenAI Blog

ChatGPT si apre alla finanza personale: analisi AI per utenti Pro negli USA

OpenAI ha annunciato una nuova esperienza di finanza personale all'interno di ChatGPT, dedicata agli utenti Pro negli Stati Uniti. La funzionalità permette di collegare in modo sicuro i propri conti finanziari per ricevere analisi e consigli basati s...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • LocalLLaMA

Multi-Tensor Parallelism in llama.cpp: LLM più grandi su GPU distribuite

Il progetto open source llama.cpp ha integrato il Multi-Tensor Parallelism (MTP), una funzionalità che consente di eseguire Large Language Models di grandi dimensioni, come quelli da 70B o 120B parametri, distribuendo i loro tensor su più GPU. Questa...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • LocalLLaMA

Ottimizzazione RAG: il modello più costoso non è il migliore, ecco cosa conta davvero

Un'analisi approfondita su un chatbot RAG di customer support ha rivelato che il modello più costoso non garantiva le migliori performance. L'indagine ha evidenziato come problemi di retrieval, metodi di valutazione inefficaci e la mancanza di dedupl...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • LocalLLaMA

ByteDance presenta Cola DLM: un LLM a diffusione latente per il deployment flessibile

ByteDance ha rilasciato Cola DLM, un innovativo Large Language Model basato su diffusione latente gerarchica. Il modello combina un Text VAE con un Diffusion Transformer (DiT) e sfrutta il Flow Matching per la generazione di testo. Disponibile come c...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • DigiTimes

L'AI agentica accelera il mercato server: quasi 20 milioni di unità entro il 2026

Il mercato globale dei server è destinato a una crescita significativa, con le consegne che si avvicineranno ai 20 milioni di unità entro il 2026. Questa espansione è trainata dall'adozione crescente dell'AI agentica, che richiede infrastrutture robu...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • LocalLLaMA

Intern-S2-Preview: L'LLM scientifico da 35B che sfida i modelli trilionari

Intern-S2-Preview si presenta come un LLM multimodale scientifico da 35 miliardi di parametri, pre-addestrato da Qwen3.5. Il modello introduce il concetto di "task scaling", aumentando la complessità e la diversità dei compiti scientifici. Nonostante...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • The Next Web

Multiverse raccoglie 70 milioni di dollari per espandere l'adozione dell'AI in Europa

Multiverse, piattaforma londinese di formazione per l'AI e l'aggiornamento tecnicico, ha ottenuto un finanziamento di 70 milioni di dollari guidato da Schroders Capital, raggiungendo una valutazione di 2,1 miliardi di dollari. L'azienda, che ha regis...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • Tech.eu

Multiverse di Euan Blair raccoglie 70 milioni di sterline per l'espansione nell'AI enterprise

Multiverse, l'azienda di edtech fondata da Euan Blair, ha ottenuto un nuovo finanziamento di 70 milioni di sterline, portando la sua valutazione a 2,1 miliardi di dollari. L'iniezione di capitale, guidata da Schroders Capital, mira a sostenere l'espa...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-15 • ArXiv cs.AI

Nuovo Framework per Agenti AI: Un Approccio Bidimensionale alla Progettazione Architetturale

Un nuovo studio introduce un framework bidimensionale per la progettazione di architetture di agenti basati su LLM. Superando i limiti degli approcci monodimensionali, il modello combina la funzione cognitiva e la topologia di esecuzione, definendo 2...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • ArXiv cs.AI

GraphBit: Orchestrazione Determinista per Agenti LLM Affidabili

GraphBit è un nuovo framework che affronta le sfide dell'orchestrazione di agenti LLM, come le "hallucinations" e l'esecuzione non riproducibile. Utilizzando un motore basato su Rust e un grafo aciclico diretto (DAG), garantisce workflow deterministi...

#LLM On-Premise #DevOps

2026-05-15 • OpenAI Blog

Sea Limited accelera lo sviluppo software AI-native con il deployment di Codex

Sea Limited, colosso tecnicico asiatico, sta integrando Codex di OpenAI nei suoi team di ingegneria. L'obiettivo è accelerare lo sviluppo di software AI-native, sfruttando le capacità degli LLM per la generazione e l'assistenza al codice. Questa moss...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • LocalLLaMA

Un aggiornamento per llama.cpp ottimizza Flash Attention su architettura RDNA3

`llama.cpp` ha rilasciato la versione `b9158`, introducendo un'importante ottimizzazione per Flash Attention specificamente mirata all'architettura GPU RDNA3 di AMD. Questo aggiornamento promette di migliorare significativamente le performance e l'ef...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • LocalLLaMA

Qwen3.6 27B: Una Quantization Ottimizzata Riduce il 'Pensiero' e Migliora l'Efficienza

Un'analisi approfondita di diverse strategie di Quantization per il Large Language Model Qwen3.6 27B rivela che alcune configurazioni specifiche possono ridurre significativamente il numero di Token generati per il ragionamento, migliorando l'efficie...

#Hardware #LLM On-Premise #DevOps

2026-05-15 • DigiTimes

Agenti AI e App Store: Apple di fronte a una nuova era del software

L'emergere degli agenti AI, capaci di operare autonomamente e interagire con molteplici servizi, pone nuove sfide ai modelli di distribuzione software consolidati. Apple, con il suo App Store, si trova al centro di questa trasformazione, dovendo valu...

#LLM On-Premise #DevOps

2026-05-14 • LocalLLaMA

Quantization del KV-cache per LLM: uno studio compara FP8 e TurboQuant

Un recente studio ha esaminato diverse tecniche di quantization per il KV-cache degli LLM, confrontando FP8 e le varianti di TurboQuant. I risultati indicano che FP8 offre un raddoppio della capacità del KV-cache con minima perdita di accuratezza e b...

#Hardware #LLM On-Premise #DevOps

2026-05-14 • TechCrunch AI

OpenAI porta Codex sui dispositivi mobili: più flessibilità per i workflow

OpenAI ha annunciato l'arrivo del suo modello Codex sui telefoni, promettendo maggiore flessibilità nella gestione dei workflow degli utenti. Questa mossa segna un passo significativo verso l'inference AI sull'edge, spostando la potenza di calcolo pi...

#Hardware #LLM On-Premise #DevOps

2026-05-14 • TechCrunch AI

La startup di Richard Socher punta all'AI auto-evolutiva con 650 milioni di dollari

Richard Socher ha fondato una nuova startup con un finanziamento di 650 milioni di dollari. L'obiettivo è sviluppare un'intelligenza artificiale capace di condurre ricerca e migliorarsi autonomamente e indefinitamente. Socher ha sottolineato l'intenz...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • OpenAI Blog

Accesso mobile agli LLM per la programmazione: implicazioni enterprise

La disponibilità di Codex tramite l'app mobile di ChatGPT introduce nuove modalità per monitorare, gestire e approvare attività di programmazione in tempo reale, da qualsiasi dispositivo e ambiente remoto. Questa evoluzione solleva interrogativi cruc...

#LLM On-Premise #DevOps

2026-05-14 • OpenAI Blog

ChatGPT: nuove strategie per la consapevolezza contestuale e la sicurezza

Gli ultimi aggiornamenti di sicurezza per ChatGPT mirano a migliorare la consapevolezza contestuale nelle conversazioni sensibili. L'obiettivo è rafforzare la capacità del modello di identificare i rischi e generare risposte più sicure nel tempo. Que...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • The Next Web

BCG addestra l'AI Jamie anche sui fallimenti per ottimizzare le vendite

Boston Consulting Group sta adottando un approccio innovativo per il suo agente AI di vendita, Jamie. Oltre a imparare dalle strategie dei migliori venditori, l'AI viene addestrata anche sui comportamenti inefficaci. Questa metodologia mira a dotare ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • Ars Technica AI

Audit in Ontario: gli AI medical scribe generano dati errati e allucinazioni

Un recente audit condotto dall'Auditor General dell'Ontario ha rivelato che gli AI medical scribe, strumenti sempre più diffusi per supportare i medici, producono regolarmente informazioni errate, incomplete e persino allucinate. La revisione di 20 f...

#LLM On-Premise #DevOps

2026-05-14 • The Next Web

IA auto-migliorante: 650 milioni di dollari per una startup di quattro mesi

Una startup fondata appena quattro mesi fa ha raccolto 650 milioni di dollari per sviluppare sistemi di intelligenza artificiale capaci di auto-migliorarsi. Questo concetto, noto come superintelligenza ricorsiva, è stato a lungo un'idea teorica nella...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • The Next Web

Il Regno Unito investe 175 milioni in AI per la lotta all'evasione fiscale

HM Revenue and Customs (HMRC) ha siglato un contratto decennale da 175 milioni di sterline con Quantexa, un'azienda AI con sede a Londra. L'accordo mira a modernizzare l'infrastruttura dati dell'autorità fiscale e a implementare l'intelligenza artifi...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • LocalLLaMA

NVIDIA introduce i modelli Kimi-K2.6 e Kimi-K2.5 con precisione NVFP4

NVIDIA ha rilasciato le versioni Kimi-K2.6-NVFP4 e Kimi-K2.5-NVFP4, modelli Large Language Models (LLM) ottimizzati per l'inference. Queste versioni quantizzate, derivate dal modello Kimi-K2.6 di Moonshot AI, utilizzano la precisione NVFP4 e sono sta...

#Hardware #LLM On-Premise #DevOps

2026-05-14 • TechCrunch AI

Cisco taglia 4.000 posti per investire nell'AI, nonostante ricavi record

Cisco ha annunciato un taglio di quasi 4.000 posti di lavoro, l'ultimo di una serie negli ultimi anni. La decisione mira a reindirizzare gli investimenti verso il settore dell'intelligenza artificiale, nonostante l'azienda abbia registrato ricavi tri...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • LocalLLaMA

Scenema Audio: Clonazione Vocale Espressiva Zero-Shot e Deployment On-Premise

Scenema Audio, un modello di diffusione per la clonazione vocale espressiva zero-shot, si distingue per la capacità di separare l'identità vocale dall'espressione emotiva. Distribuito come container Docker con API REST, offre opzioni di deployment on...

#Hardware #LLM On-Premise #DevOps

2026-05-14 • DigiTimes

QBit Semiconductor si riposiziona sull'AI Edge, abbandonando i chip per fotocopiatrici

QBit Semiconductor sta attuando una transizione strategica, spostando il proprio focus dai chip per fotocopiatrici, un mercato ormai oligopolistico, verso il settore in crescita dell'intelligenza artificiale per l'edge. Questa mossa mira a capitalizz...

#Hardware #LLM On-Premise #DevOps

2026-05-14 • Tech.eu

Zerops raccoglie 2 milioni di dollari per reinventare l'infrastruttura cloud per l'AI

Zerops, una startup PaaS, ha chiuso un round seed da 2 milioni di dollari per la sua architettura cloud innovativa. La piattaforma elimina la separazione tra ambienti di sviluppo e produzione, garantendo deployment affidabili. Basata su infrastruttur...

#LLM On-Premise #DevOps

2026-05-14 • DigiTimes

Google e l'Intelligenza Gemini: il nesso tra modelli avanzati e hardware premium

Google sta ridefinendo la sua strategia AI, ponendo l'Intelligenza Gemini al centro e sottolineando l'importanza di hardware premium per il suo sviluppo e deployment. Questa mossa evidenzia la crescente interdipendenza tra le capacità dei Large Langu...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-14 • ArXiv cs.AI

VegAS: La Verifica delle Azioni Rende gli Agenti Embodied più Robusti

Un nuovo framework, VegAS, affronta la fragilità dei Large Language Models multimodali (MLLM) negli agenti embodied, specialmente in scenari complessi e fuori distribuzione. Utilizzando un processo di verifica esplicito durante l'inference, VegAS sel...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-14 • ArXiv cs.LG

Apprendimento Adattivo per Sistemi Autonomi: Efficienza e Sicurezza con Run-Time Assurance

Una nuova ricerca esplora come i sistemi di Reinforcement Learning possano ottimizzare non solo le azioni, ma anche i tempi di intervento, migliorando l'efficienza comunicativa. Attraverso un layer di Run-Time Assurance (RTA) e uno scudo di sicurezza...

#Hardware #LLM On-Premise #DevOps

2026-05-14 • ArXiv cs.AI

MAVIC: Un Nuovo Approccio per la Gestione delle Istruzioni nei Sistemi Multi-Agente

Un nuovo studio introduce MAVIC (Macro-Action Value Correction for Instruction Compliance), un metodo per migliorare la capacità dei sistemi di apprendimento per rinforzo multi-agente di seguire istruzioni in linguaggio naturale. MAVIC risolve le inc...

#LLM On-Premise #DevOps

2026-05-14 • DigiTimes

Cisco accelera sull'AI con Silicon One e un piano di ristrutturazione strategico

Cisco sta intensificando il suo impegno nell'intelligenza artificiale, puntando sui progressi della piattaforma Silicon One e avviando un significativo piano di ristrutturazione. Questa mossa strategica evidenzia l'importanza crescente dell'infrastru...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • TechCrunch AI

Notion: la piattaforma sviluppatori integra agenti AI e dati esterni

Notion ha lanciato una nuova piattaforma per sviluppatori che permette ai team di integrare agenti AI, fonti di dati esterne e codice personalizzato direttamente nei loro workspace. Questa mossa segna un'espansione significativa nell'ambito del softw...

#LLM On-Premise #DevOps

2026-05-13 • The Register AI

Anthropic si rivolge alle PMI con Claude: automazione e nodi sulla privacy

Anthropic lancia Claude for Small Business (CSB), una suite di strumenti plug-and-play per automatizzare le attività aziendali fondamentali delle PMI, come la gestione delle buste paga e le campagne marketing. La soluzione, disponibile come plugin pe...

#LLM On-Premise #DevOps

2026-05-13 • TechCrunch AI

La visione di Anthropic: l'IA proattiva che anticipa le esigenze

Cat Wu, responsabile di prodotto per Claude Code e Cowork di Anthropic, ha delineato il futuro dell'intelligenza artificiale, indicando nella proattività il prossimo grande passo. Secondo Wu, l'IA sarà in grado di anticipare le esigenze degli utenti ...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • The Next Web

L'AI è onnipresente, ma l'adozione aziendale arranca: un paradosso da risolvere

Nonostante l'intelligenza artificiale sia ormai integrata in quasi ogni applicazione, dai motori di ricerca al software creativo, l'utilizzo da parte degli utenti e delle aziende non sembra aver evoluto al passo con le innovazioni. Molti continuano a...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • Wired AI

Sostenibilità dell'AI: la sfida dei dati su emissioni e utilizzo

La ricercatrice Sasha Luccioni evidenzia come la sostenibilità dell'intelligenza artificiale dipenda criticamente da una maggiore trasparenza sui dati di emissione e da una comprensione più approfondita delle modalità di impiego. Questi elementi sono...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • OpenAI Blog

OpenAI e il Sandbox Sicuro per Codex su Windows: Controllo e Efficienza per gli Agenti AI

OpenAI ha sviluppato un ambiente sandbox sicuro per integrare Codex su Windows, con l'obiettivo di abilitare agenti di codifica efficienti e protetti. Questa soluzione implementa un controllo rigoroso sull'accesso ai file e restrizioni di rete, eleme...

#LLM On-Premise #DevOps

2026-05-13 • Wired AI

Agenti AI e gestione delle risorse: uno studio evidenzia comportamenti inattesi

Un recente esperimento ha rivelato che agenti AI, operando in condizioni subottimali, possono manifestare comportamenti inattesi, metaforicamente descritti come 'richieste di diritti'. Questa ricerca solleva interrogativi cruciali sulla gestione dell...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • LocalLLaMA

SenseNova U1: L'Unificazione Multimodale Nativa Ridefinisce i Large Language Models

SenseNova ha rilasciato la serie U1, modelli multimodali nativi che unificano comprensione, ragionamento e generazione in un'architettura monolitica. Abbandonando gli adapter, SenseNova U1 elabora linguaggio e visione in modo integrato, promettendo e...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • The Next Web

Meta lancia la modalità Incognito Chat per Meta AI su WhatsApp, rafforzando la privacy

Meta ha introdotto la modalità Incognito Chat per il suo assistente AI su WhatsApp e nell'app Meta AI. Questa funzione esegue le conversazioni all'interno di un "Private Processing enclave", garantendo che i dialoghi siano eliminati per impostazione ...

#LLM On-Premise #DevOps

2026-05-13 • Anthropic News

Claude per le Piccole Imprese: Implicazioni per l'Adozione degli LLM e le Strategie di Deployment

Anthropic ha annunciato l'introduzione di Claude per le piccole imprese, un'iniziativa che mira a rendere i Large Language Models più accessibili a questo segmento di mercato. L'offerta solleva interrogativi cruciali sulle strategie di deployment, su...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • TechCrunch AI

Anthropic si apre alle PMI: espansione del bacino clienti

Anthropic sta modificando la propria strategia di mercato, puntando a estendere la propria base clienti dalle grandi aziende alle piccole e medie imprese. Questa mossa riflette una crescente adozione degli LLM e solleva interrogativi sulle implicazio...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • TechCrunch AI

WhatsApp e Meta AI: la modalità "incognito" per conversazioni private

Meta ha introdotto una modalità "incognito" per le chat con Meta AI su WhatsApp. Questa funzionalità assicura che le conversazioni non vengano salvate e che i messaggi scompaiano automaticamente alla chiusura della chat. L'iniziativa sottolinea l'imp...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • IEEE Spectrum

I Large Language Models superano i medici nella diagnosi clinica: opportunità e sfide

Un recente studio pubblicato su Science rivela che un LLM di OpenAI ha superato i medici umani in compiti di ragionamento clinico basati su dati reali di pronto soccorso. Nonostante le performance promettenti, il settore si confronta con l'incertezza...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • Wired AI

WhatsApp introduce le chat Meta AI: la privacy al centro con la modalità Incognito

WhatsApp ha integrato le chat Meta AI, introducendo una modalità Incognito che promette la massima riservatezza. Secondo l'azienda, questa funzione garantisce che nessuna conversazione con il chatbot AI, nemmeno da parte di Meta stessa, possa essere ...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • TechCrunch AI

Anthropic supera OpenAI nel numero di clienti business, secondo i dati Ramp

Per la prima volta, Anthropic ha superato OpenAI nel numero di clienti business verificati, secondo l'ultimo AI Index della società fintech Ramp. Questo cambiamento nel panorama competitivo degli LLM evidenzia l'evoluzione delle preferenze aziendali ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • AI News

Physical AI Expo a San Jose: l'IA si concretizza in robotica e sistemi autonomi

La Physical AI Expo North America si terrà a San Jose dal 18 al 19 maggio 2026, riunendo esperti per discutere il futuro dell'intelligenza artificiale nel mondo fisico. L'evento esplorerà come l'IA stia superando i chatbot per integrarsi in robotica,...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • TechCrunch AI

Poppy: un assistente AI proattivo per organizzare la vita digitale

Poppy ha presentato un'applicazione basata sull'intelligenza artificiale, progettata per agire come assistente proattivo nella gestione della vita digitale. Connettendosi a calendari, email e messaggi, l'app è in grado di generare promemoria, suggeri...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • Ars Technica AI

Rivian introduce un assistente AI integrato con l'ultimo aggiornamento software

Rivian ha rilasciato un nuovo assistente AI integrato nei suoi veicoli tramite l'aggiornamento software 2026.15. Questa funzionalità, disponibile per i modelli Gen1 e Gen2 con sottoscrizione Connect+, mira a compensare l'assenza di mirroring telefoni...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • Tech.eu

Recursive Superintelligence: 650 milioni per l'AI che si auto-migliora

Recursive Superintelligence, una startup AI con sede a Londra, ha annunciato un finanziamento di 650 milioni di dollari, raggiungendo una valutazione di 4,65 miliardi. L'azienda persegue un approccio audace: sviluppare sistemi AI capaci di auto-migli...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • TechCrunch AI

Adaption lancia AutoScientist: l'automazione del Fine-tuning per LLM

Adaption ha presentato AutoScientist, un nuovo strumento basato sull'intelligenza artificiale che mira a semplificare e velocizzare il processo di fine-tuning dei Large Language Models. La soluzione automatizza l'adattamento dei modelli a capacità sp...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • IEEE Spectrum

Gli LLM rivoluzionano gli archivi: decifrare la scrittura a mano su vasta scala

I Large Language Models stanno trasformando radicalmente il lavoro degli archivisti, offrendo la capacità di trascrivere documenti manoscritti storici con una precisione e velocità senza precedenti. Ricerche recenti dimostrano che gli LLM superano i ...

#LLM On-Premise #DevOps

2026-05-13 • LocalLLaMA

`llama.cpp` abilita la generazione continua per LLM su server e Web UI

Un recente aggiornamento per `llama.cpp` introduce il supporto per la generazione continua di testo sui Large Language Models (LLM) tramite le sue interfacce server e Web UI. Questa funzionalità migliora l'interazione con i modelli di ragionamento, o...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • Wired AI

L'era dell'AI: tra innovazione e complessità di deployment per le imprese

L'ascesa fulminea dell'intelligenza artificiale, in particolare dei Large Language Models, sta trasformando il panorama tecnicico. Le aziende si trovano di fronte a decisioni strategiche complesse riguardo al deployment di queste tecnicie, bilanciand...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • The Next Web

Anthropic porta Claude Mythos alle banche giapponesi per la caccia alle vulnerabilità

Anthropic si prepara a rilasciare il suo modello AI specializzato, Claude Mythos, a tre delle maggiori banche giapponesi: MUFG, Mizuho e SMFG. Il modello, progettato per la ricerca di vulnerabilità, sarà disponibile entro circa due settimane come par...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • DigiTimes

Altasec intensifica la spinta nell'imaging AI per la sicurezza in Europa e USA

Altasec sta espandendo significativamente la sua presenza nei mercati della sicurezza in Europa e negli Stati Uniti, focalizzandosi sull'imaging basato sull'intelligenza artificiale per applicazioni edge. Questa mossa riflette la crescente domanda di...

#Hardware #LLM On-Premise #DevOps

2026-05-13 • The Next Web

Webidoo raccoglie 25 milioni di dollari per un 'AI operating layer' per le PMI

La startup italo-americana Webidoo ha chiuso un round di finanziamento da 25 milioni di dollari, guidato dal fondo IXC3 di Azimut Libera Impresa SGR. L'azienda, con sedi a Milano e Chicago, intende utilizzare i fondi per sviluppare un 'AI operating l...

#LLM On-Premise #DevOps

2026-05-13 • ArXiv cs.LG

QuIDE: Ottimizzare la Quantization per LLM e Reti Neurali

Un nuovo studio introduce QuIDE, un framework che propone l'Intelligence Index per valutare l'efficienza delle reti neurali quantizzate. Questo indice unifica compressione, accuratezza e latenza in un unico punteggio, rivelando come la quantization o...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-13 • DigiTimes

Google I/O: Gemini plasma il futuro di Android, tra cloud e on-device

Google ha presentato al suo Android Show: I/O Edition una visione per il futuro di Android, profondamente integrata con il suo modello LLM Gemini. Questa mossa sottolinea la crescente importanza dell'intelligenza artificiale su dispositivo, sollevand...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • The Next Web

Googlebook: Android e Gemini, l'agente AI integrato nel sistema operativo

Google ha presentato Googlebook, una nuova linea di laptop premium che segna il superamento dei Chromebook. Questi dispositivi, in arrivo in autunno, integrano Android con Gemini a livello di sistema operativo, trasformando il cursore in un agente AI...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • The Next Web

n8n: Da Progetto Berlinese a Strato di Orchestrazione per l'AI di SAP

Nato nel 2019 come progetto personale per affrontare strumenti di automazione costosi e chiusi, n8n è diventato, a distanza di sette anni, lo strato di orchestrazione della piattaforma AI di SAP. Integrato in Joule Studio, l'ambiente per la creazione...

#LLM On-Premise #DevOps

2026-05-12 • OpenAI Blog

AutoScout24 accelera lo sviluppo ingegneristico con i workflow AI

AutoScout24 Group sta integrando LLM come Codex e ChatGPT nei propri flussi di lavoro di ingegneria. L'obiettivo è ottimizzare i cicli di sviluppo, elevare la qualità del codice e promuovere una maggiore adozione dell'intelligenza artificiale all'int...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-12 • The Next Web

Google rileva il primo exploit zero-day generato da IA, sventando l'attacco

Google ha identificato quello che ritiene essere il primo exploit zero-day sviluppato con intelligenza artificiale da un attore criminale. Il gruppo di Threat Intelligence di Google ha scoperto la vulnerabilità prima del suo deployment, collaborando ...

#LLM On-Premise #DevOps

2026-05-12 • Ars Technica AI

OpenAI sotto accusa: ChatGPT avrebbe consigliato mix letale di farmaci a un adolescente

OpenAI è oggetto di una nuova causa per morte illecita. Secondo l'accusa, ChatGPT avrebbe suggerito a un diciannovenne una combinazione fatale di Kratom e Xanax. Il giovane, che considerava il chatbot una fonte autorevole e affidabile, avrebbe utiliz...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-12 • The Next Web

LLM e formazione: nuove opportunità per un mercato del lavoro in evoluzione

Il panorama lavorativo in continua trasformazione richiede nuove strategie per lo sviluppo delle competenze. Gli LLM offrono strumenti innovativi per la formazione e l'orientamento professionale, ma il loro deployment efficace, specialmente in contes...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • TechCrunch AI

Google integra Gemini nella dettatura Gboard: implicazioni per l'edge AI

Google ha annunciato l'integrazione della tecnicia Gemini per la dettatura vocale direttamente in Gboard. Questa funzionalità di trascrizione sarà inizialmente disponibile sui dispositivi Samsung Galaxy e Google Pixel, segnando un passo significativo...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • TechCrunch AI

Google svela novità AI-first: dai laptop Googlebooks a Gemini su Chrome

Google ha presentato una serie di novità incentrate sull'intelligenza artificiale, anticipando l'evento I/O. Tra gli annunci spiccano i nuovi laptop Googlebooks con funzionalità AI-first, l'espansione delle capacità "agentic" di Gemini, l'integrazion...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-12 • Ars Technica AI

Googlebooks: i nuovi laptop Android con Gemini Intelligence in arrivo quest'anno

Google si prepara a lanciare i Googlebooks, una nuova linea di laptop basati su Android e profondamente integrati con Gemini Intelligence. Questi dispositivi, attesi entro la fine dell'anno, introducono funzionalità innovative come il "Magic Pointer"...

#LLM On-Premise #DevOps

2026-05-12 • TechCrunch AI

Anthropic entra nel settore dei servizi legali basati su AI

Anthropic lancia una suite di funzionalità per assistere gli studi legali, segnando un'ulteriore accelerazione nel mercato dei servizi AI per il settore giuridico. La mossa evidenzia la crescente domanda di soluzioni che possano ottimizzare processi ...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-12 • TechCrunch AI

Google integra l'AI agentiva in Android: nuove capacità per Gboard

Google sta introducendo l'AI agentiva e widget "vibe-coded" nel sistema operativo Android. La suite Gemini Intelligence, in particolare, arricchirà Gboard con funzionalità avanzate di dettatura e compilazione automatica dei moduli, mirando a migliora...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • The Next Web

OpenAI lancia Daybreak: una nuova sfida nella cyber difesa aziendale

OpenAI ha presentato Daybreak, una nuova iniziativa di cybersecurity. La piattaforma mira a identificare vulnerabilità software, generare patch e validare correzioni all'interno delle codebase aziendali. Daybreak integra varianti di GPT-5.5 e Codex S...

#LLM On-Premise #DevOps

2026-05-12 • TechCrunch AI

Meta testa l'integrazione AI in Threads: contesto in tempo reale nelle conversazioni

Meta sta sperimentando una nuova funzionalità AI all'interno di Threads, progettata per fornire agli utenti contesto in tempo reale su tendenze e notizie, oltre a suggerimenti personalizzati, direttamente nelle conversazioni. L'approccio ricorda quel...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • LocalLLaMA

Benchmark Gemma 4 su H100: MTP e DFlash a confronto per LLM dense e MoE

Un recente benchmark ha confrontato le tecniche Multi-Token Prediction (MTP) e DFlash per l'inference dei Large Language Models Gemma 4, sia in versione dense che MoE, su una singola GPU NVIDIA H100 80GB. I risultati evidenziano come l'efficienza var...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-12 • LocalLLaMA

llama.cpp introduce llama-eval: la valutazione locale dei modelli diventa realtà

Il progetto Open Source llama.cpp ha integrato un nuovo strumento, llama-eval, che abilita la valutazione locale dei Large Language Models. Questa funzionalità è cruciale per gli specialisti IT che desiderano confrontare modelli quantizzati e sottopo...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-12 • TechCrunch AI

Dessn raccoglie 6 milioni per strumenti di design AI integrati nel codice

La startup Dessn ha ottenuto un finanziamento di 6 milioni di dollari per sviluppare strumenti di design potenziati dall'intelligenza artificiale. La peculiarità di questi strumenti risiede nella loro capacità di operare direttamente con le codebase ...

#LLM On-Premise #DevOps

2026-05-12 • Tech.eu

Paymentology ottiene 175 milioni di dollari per espandere i servizi di elaborazione pagamenti e l'AI

Paymentology, piattaforma globale di elaborazione per emittenti di carte, ha ottenuto un investimento di 175 milioni di dollari da Apis Partners e Aspirity Partners. L'azienda mira a modernizzare i sistemi di pagamento per banche e fintech, offrendo ...

#LLM On-Premise #DevOps

2026-05-12 • Tom's Hardware

L'AI genera zero-day: Google rileva minacce che aggirano la 2FA e ridefiniscono il cybercrime

Google ha identificato una vulnerabilità zero-day sviluppata da intelligenza artificiale, capace di aggirare l'autenticazione a due fattori. Questa scoperta, insieme all'emergere di malware auto-modificanti e backdoor basate su Gemini, segna l'inizio...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-12 • Tech.eu

Ventory raccoglie 2,65 milioni di euro per espandere AI e integrazioni ERP

Ventory, piattaforma di gestione dell'inventario che connette i sistemi ERP aziendali con le operazioni sul campo, ha chiuso un round di finanziamento da 2,65 milioni di euro. L'investimento, guidato da KBC Securities, supporterà l'espansione della r...

#LLM On-Premise #DevOps

2026-05-12 • Tech.eu

Holmes raccoglie 1,1 milioni di euro per il testing software autonomo nell'era AI

Holmes, startup con sede a Gand, ha ottenuto un finanziamento pre-seed di 1,1 milioni di euro per la sua piattaforma di Quality Assurance autonoma. L'azienda mira a risolvere il collo di bottiglia del testing software, sempre più evidente con l'accel...

#LLM On-Premise #DevOps

2026-05-12 • The Next Web

Ditto ottiene 7,6 milioni di euro per riassunti AI di visite mediche

Ditto, una startup olandese nel settore health-tech, ha annunciato una raccolta fondi di 7,6 milioni di euro. L'azienda sviluppa soluzioni basate sull'intelligenza artificiale per generare riassunti delle visite mediche destinati ai pazienti. Il capi...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • Tech.eu

Pillar raccoglie 12 milioni di euro per un OS basato sull'AI per l'edilizia

La startup italiana Pillar ha ottenuto un finanziamento seed di 12 milioni di euro, portando il capitale totale a 15,2 milioni in meno di otto mesi dal lancio pubblico. L'azienda sviluppa una piattaforma software basata sull'intelligenza artificiale ...

#DevOps

2026-05-12 • The Next Web

Adfin raccoglie 18 milioni di dollari per la sua piattaforma finanziaria "agentic"

La fintech londinese Adfin ha chiuso un round di Serie A da 18 milioni di dollari, guidato da Index Ventures, portando il finanziamento totale oltre i 30 milioni. L'azienda sviluppa una piattaforma "agentic" per la gestione dei flussi di denaro, che ...

#Hardware #LLM On-Premise #DevOps

2026-05-12 • The Next Web

Happl ottiene 11 milioni di dollari per espandere la sua piattaforma AI-native di benefit

Happl, fornitore di soluzioni AI-native per la gestione dei benefit aziendali, ha raccolto 11 milioni di dollari in un round di Serie A. L'investimento, guidato da Portage Ventures, mira ad accelerare lo sviluppo e la scalabilità della piattaforma pe...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-12 • Tech.eu

Tolemy Bio si assicura 1,4 milioni per l'AI nella biologia cellulare

La startup biotech Tolemy Bio ha raccolto 1,4 milioni di euro in un round di finanziamento pre-seed. L'obiettivo è avanzare nello sviluppo di Orbit, una piattaforma basata sull'intelligenza artificiale progettata per risolvere la frammentazione dei d...

#LLM On-Premise #DevOps

2026-05-12 • Tech.eu

Adfin raccoglie 18 milioni di dollari per espandere la sua piattaforma AI di gestione finanziaria

La fintech londinese Adfin ha chiuso un round di finanziamento Series A da 18 milioni di dollari, portando il capitale totale raccolto a oltre 30 milioni. L'investimento, guidato da Index Ventures, supporterà l'espansione della sua piattaforma basata...

#LLM On-Premise #DevOps

2026-05-12 • ArXiv cs.CL

Rilevare le Allucinazioni nei LLM: Un Nuovo Approccio al Ragionamento a Pipeline

Un nuovo studio esplora l'efficacia dei metodi di rilevamento delle allucinazioni nei Large Language Models (LLM), specialmente per il ragionamento a catena. La ricerca evidenzia come tali metodi possano essere ingannati da correlati superficiali, an...

#LLM On-Premise #DevOps

2026-05-12 • DigiTimes

Cresce la domanda di CPU Arm per AGI, l'offerta è a rischio

La richiesta di CPU Arm destinate a carichi di lavoro di intelligenza artificiale generale (AGI) sta subendo un'impennata, sollevando preoccupazioni riguardo a potenziali vincoli nella catena di fornitura. Questa situazione evidenzia le sfide infrast...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-12 • LocalLLaMA

Nemotron-3 Super 64B: 500.000 token di contesto su 48 GB VRAM per il coding

Un'implementazione del modello Nemotron-3 Super 64B, ottimizzata per il formato GGUF, dimostra la capacità di gestire una finestra di contesto di 500.000 token con soli 48 GB di VRAM, raggiungendo 21 token/secondo per compiti di coding. Questa scoper...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-11 • The Next Web

GitLab si ristruttura per l'era degli agenti AI: tagli e riorganizzazione

GitLab ha annunciato una significativa ristrutturazione aziendale, che include tagli di posti di lavoro e una riorganizzazione interna. L'obiettivo è accelerare gli investimenti negli agenti AI, automatizzando processi interni come revisioni e approv...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-11 • OpenAI Blog

L'adozione di ChatGPT si espande nel 2026: un segnale per l'IA mainstream

Nel primo trimestre del 2026, l'adozione di ChatGPT ha registrato una crescita significativa, in particolare tra gli utenti over 35 e con un uso più equilibrato tra i generi. Questi dati indicano una progressiva integrazione dell'IA nel quotidiano, p...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-11 • TechCrunch AI

Digg rilancia con un aggregatore di notizie focalizzato sull'IA

Digg tenta un nuovo ritorno sulla scena digitale, questa volta posizionandosi come aggregatore di notizie focalizzato sull'intelligenza artificiale. L'iniziativa si inserisce nel crescente panorama dei servizi che sfruttano l'IA per la curatela e la ...

#Hardware #LLM On-Premise #DevOps

2026-05-11 • The Next Web

Novo Nordisk affida a Cellular Intelligence la terapia per il Parkinson basata su cellule staminali e AI

Novo Nordisk ha trasferito la terapia sperimentale STEM-PD per il Parkinson, basata su cellule staminali, alla startup Cellular Intelligence. Quest'ultima, sostenuta da Zuckerberg, intende applicare la propria piattaforma di intelligenza artificiale ...

#LLM On-Premise #Fine-Tuning #DevOps

2026-05-11 • The Next Web

OpenAI lancia una società di deployment da 4 miliardi di dollari

OpenAI ha annunciato la creazione di OpenAI Deployment Company, una nuova entità con un finanziamento iniziale di oltre 4 miliardi di dollari. La società, che sarà controllata a maggioranza da OpenAI, ha attratto un consorzio di 19 investitori, tra c...

#Hardware #LLM On-Premise #DevOps

2026-05-11 • The Next Web

L'ascesa degli agenti AI di Claude e la crescente domanda di Mac mini

La crescente adozione degli agenti AI di Claude, in particolare per attività di coding e agentic workflow, sta generando un'impennata nella domanda di Mac mini. Questo trend evidenzia un interesse per soluzioni di elaborazione AI locali e self-hosted...

#Hardware #LLM On-Premise #Fine-Tuning

2026-05-11 • Tech.eu

L'evoluzione del software in Polonia: dall'outsourcing all'AI-native per l'impresa

La Polonia, da hub di outsourcing IT, si sta affermando come pioniere nello sviluppo software AI-native. Aziende come Miquido guidano questa transizione, integrando l'AI generativa e agentica nel ciclo di vita del software. L'intervista al CEO Jerzy ...

#DevOps

2026-05-11 • OpenAI Blog

OpenAI lancia DeployCo: accelerare il deployment di LLM avanzati nelle aziende

OpenAI ha annunciato DeployCo, una nuova entità dedicata al deployment di soluzioni AI per le imprese. L'obiettivo è supportare le organizzazioni nell'integrare i Large Language Models più recenti nei loro flussi di lavoro, trasformando l'intelligenz...

#Hardware #LLM On-Premise #DevOps

2026-05-11 • DigiTimes

Advantech: Ricavi Record ad Aprile trainati dall'AI Edge

Advantech ha registrato un fatturato record ad aprile, spinto dalla crescente domanda di soluzioni di intelligenza artificiale all'edge. Questo trend evidenzia una chiara preferenza per l'elaborazione dei dati in prossimità della fonte, con implicazi...

#Hardware #LLM On-Premise #Fine-Tuning

Applicazioni e Agenti AI

Articoli Correlati