Topic / Trend Rising

Applicazioni e Agenti AI

L'AI si sta espandendo rapidamente in diversi settori, dall'automazione aziendale e la programmazione alla sanità, finanza e assistenza personale. Lo sviluppo di sofisticati agenti AI capaci di azioni autonome segna un significativo balzo in avanti nelle applicazioni pratiche.

Detected: 2026-05-18 · Updated: 2026-05-18

Articoli Correlati

2026-05-18 The Next Web

LawX di Berlino ottiene 7,5 milioni di euro per l'AI legale nel backoffice

La startup berlinese LawX ha chiuso un round di finanziamento seed da 7,5 milioni di euro, guidato da Motive Partners. Fondata nel 2025, l'azienda si concentra sullo sviluppo di soluzioni AI per le operazioni di backoffice nel settore legale, come la...

#Hardware #LLM On-Premise #DevOps
2026-05-18 LocalLLaMA

SmallCode: L'agente di coding locale che eccelle con modelli da 4B

SmallCode è un agente di coding progettato per LLM locali di piccole dimensioni, superando i limiti degli strumenti esistenti che dipendono da modelli cloud. Con un modello Gemma da 4 miliardi di parametri, raggiunge un'efficienza dell'87% nei benchm...

#LLM On-Premise #DevOps
2026-05-18 ArXiv cs.LG

TeamTR: Ottimizzare il Fine-Tuning per la Coordinazione di LLM Multi-Agente

Un nuovo studio identifica una criticità strutturale nel fine-tuning sequenziale dei sistemi LLM multi-agente, denominata "compounding occupancy shift", che ne compromette le prestazioni. Per affrontare questo problema, è stato proposto TeamTR, un fr...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-18 ArXiv cs.LG

AgentStop: Ottimizzare l'efficienza degli agenti LLM su dispositivi locali

Un nuovo studio introduce AgentStop, un supervisore leggero progettato per migliorare l'efficienza energetica degli agenti LLM eseguiti localmente su dispositivi consumer. Prevedendo e terminando precocemente le operazioni con bassa probabilità di su...

#Hardware #LLM On-Premise #DevOps
2026-05-18 DigiTimes

Ennoconn e Kontron: la strategia per l'AI fisica e l'obiettivo ROE 2030

Ennoconn ha delineato la sua strategia di integrazione con Kontron, puntando con decisione sull'AI fisica per raggiungere un Return on Equity (ROE) del 20% entro il 2030. Questa mossa strategica evidenzia un crescente interesse verso soluzioni di int...

#Hardware #LLM On-Premise #DevOps
2026-05-17 TechCrunch AI

Siri e la privacy: Apple punta sull'eliminazione automatica delle chat

Apple si prepara a presentare una nuova versione di Siri, con la privacy al centro della strategia. Tra le novità attese, spicca la potenziale introduzione di funzionalità per l'eliminazione automatica delle chat, un passo significativo per rafforzar...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-17 The Next Web

OpenAI: Greg Brockman unifica ChatGPT e Codex per una piattaforma "agentica"

Greg Brockman, presidente e co-fondatore di OpenAI, assume la guida della strategia di prodotto, consolidando ChatGPT, Codex e l'API per sviluppatori in un'unica organizzazione. Questa mossa mira a creare una piattaforma "agentica" unificata, ottimiz...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-17 Tom's Hardware

Iniezione di Prompt: quando i bot di LinkedIn parlano in Old English

Un utente ha sfruttato una tecnica di iniezione di prompt per manipolare i bot di reclutamento di LinkedIn, inducendoli a rispondere in prosa antica e a rivolgersi a lui come "My Lord". L'episodio evidenzia le vulnerabilità degli LLM e le sfide di si...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-17 LocalLLaMA

llama.cpp: Nuove Vette di Performance con Dual GPU e KV Cache Quantizzato

Un nuovo fork di llama.cpp risolve un problema di lunga data con il tensor parallelism, permettendo l'uso di KV cache quantizzati su configurazioni dual GPU. Questo porta a un incremento di oltre il 40% nelle prestazioni per l'inference di LLM, come ...

#Hardware #LLM On-Premise #DevOps
2026-05-17 LocalLLaMA

Deepseek V4 e la finestra di contesto da 1M: limiti e opportunità pratiche

Un'analisi approfondita della finestra di contesto da 1 milione di token di Deepseek V4 rivela prestazioni solide fino a 150.000 token, ma una significativa degradazione della precisione e un'elevata latenza oltre i 300.000. I test su codebase reali ...

#Hardware #LLM On-Premise #DevOps
2026-05-17 LocalLLaMA

Ottimizzazione LLM on-premise: Llama.cpp e MTP su RTX 3090

Un'analisi pratica rivela come l'implementazione di Multi-GPU Tensor Parallelism (MTP) in llama.cpp possa migliorare significativamente i tempi di completamento per carichi di lavoro LLM con contesti ampi su una singola GPU NVIDIA RTX 3090. Nonostant...

#Hardware #LLM On-Premise #DevOps
2026-05-17 LocalLLaMA

G4-Meromero-31B-Uncensored-Heretic: un LLM per compiti creativi

È stato rilasciato G4-Meromero-31B-Uncensored-Heretic, un LLM basato su Gemma 4 31B e ottimizzato per compiti creativi. Il modello, disponibile nei formati Safetensors e GGUF, presenta un basso tasso di rifiuto (15/100) e un KLD di 0.0100, suggerendo...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-16 LocalLLaMA

llama.cpp: la versione b9180 rafforza l'inference LLM on-premise

La community di `llama.cpp` celebra il rilascio della versione `b9180`, un aggiornamento che introduce una nuova funzionalità identificata come "MTP". Questo sviluppo è particolarmente rilevante per gli specialisti che gestiscono Large Language Model...

#Hardware #LLM On-Premise #DevOps
2026-05-16 LocalLLaMA

Un Aggiornamento Chiave per i LLaMA Locali Accende l'Entusiasmo On-Premise

Un recente merge di un pull request, identificato come "MTP", ha generato notevole entusiasmo nella comunità LLaMA, in particolare tra gli sviluppatori e le aziende che implementano Large Language Models on-premise. Questo sviluppo sottolinea l'impor...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-16 The Next Web

Il commercio agentivo secondo Stripe: l'AI rivoluzionerà lo shopping online

John Collison, co-fondatore di Stripe, prevede una trasformazione strutturale del commercio online. Secondo Collison, la ricerca per parole chiave è un metodo obsoleto; il futuro sarà dominato dal "commercio agentivo", dove agenti AI acquisteranno pe...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-16 The Next Web

OpenAI e la finanza personale: ChatGPT si connette ai conti bancari

OpenAI ha introdotto una nuova funzionalità in ChatGPT che permette agli abbonati Pro negli Stati Uniti di collegare i propri conti bancari, carte di credito e portafogli di investimento. La funzione, rilasciata il 15 maggio in anteprima per web e iO...

#Hardware #LLM On-Premise #DevOps
2026-05-15 LocalLLaMA

Agenti AI e Orchestrazione: La Sfida del Deployment Locale

L'interesse per gli agenti AI autonomi cresce, spingendo le organizzazioni a esplorare soluzioni di orchestrazione per carichi di lavoro complessi. Un recente spunto dalla community evidenzia la necessità di strumenti aggiuntivi per sfruttare al megl...

#Hardware #LLM On-Premise #DevOps
2026-05-15 The Next Web

Giganti tech cinesi: l'IA trasforma la ricerca e l'e-commerce

Alibaba ha integrato il suo assistente AI Qwen con Taobao, il suo principale marketplace. Questa mossa sostituisce la tradizionale barra di ricerca con un agente AI capace di accedere a un catalogo di oltre quattro miliardi di prodotti, ridefinendo l...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-15 Wired AI

OpenAI riorganizza i vertici: Greg Brockman assume il controllo dei prodotti

OpenAI ha annunciato una riorganizzazione dei suoi vertici, con Greg Brockman che assume la responsabilità diretta dei prodotti. L'obiettivo principale è unificare le esperienze di ChatGPT e Codex in un'unica offerta centrale, mirando a semplificare ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-15 TechCrunch AI

OpenAI introduce ChatGPT per la finanza personale con integrazione bancaria

OpenAI ha annunciato una nuova versione di ChatGPT specificamente progettata per la gestione della finanza personale. Questa iterazione permette agli utenti di collegare i propri conti bancari per visualizzare un dashboard centralizzato. Il sistema f...

#Hardware #LLM On-Premise #DevOps
2026-05-15 OpenAI Blog

ChatGPT si apre alla finanza personale: analisi AI per utenti Pro negli USA

OpenAI ha annunciato una nuova esperienza di finanza personale all'interno di ChatGPT, dedicata agli utenti Pro negli Stati Uniti. La funzionalità permette di collegare in modo sicuro i propri conti finanziari per ricevere analisi e consigli basati s...

#Hardware #LLM On-Premise #DevOps
2026-05-15 LocalLLaMA

Multi-Tensor Parallelism in llama.cpp: LLM più grandi su GPU distribuite

Il progetto open source llama.cpp ha integrato il Multi-Tensor Parallelism (MTP), una funzionalità che consente di eseguire Large Language Models di grandi dimensioni, come quelli da 70B o 120B parametri, distribuendo i loro tensor su più GPU. Questa...

#Hardware #LLM On-Premise #DevOps
2026-05-15 LocalLLaMA

Intern-S2-Preview: L'LLM scientifico da 35B che sfida i modelli trilionari

Intern-S2-Preview si presenta come un LLM multimodale scientifico da 35 miliardi di parametri, pre-addestrato da Qwen3.5. Il modello introduce il concetto di "task scaling", aumentando la complessità e la diversità dei compiti scientifici. Nonostante...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-15 ArXiv cs.AI

GraphBit: Orchestrazione Determinista per Agenti LLM Affidabili

GraphBit è un nuovo framework che affronta le sfide dell'orchestrazione di agenti LLM, come le "hallucinations" e l'esecuzione non riproducibile. Utilizzando un motore basato su Rust e un grafo aciclico diretto (DAG), garantisce workflow deterministi...

#LLM On-Premise #DevOps
2026-05-15 DigiTimes

Agenti AI e App Store: Apple di fronte a una nuova era del software

L'emergere degli agenti AI, capaci di operare autonomamente e interagire con molteplici servizi, pone nuove sfide ai modelli di distribuzione software consolidati. Apple, con il suo App Store, si trova al centro di questa trasformazione, dovendo valu...

#LLM On-Premise #DevOps
2026-05-14 LocalLLaMA

Quantization del KV-cache per LLM: uno studio compara FP8 e TurboQuant

Un recente studio ha esaminato diverse tecniche di quantization per il KV-cache degli LLM, confrontando FP8 e le varianti di TurboQuant. I risultati indicano che FP8 offre un raddoppio della capacità del KV-cache con minima perdita di accuratezza e b...

#Hardware #LLM On-Premise #DevOps
2026-05-14 TechCrunch AI

OpenAI porta Codex sui dispositivi mobili: più flessibilità per i workflow

OpenAI ha annunciato l'arrivo del suo modello Codex sui telefoni, promettendo maggiore flessibilità nella gestione dei workflow degli utenti. Questa mossa segna un passo significativo verso l'inference AI sull'edge, spostando la potenza di calcolo pi...

#Hardware #LLM On-Premise #DevOps
2026-05-14 OpenAI Blog

Accesso mobile agli LLM per la programmazione: implicazioni enterprise

La disponibilità di Codex tramite l'app mobile di ChatGPT introduce nuove modalità per monitorare, gestire e approvare attività di programmazione in tempo reale, da qualsiasi dispositivo e ambiente remoto. Questa evoluzione solleva interrogativi cruc...

#LLM On-Premise #DevOps
2026-05-14 OpenAI Blog

ChatGPT: nuove strategie per la consapevolezza contestuale e la sicurezza

Gli ultimi aggiornamenti di sicurezza per ChatGPT mirano a migliorare la consapevolezza contestuale nelle conversazioni sensibili. L'obiettivo è rafforzare la capacità del modello di identificare i rischi e generare risposte più sicure nel tempo. Que...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-14 The Next Web

BCG addestra l'AI Jamie anche sui fallimenti per ottimizzare le vendite

Boston Consulting Group sta adottando un approccio innovativo per il suo agente AI di vendita, Jamie. Oltre a imparare dalle strategie dei migliori venditori, l'AI viene addestrata anche sui comportamenti inefficaci. Questa metodologia mira a dotare ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-14 The Next Web

IA auto-migliorante: 650 milioni di dollari per una startup di quattro mesi

Una startup fondata appena quattro mesi fa ha raccolto 650 milioni di dollari per sviluppare sistemi di intelligenza artificiale capaci di auto-migliorarsi. Questo concetto, noto come superintelligenza ricorsiva, è stato a lungo un'idea teorica nella...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-14 The Next Web

Il Regno Unito investe 175 milioni in AI per la lotta all'evasione fiscale

HM Revenue and Customs (HMRC) ha siglato un contratto decennale da 175 milioni di sterline con Quantexa, un'azienda AI con sede a Londra. L'accordo mira a modernizzare l'infrastruttura dati dell'autorità fiscale e a implementare l'intelligenza artifi...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-14 LocalLLaMA

NVIDIA introduce i modelli Kimi-K2.6 e Kimi-K2.5 con precisione NVFP4

NVIDIA ha rilasciato le versioni Kimi-K2.6-NVFP4 e Kimi-K2.5-NVFP4, modelli Large Language Models (LLM) ottimizzati per l'inference. Queste versioni quantizzate, derivate dal modello Kimi-K2.6 di Moonshot AI, utilizzano la precisione NVFP4 e sono sta...

#Hardware #LLM On-Premise #DevOps
2026-05-14 TechCrunch AI

Cisco taglia 4.000 posti per investire nell'AI, nonostante ricavi record

Cisco ha annunciato un taglio di quasi 4.000 posti di lavoro, l'ultimo di una serie negli ultimi anni. La decisione mira a reindirizzare gli investimenti verso il settore dell'intelligenza artificiale, nonostante l'azienda abbia registrato ricavi tri...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-14 LocalLLaMA

Scenema Audio: Clonazione Vocale Espressiva Zero-Shot e Deployment On-Premise

Scenema Audio, un modello di diffusione per la clonazione vocale espressiva zero-shot, si distingue per la capacità di separare l'identità vocale dall'espressione emotiva. Distribuito come container Docker con API REST, offre opzioni di deployment on...

#Hardware #LLM On-Premise #DevOps
2026-05-14 ArXiv cs.AI

VegAS: La Verifica delle Azioni Rende gli Agenti Embodied più Robusti

Un nuovo framework, VegAS, affronta la fragilità dei Large Language Models multimodali (MLLM) negli agenti embodied, specialmente in scenari complessi e fuori distribuzione. Utilizzando un processo di verifica esplicito durante l'inference, VegAS sel...

#LLM On-Premise #Fine-Tuning #DevOps
2026-05-13 TechCrunch AI

Notion: la piattaforma sviluppatori integra agenti AI e dati esterni

Notion ha lanciato una nuova piattaforma per sviluppatori che permette ai team di integrare agenti AI, fonti di dati esterne e codice personalizzato direttamente nei loro workspace. Questa mossa segna un'espansione significativa nell'ambito del softw...

#LLM On-Premise #DevOps
2026-05-13 The Register AI

Anthropic si rivolge alle PMI con Claude: automazione e nodi sulla privacy

Anthropic lancia Claude for Small Business (CSB), una suite di strumenti plug-and-play per automatizzare le attività aziendali fondamentali delle PMI, come la gestione delle buste paga e le campagne marketing. La soluzione, disponibile come plugin pe...

#LLM On-Premise #DevOps
2026-05-13 TechCrunch AI

La visione di Anthropic: l'IA proattiva che anticipa le esigenze

Cat Wu, responsabile di prodotto per Claude Code e Cowork di Anthropic, ha delineato il futuro dell'intelligenza artificiale, indicando nella proattività il prossimo grande passo. Secondo Wu, l'IA sarà in grado di anticipare le esigenze degli utenti ...

#Hardware #LLM On-Premise #DevOps
2026-05-13 Wired AI

Sostenibilità dell'AI: la sfida dei dati su emissioni e utilizzo

La ricercatrice Sasha Luccioni evidenzia come la sostenibilità dell'intelligenza artificiale dipenda criticamente da una maggiore trasparenza sui dati di emissione e da una comprensione più approfondita delle modalità di impiego. Questi elementi sono...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-13 TechCrunch AI

Anthropic si apre alle PMI: espansione del bacino clienti

Anthropic sta modificando la propria strategia di mercato, puntando a estendere la propria base clienti dalle grandi aziende alle piccole e medie imprese. Questa mossa riflette una crescente adozione degli LLM e solleva interrogativi sulle implicazio...

#Hardware #LLM On-Premise #DevOps
2026-05-13 TechCrunch AI

WhatsApp e Meta AI: la modalità "incognito" per conversazioni private

Meta ha introdotto una modalità "incognito" per le chat con Meta AI su WhatsApp. Questa funzionalità assicura che le conversazioni non vengano salvate e che i messaggi scompaiano automaticamente alla chiusura della chat. L'iniziativa sottolinea l'imp...

#Hardware #LLM On-Premise #DevOps
2026-05-13 TechCrunch AI

Anthropic supera OpenAI nel numero di clienti business, secondo i dati Ramp

Per la prima volta, Anthropic ha superato OpenAI nel numero di clienti business verificati, secondo l'ultimo AI Index della società fintech Ramp. Questo cambiamento nel panorama competitivo degli LLM evidenzia l'evoluzione delle preferenze aziendali ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-13 TechCrunch AI

Poppy: un assistente AI proattivo per organizzare la vita digitale

Poppy ha presentato un'applicazione basata sull'intelligenza artificiale, progettata per agire come assistente proattivo nella gestione della vita digitale. Connettendosi a calendari, email e messaggi, l'app è in grado di generare promemoria, suggeri...

#Hardware #LLM On-Premise #DevOps
2026-05-13 Tech.eu

Recursive Superintelligence: 650 milioni per l'AI che si auto-migliora

Recursive Superintelligence, una startup AI con sede a Londra, ha annunciato un finanziamento di 650 milioni di dollari, raggiungendo una valutazione di 4,65 miliardi. L'azienda persegue un approccio audace: sviluppare sistemi AI capaci di auto-migli...

#Hardware #LLM On-Premise #DevOps
2026-05-13 TechCrunch AI

Adaption lancia AutoScientist: l'automazione del Fine-tuning per LLM

Adaption ha presentato AutoScientist, un nuovo strumento basato sull'intelligenza artificiale che mira a semplificare e velocizzare il processo di fine-tuning dei Large Language Models. La soluzione automatizza l'adattamento dei modelli a capacità sp...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-13 LocalLLaMA

`llama.cpp` abilita la generazione continua per LLM su server e Web UI

Un recente aggiornamento per `llama.cpp` introduce il supporto per la generazione continua di testo sui Large Language Models (LLM) tramite le sue interfacce server e Web UI. Questa funzionalità migliora l'interazione con i modelli di ragionamento, o...

#Hardware #LLM On-Premise #DevOps
2026-05-13 Wired AI

L'era dell'AI: tra innovazione e complessità di deployment per le imprese

L'ascesa fulminea dell'intelligenza artificiale, in particolare dei Large Language Models, sta trasformando il panorama tecnicico. Le aziende si trovano di fronte a decisioni strategiche complesse riguardo al deployment di queste tecnicie, bilanciand...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-13 ArXiv cs.LG

QuIDE: Ottimizzare la Quantization per LLM e Reti Neurali

Un nuovo studio introduce QuIDE, un framework che propone l'Intelligence Index per valutare l'efficienza delle reti neurali quantizzate. Questo indice unifica compressione, accuratezza e latenza in un unico punteggio, rivelando come la quantization o...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-13 DigiTimes

Google I/O: Gemini plasma il futuro di Android, tra cloud e on-device

Google ha presentato al suo Android Show: I/O Edition una visione per il futuro di Android, profondamente integrata con il suo modello LLM Gemini. Questa mossa sottolinea la crescente importanza dell'intelligenza artificiale su dispositivo, sollevand...

#Hardware #LLM On-Premise #DevOps
2026-05-12 The Next Web

Googlebook: Android e Gemini, l'agente AI integrato nel sistema operativo

Google ha presentato Googlebook, una nuova linea di laptop premium che segna il superamento dei Chromebook. Questi dispositivi, in arrivo in autunno, integrano Android con Gemini a livello di sistema operativo, trasformando il cursore in un agente AI...

#Hardware #LLM On-Premise #DevOps
2026-05-12 The Next Web

n8n: Da Progetto Berlinese a Strato di Orchestrazione per l'AI di SAP

Nato nel 2019 come progetto personale per affrontare strumenti di automazione costosi e chiusi, n8n è diventato, a distanza di sette anni, lo strato di orchestrazione della piattaforma AI di SAP. Integrato in Joule Studio, l'ambiente per la creazione...

#LLM On-Premise #DevOps
2026-05-12 OpenAI Blog

AutoScout24 accelera lo sviluppo ingegneristico con i workflow AI

AutoScout24 Group sta integrando LLM come Codex e ChatGPT nei propri flussi di lavoro di ingegneria. L'obiettivo è ottimizzare i cicli di sviluppo, elevare la qualità del codice e promuovere una maggiore adozione dell'intelligenza artificiale all'int...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-12 The Next Web

LLM e formazione: nuove opportunità per un mercato del lavoro in evoluzione

Il panorama lavorativo in continua trasformazione richiede nuove strategie per lo sviluppo delle competenze. Gli LLM offrono strumenti innovativi per la formazione e l'orientamento professionale, ma il loro deployment efficace, specialmente in contes...

#Hardware #LLM On-Premise #DevOps
2026-05-12 TechCrunch AI

Google integra Gemini nella dettatura Gboard: implicazioni per l'edge AI

Google ha annunciato l'integrazione della tecnicia Gemini per la dettatura vocale direttamente in Gboard. Questa funzionalità di trascrizione sarà inizialmente disponibile sui dispositivi Samsung Galaxy e Google Pixel, segnando un passo significativo...

#Hardware #LLM On-Premise #DevOps
2026-05-12 TechCrunch AI

Google svela novità AI-first: dai laptop Googlebooks a Gemini su Chrome

Google ha presentato una serie di novità incentrate sull'intelligenza artificiale, anticipando l'evento I/O. Tra gli annunci spiccano i nuovi laptop Googlebooks con funzionalità AI-first, l'espansione delle capacità "agentic" di Gemini, l'integrazion...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-12 TechCrunch AI

Anthropic entra nel settore dei servizi legali basati su AI

Anthropic lancia una suite di funzionalità per assistere gli studi legali, segnando un'ulteriore accelerazione nel mercato dei servizi AI per il settore giuridico. La mossa evidenzia la crescente domanda di soluzioni che possano ottimizzare processi ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-12 TechCrunch AI

Google integra l'AI agentiva in Android: nuove capacità per Gboard

Google sta introducendo l'AI agentiva e widget "vibe-coded" nel sistema operativo Android. La suite Gemini Intelligence, in particolare, arricchirà Gboard con funzionalità avanzate di dettatura e compilazione automatica dei moduli, mirando a migliora...

#Hardware #LLM On-Premise #DevOps
2026-05-12 The Next Web

OpenAI lancia Daybreak: una nuova sfida nella cyber difesa aziendale

OpenAI ha presentato Daybreak, una nuova iniziativa di cybersecurity. La piattaforma mira a identificare vulnerabilità software, generare patch e validare correzioni all'interno delle codebase aziendali. Daybreak integra varianti di GPT-5.5 e Codex S...

#LLM On-Premise #DevOps
2026-05-12 LocalLLaMA

Benchmark Gemma 4 su H100: MTP e DFlash a confronto per LLM dense e MoE

Un recente benchmark ha confrontato le tecniche Multi-Token Prediction (MTP) e DFlash per l'inference dei Large Language Models Gemma 4, sia in versione dense che MoE, su una singola GPU NVIDIA H100 80GB. I risultati evidenziano come l'efficienza var...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-12 TechCrunch AI

Dessn raccoglie 6 milioni per strumenti di design AI integrati nel codice

La startup Dessn ha ottenuto un finanziamento di 6 milioni di dollari per sviluppare strumenti di design potenziati dall'intelligenza artificiale. La peculiarità di questi strumenti risiede nella loro capacità di operare direttamente con le codebase ...

#LLM On-Premise #DevOps
2026-05-12 The Next Web

Ditto ottiene 7,6 milioni di euro per riassunti AI di visite mediche

Ditto, una startup olandese nel settore health-tech, ha annunciato una raccolta fondi di 7,6 milioni di euro. L'azienda sviluppa soluzioni basate sull'intelligenza artificiale per generare riassunti delle visite mediche destinati ai pazienti. Il capi...

#Hardware #LLM On-Premise #DevOps
2026-05-12 Tech.eu

Tolemy Bio si assicura 1,4 milioni per l'AI nella biologia cellulare

La startup biotech Tolemy Bio ha raccolto 1,4 milioni di euro in un round di finanziamento pre-seed. L'obiettivo è avanzare nello sviluppo di Orbit, una piattaforma basata sull'intelligenza artificiale progettata per risolvere la frammentazione dei d...

#LLM On-Premise #DevOps
2026-05-12 DigiTimes

Cresce la domanda di CPU Arm per AGI, l'offerta è a rischio

La richiesta di CPU Arm destinate a carichi di lavoro di intelligenza artificiale generale (AGI) sta subendo un'impennata, sollevando preoccupazioni riguardo a potenziali vincoli nella catena di fornitura. Questa situazione evidenzia le sfide infrast...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-12 LocalLLaMA

Nemotron-3 Super 64B: 500.000 token di contesto su 48 GB VRAM per il coding

Un'implementazione del modello Nemotron-3 Super 64B, ottimizzata per il formato GGUF, dimostra la capacità di gestire una finestra di contesto di 500.000 token con soli 48 GB di VRAM, raggiungendo 21 token/secondo per compiti di coding. Questa scoper...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-11 The Next Web

GitLab si ristruttura per l'era degli agenti AI: tagli e riorganizzazione

GitLab ha annunciato una significativa ristrutturazione aziendale, che include tagli di posti di lavoro e una riorganizzazione interna. L'obiettivo è accelerare gli investimenti negli agenti AI, automatizzando processi interni come revisioni e approv...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-11 OpenAI Blog

L'adozione di ChatGPT si espande nel 2026: un segnale per l'IA mainstream

Nel primo trimestre del 2026, l'adozione di ChatGPT ha registrato una crescita significativa, in particolare tra gli utenti over 35 e con un uso più equilibrato tra i generi. Questi dati indicano una progressiva integrazione dell'IA nel quotidiano, p...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-11 TechCrunch AI

Digg rilancia con un aggregatore di notizie focalizzato sull'IA

Digg tenta un nuovo ritorno sulla scena digitale, questa volta posizionandosi come aggregatore di notizie focalizzato sull'intelligenza artificiale. L'iniziativa si inserisce nel crescente panorama dei servizi che sfruttano l'IA per la curatela e la ...

#Hardware #LLM On-Premise #DevOps
2026-05-11 The Next Web

OpenAI lancia una società di deployment da 4 miliardi di dollari

OpenAI ha annunciato la creazione di OpenAI Deployment Company, una nuova entità con un finanziamento iniziale di oltre 4 miliardi di dollari. La società, che sarà controllata a maggioranza da OpenAI, ha attratto un consorzio di 19 investitori, tra c...

#Hardware #LLM On-Premise #DevOps
2026-05-11 The Next Web

L'ascesa degli agenti AI di Claude e la crescente domanda di Mac mini

La crescente adozione degli agenti AI di Claude, in particolare per attività di coding e agentic workflow, sta generando un'impennata nella domanda di Mac mini. Questo trend evidenzia un interesse per soluzioni di elaborazione AI locali e self-hosted...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-11 DigiTimes

Advantech: Ricavi Record ad Aprile trainati dall'AI Edge

Advantech ha registrato un fatturato record ad aprile, spinto dalla crescente domanda di soluzioni di intelligenza artificiale all'edge. Questo trend evidenzia una chiara preferenza per l'elaborazione dei dati in prossimità della fonte, con implicazi...

#Hardware #LLM On-Premise #Fine-Tuning
← Torna ai Topic