Archivio Notizie – Cronologia Completa Segnali AI

Jun 10 2026

Frameworks

SCAIL-2: Animazione di Personaggi End-to-End Senza Rappresentazioni Intermedie

SCAIL-2 è un modello open source che rivoluziona l'animazione di personaggi, consentendo un controllo end-to-end senza dipendere da rappresentazioni intermedie come mappe scheletriche. Basato su un training estensivo e un'interfaccia unificata, il modello offre capacità emergenti come la sostituzione di personaggi tra identità diverse e scenari di animazione animale, rappresentando un'alternativa flessibile per i professionisti che cercano soluzioni on-premise per carichi di lavoro AI.

→

Jun 10 2026

Hardware

Taiwan punta sulla fotonica al silicio per rafforzare la sua leadership nell'AI

Taiwan sta definendo una strategia industriale ambiziosa per l'intelligenza artificiale, identificando la fotonica al silicio come un elemento chiave per consolidare il proprio vantaggio competitivo. Questa mossa strategica mira a rafforzare la posizione dell'isola nella catena di fornitura globale dell'AI, puntando su tecnicie di interconnessione avanzate essenziali per i carichi di lavoro più esigenti.

→

Jun 10 2026

Market

La Cina respinge la lista USA: Alibaba, Baidu e BYD nel mirino militare

La Cina ha duramente criticato la decisione degli Stati Uniti di inserire Alibaba, Baidu e BYD in un elenco di aziende con presunti legami militari. Pechino definisce la mossa ingiustificata, evidenziando una crescente tensione geopolitica che impatta il settore tecnicico globale. Questo scenario spinge le aziende a riconsiderare le strategie di deployment, privilegiando soluzioni on-premise per la sovranità dei dati e il controllo infrastrutturale.

→

Jun 10 2026

Market

La corsa al foil di rame HVLP4: Nvidia e la sfida della supply chain

La crescente domanda di foil di rame HVLP4, componente chiave per l'imballaggio avanzato dei chip, sta intensificando la competizione tra i giganti del settore. Nvidia, corteggiando Co-Tech, evidenzia le pressioni sulla supply chain di hardware AI, con implicazioni dirette per i deployment on-premise e la pianificazione strategica delle infrastrutture.

→

Jun 10 2026

Market

L'inference AI ridefinisce la supply chain: nuove opportunità per InWin e Y.S. Tech

Il mercato dell'intelligenza artificiale sta vivendo una transizione significativa, con un'enfasi crescente sui carichi di lavoro di inference rispetto al training. Questo cambiamento sta generando nuove opportunità lungo la supply chain, in particolare per aziende come InWin e Y.S. Tech, specializzate in componenti hardware e soluzioni di raffreddamento. La domanda di infrastrutture ottimizzate per l'esecuzione di Large Language Models (LLM) on-premise sta guidando l'innovazione e la riorganizzazione del settore.

→

Jun 10 2026

Market

Sabertooth VC: quasi 500 milioni di dollari in startup AI senza un fondo tradizionale

Justin Ernest, fondatore di Sabertooth VC, ha adottato un approccio non convenzionale per investire quasi 500 milioni di dollari in startup di alto profilo come Anthropic, Anduril e SpaceX. Invece di dedicare tempo alla raccolta di un fondo di venture capital formale, Ernest ha sfruttato una rete privata di Limited Partners, dimostrando un modello di investimento agile e mirato per il settore tech in rapida evoluzione.

→

Jun 09 2026

Altro

L'AI nella produzione PCB è mainstream, ma la scalabilità resta una sfida

L'adozione dell'intelligenza artificiale nel settore della produzione di circuiti stampati (PCB) è ormai diffusa. Tuttavia, la scalabilità di queste soluzioni rappresenta ancora un ostacolo significativo per le aziende, che devono bilanciare l'innovazione con le esigenze operative e infrastrutturali. Questo è particolarmente vero in contesti che richiedono sovranità dei dati, bassa latenza e un'attenta valutazione del Total Cost of Ownership (TCO) per i deployment on-premise.

→

Jun 09 2026

Market

COMPUTEX 2026: Taiwan ridefinisce il suo ruolo nell'AI, da manifattura a design

Il COMPUTEX 2026 evidenzia una trasformazione nel ruolo di Taiwan nel panorama dell'intelligenza artificiale. Tradizionalmente un hub per la produzione di componenti hardware, l'isola sta ora spostando il suo focus verso la progettazione e lo sviluppo di soluzioni AI avanzate. Questo cambiamento strategico riflette un'ambizione crescente di controllare l'intera pipeline dell'innovazione AI, con implicazioni significative per la catena di fornitura globale e per le aziende che valutano deployment on-premise.

→

Jun 09 2026

Market

StepFun: IPO a Hong Kong per la startup AI cinese, mira a 12 miliardi di dollari

StepFun, una startup cinese specializzata in intelligenza artificiale, si prepara a un'offerta pubblica iniziale (IPO) a Hong Kong, puntando a una valutazione di 12 miliardi di dollari. Questa mossa evidenzia il dinamismo e l'enorme afflusso di capitali nel settore globale dell'AI, con implicazioni significative per le strategie di deployment e l'infrastruttura tecnicica.

→

Jun 09 2026

Altro

COMPUTEX: L'ascesa dei data center AI prefabbricati per deployment on-premise

Il COMPUTEX ha evidenziato una chiara tendenza verso i data center AI prefabbricati, segnalando un cambiamento strategico nel modo in cui le aziende implementano l'infrastruttura per carichi di lavoro di intelligenza artificiale. Questo approccio modulare promette maggiore velocità di deployment e controllo, aspetti cruciali per le organizzazioni che privilegiano la sovranità dei dati e l'efficienza operativa in ambienti on-premise o ibridi.

→

Jun 09 2026

Market

La domanda di AI spinge il mercato del rame: vendite GEM Terminals in forte crescita

GEM Terminals ha registrato un aumento del 72% nelle vendite di rame a maggio 2026, attribuendo la crescita alla crescente domanda generata dall'intelligenza artificiale. Questo dato sottolinea l'impatto significativo dell'espansione dell'AI sull'intera catena di approvvigionamento, influenzando i costi e la disponibilità delle infrastrutture hardware essenziali per i deployment on-premise di Large Language Models.

→

Jun 09 2026

Altro

ERC System svela Victor: l'eVTOL cargo ibrido per difesa e logistica

La startup bavarese ERC System ha presentato Victor a ILA Berlin 2026. Si tratta di un eVTOL cargo ibrido-elettrico senza equipaggio, progettato per applicazioni in difesa, logistica e risposta alle emergenze. Il velivolo è in grado di trasportare un carico utile di 250 kg per 300 km a una velocità di crociera di 250 km/h. Le prime consegne sono previste per il 2028.

→

Jun 09 2026

Market

Sabertooth VC: quasi 400 milioni investiti in startup senza un fondo tradizionale

Justin Ernest, fondatore di Sabertooth VC, ha investito circa 400 milioni di dollari in startup di spicco come Anthropic, Anduril e SpaceX. Ha adottato un approccio non convenzionale, sfruttando una rete chiusa di Limited Partners per bypassare il lungo processo di raccolta fondi tipico dei venture fund tradizionali, accelerando così i tempi di investimento e l'accesso a opportunità chiave nel settore tecnicico.

→

Jun 09 2026

Market

Supermicro punta a raccogliere 7 miliardi per evadere ordini di server AI da 39 miliardi

Supermicro, fornitore chiave di infrastrutture per l'intelligenza artificiale, ha annunciato l'intenzione di raccogliere 7 miliardi di dollari tramite offerte azionarie. L'operazione mira a finanziare l'acquisto di componenti necessari per evadere ordini di server AI per un valore di circa 39 miliardi di dollari, ricevuti da oltre 20 clienti. Questo riflette la crescente domanda di soluzioni hardware dedicate all'AI e le sfide legate alla supply chain.

→

Jun 09 2026

LLM

Notion e Codex: L'AI che moltiplica la potenza ingegneristica

Notion sfrutta modelli di linguaggio avanzati, come quelli ispirati a Codex, per ottimizzare i flussi di lavoro di sviluppo. L'integrazione mira a potenziare i team di ingegneria, accelerando la generazione di specifiche tecniche e lo sviluppo di funzionalità innovative come l'input vocale AI per il web. Questa strategia evidenzia il crescente impatto degli LLM nell'automazione e nell'efficienza dei processi aziendali.

→

Jun 09 2026

LLM

Anthropic Rilascia Claude Fable 5: Un Modello Mythos-Class con Controlli di Sicurezza

Anthropic ha annunciato il rilascio di Claude Fable 5, il suo primo modello "Mythos-class" accessibile al pubblico. Questa versione integra robuste misure di sicurezza progettate per bloccare risposte in ambiti sensibili come la cybersecurity e la biologia, offrendo un maggiore controllo e affidabilità per le applicazioni enterprise che richiedono conformità e sovranità dei dati.

→

Jun 09 2026

Altro

Alpine Linux 3.24: Migliorie all'Installer e l'Opzione COSMIC Desktop

Alpine Linux ha rilasciato la versione 3.24, introducendo significativi miglioramenti all'esperienza di installazione e l'opzione per il desktop COSMIC. Questa distribuzione Linux, nota per la sua leggerezza e sicurezza, è ampiamente adottata in contesti di container, micro-servizi e dispositivi embedded, ambiti cruciali per le architetture AI on-premise. Le novità rafforzano la sua posizione come scelta robusta per infrastrutture che richiedono controllo e sovranità dei dati.

→

Jun 09 2026

LLM

Anthropic presenta Claude Fable 5: un nuovo LLM 'state-of-the-art' per le imprese

Anthropic ha annunciato Claude Fable 5, il suo ultimo Large Language Model di frontiera. Il modello si distingue per prestazioni 'state-of-the-art' su quasi tutti i benchmark testati, promettendo nuove capacità per le aziende. La sua introduzione solleva questioni cruciali sui requisiti infrastrutturali per un deployment efficace, specialmente in contesti on-premise, dove la sovranità dei dati e il TCO assumono un ruolo centrale.

→

Jun 09 2026

LLM

Anthropic presenta Claude Fable 5: la creazione di videogiochi AI a portata di click

Anthropic ha svelato Claude Fable 5, un nuovo strumento basato su intelligenza artificiale che promette di semplificare la creazione di videogiochi, rendendola accessibile con un semplice click. Il tool è destinato a catturare l'attenzione dei "vibe coders" del web, evidenziando la crescente democratizzazione degli strumenti di sviluppo AI e le relative implicazioni per l'infrastruttura.

→

Jun 09 2026

LLM

Come Nextdoor sfrutta Codex e GPT-5.5 per l'ingegneria del software

Gli ingegneri di Nextdoor impiegano Codex, in combinazione con GPT-5.5, per ottimizzare i processi di sviluppo. L'obiettivo è affrontare problematiche complesse e difficili da replicare, facilitare la creazione di soluzioni multi-piattaforma e permettere ai team di concentrarsi maggiormente sui risultati di prodotto. L'adozione di questi strumenti mira a migliorare l'efficienza operativa interna.

→

Jun 09 2026

Hardware

NVIDIA RTX PRO 6000 Blackwell: Un Prezzo da Workstation per l'AI On-Premise

NVIDIA ha quotato la sua RTX PRO 6000 Blackwell Workstation Edition a 13.250 dollari sul marketplace ufficiale. Questo posizionamento di prezzo evidenzia l'investimento significativo richiesto per soluzioni hardware dedicate all'AI on-premise, offrendo ai professionisti un controllo totale sui carichi di lavoro e sulla sovranità dei dati, pur presentando un CapEx elevato. La GPU si rivolge a chi cerca performance elevate e autonomia per lo sviluppo e l'inference di Large Language Models.

→

Jun 09 2026

LLM

Anthropic limita Claude Fable 5 su temi sensibili per prevenire abusi

Anthropic ha rilasciato Claude Fable 5, un nuovo Large Language Model (LLM) che supera i modelli precedenti. Per mitigare i rischi di uso improprio, l'azienda ha implementato rigide salvaguardie che impediscono al modello di rispondere a domande su cybersecurity, biologia e chimica, reindirizzando tali richieste a un modello meno recente e avvisando l'utente. Questa strategia mira a prevenire l'assistenza ad attori malevoli, pur riconoscendo possibili "falsi positivi" per gli utenti comuni.

→

Jun 09 2026

Altro

Gruppi APT russi sfruttano una falla WinRAR già corretta in Ucraina

Due gruppi di hacking russi, legati allo stato, stanno attivamente sfruttando una vulnerabilità di tipo path traversal in WinRAR. La falla, identificata come CVE-2025-8088 e con un punteggio CVSS di 8.4, era stata corretta quasi un anno fa. L'obiettivo degli attacchi è il dispiegamento di malware per il furto di credenziali contro obiettivi governativi e militari ucraini, come rivelato da una ricerca di Trend Micro.

→

Jun 09 2026

Market

Rem3dy Health: 14 milioni di sterline per l'espansione globale delle vitamine 3D

Rem3dy Health, la società madre del brand di vitamine personalizzate Nourished, ha completato un round di finanziamento da 14 milioni di sterline, raggiungendo una valutazione di 84 milioni di sterline. L'investimento, guidato da attori strategici globali come Suntory e Apollo Hospitals, mira a supportare l'espansione internazionale delle sue soluzioni di vitamine personalizzate stampate in 3D.

→

Jun 09 2026

Market

L'impatto dei modelli AI efficienti sull'economia dell'intelligenza artificiale

La capacità di gestire carichi di lavoro AI complessi con modelli più efficienti e meno onerosi, mantenendo inalterata la qualità, potrebbe ridefinire radicalmente l'economia dell'intelligenza artificiale. Questa evoluzione offre nuove opportunità per il deployment on-premise, riducendo il TCO e rafforzando la sovranità dei dati, aspetti cruciali per le aziende che cercano alternative alle soluzioni cloud.

→

Jun 09 2026

LLM

Cohere rilascia North Mini Code: un LLM per deployment controllati

Cohere ha ufficialmente rilasciato North Mini Code, un nuovo LLM progettato per l'integrazione in ambienti di produzione. Il modello è disponibile su Hugging Face, anche in formato FP8, e può essere testato su OpenCode. La sua implementazione con vLLM richiede specifiche configurazioni e l'uso della libreria `cohere_melody`, evidenziando l'attenzione verso l'ottimizzazione per carichi di lavoro on-premise e la gestione di contesti estesi, aspetti cruciali per la sovranità dei dati e il TCO.

→

Jun 09 2026

Altro

L'IA di Apple e le Implicazioni per l'Framework Enterprise

Apple ha annunciato significativi miglioramenti per Siri, integrando ampiamente l'intelligenza artificiale. Questo sviluppo solleva interrogativi cruciali per le aziende riguardo le strategie di deployment di LLM, la sovranità dei dati e le scelte infrastrutturali tra soluzioni self-hosted e cloud, con un focus sul Total Cost of Ownership.

→

Jun 09 2026

LLM

Anthropic Rilascia Claude Fable 5: L'Intelligenza "Mythos-class" Diventa Pubblica

Anthropic ha annunciato il rilascio di Claude Fable 5, un Large Language Model basato sulla stessa architettura del suo sistema Mythos, finora ad accesso limitato. Questa mossa rende l'intelligenza di classe Mythos disponibile per la prima volta a clienti enterprise e abbonati a pagamento. Il modello integra nuove salvaguardie per bloccare risposte in settori sensibili come cybersecurity, biologia e chimica, un aspetto cruciale per i deployment aziendali.

→

Jun 09 2026

LLM

Cohere rilascia North Mini Code 1.0: un LLM da 30B per lo sviluppo di codice

Cohere ha reso disponibile la versione finale del suo Large Language Model North Mini Code 1.0, un modello da 30 miliardi di parametri ottimizzato per la generazione di codice. I pesi sono accessibili su Hugging Face, offrendo flessibilità per deployment on-premise. Le prime valutazioni lo posizionano in modo competitivo nell'indice di coding rispetto a modelli come Qwen 3.6 35B e Gemma 4 26B, pur mostrando un punteggio generale inferiore.

→

Jun 09 2026

LLM

Claude Fable 5 e Mythos 5: Nuovi LLM e le Sfide del Deployment On-Premise

L'emergere di nuovi Large Language Models come Claude Fable 5 e Mythos 5 solleva questioni cruciali per le aziende che valutano il deployment on-premise. AI-RADAR analizza le implicazioni in termini di requisiti hardware, sovranità dei dati e Total Cost of Ownership (TCO), evidenziando i trade-off tra controllo e complessità infrastrutturale per i carichi di lavoro AI.

→

Jun 09 2026

Altro

Atomicwork introduce gli 'AI Coworkers' per la gestione IT aziendale

Atomicwork, piattaforma IT enterprise con sede a Palo Alto, ha presentato una "forza lavoro AI governata" per i team di servizio. La soluzione permette alle aziende di rilasciare agenti AI, denominati "AI Coworkers", con ruoli, competenze, budget e permessi definiti, proponendo un modello di gestione analogo a quello dei dipendenti umani per i reparti IT.

→

Jun 09 2026

Market

Lovable: un report svela il nuovo volto dello sviluppo software

La piattaforma svedese Lovable, che permette di creare applicazioni tramite linguaggio naturale, ha pubblicato il suo primo report sulla "build economy". Basato su dati di utilizzo del prodotto e un sondaggio utenti condotti tra gennaio 2025 e maggio 2026, lo studio evidenzia un cambiamento significativo nel profilo di chi oggi realizza software. Con un fatturato di 500 milioni di dollari e 146 dipendenti, Lovable offre una prospettiva concreta sull'evoluzione del settore.

→

Jun 09 2026

Altro

Il Regno Unito investe 1,3 miliardi di sterline in hardware AI e adozione tecnicica

Il governo britannico ha annunciato un investimento di 1,3 miliardi di sterline per potenziare l'infrastruttura AI e favorirne l'adozione. L'iniziativa, presentata durante la London Tech Week, include un piano da 1,1 miliardi per l'hardware AI e un pacchetto da 200 milioni per l'integrazione della tecnicia, anche nel sistema giudiziario e per affrontare l'emergenza abitativa. Un segnale chiaro dell'impegno del Regno Unito verso la sovranità tecnicica e lo sviluppo di capacità AI locali.

→

Jun 09 2026

LLM

Anthropic lancia Claude Mythos 5 per partner e Fable 5 per il pubblico

Anthropic ha annunciato il rilascio di due nuove versioni del suo Large Language Model Claude. Claude Mythos 5 è destinato a organizzazioni selezionate e partner strategici, mentre Claude Fable 5 sarà disponibile per il pubblico generale, con l'azienda che ne garantisce l'impossibilità di utilizzo per attacchi informatici. Questa strategia evidenzia una segmentazione del mercato basata su requisiti di sicurezza e accesso.

→

Jun 09 2026

Altro

Valutare il Deployment di Large Language Models On-Premise: Sfide e Opportunità

L'adozione di Large Language Models (LLM) in ambito aziendale solleva questioni cruciali legate alla sovranità dei dati, al controllo infrastrutturale e al Total Cost of Ownership (TCO). Questo articolo esplora le complessità e i trade-off associati alla scelta di un deployment on-premise per i carichi di lavoro AI, analizzando i requisiti hardware e le implicazioni strategiche per le organizzazioni che cercano alternative alle soluzioni cloud.

→

Jun 09 2026

Altro

Anthropic e il monito sull'AI: lo sviluppo accelerato richiede più potenza di calcolo

Il recente avvertimento di Anthropic sui rischi dell'auto-miglioramento dell'intelligenza artificiale nasconde un messaggio cruciale: l'accelerazione dello sviluppo dei Large Language Models di frontiera è intrinsecamente legata alla disponibilità di ingenti risorse di calcolo. Questo solleva interrogativi fondamentali per le aziende che mirano a mantenere il controllo sui propri modelli AI, enfatizzando la necessità di investimenti infrastrutturali prima che si manifestino rischi di perdita di controllo.

→

Jun 09 2026

LLM

Anthropic rende pubblico Claude Fable 5, il suo primo LLM di classe Mythos

Anthropic ha rilasciato Claude Fable 5, il primo modello della sua serie "Mythos" accessibile al pubblico. L'LLM integra meccanismi di sicurezza avanzati, progettati per bloccare risposte in settori sensibili come la cybersecurity e la biologia, offrendo nuove opportunità ma anche sfide per il deployment enterprise che richiede controllo e sovranità dei dati.

→

Jun 09 2026

LLM

Unsloth: disponibili i modelli Gemma 4 QAT MTP per l'inference locale

Unsloth ha annunciato la disponibilità di nuovi modelli assistente basati sull'architettura Gemma 4 di Google, ottimizzati tramite Quantization-Aware Training (QAT). Questi LLM, distribuiti nel formato GGUF, sono offerti in diverse quantizzazioni, inclusa la `q8_0`, e in varie dimensioni. Questa release è strategica per i deployment on-premise, consentendo un'inference efficiente su hardware con risorse limitate e supportando scenari che richiedono sovranità dei dati e controllo sul TCO.

→

Jun 09 2026

Market

Commissione UE impone a Meta di aprire WhatsApp agli assistenti AI rivali

La Commissione Europea ha emesso un ordine provvisorio che impone a Meta di garantire l'accesso agli assistenti AI di terze parti su WhatsApp entro cinque giorni lavorativi. La decisione mira a salvaguardare la concorrenza nel mercato degli assistenti AI, prevenendo danni "gravi e irreparabili". Meta ha annunciato l'intenzione di ricorrere in appello contro il provvedimento.

→

Jun 09 2026

General

Apple: Dinosauro dell'IA o Predatore al Vertice?

For the better part of two years, the prevailing narrative in Silicon Valley has been that Apple was asleep at the wheel...

→

Jun 09 2026

Altro

Paesi Bassi: screening investimenti esteri in AI dal 2027 per la sicurezza nazionale

Il governo olandese estenderà il proprio regime di screening degli investimenti per includere l'intelligenza artificiale e altre cinque tecnicie strategiche a partire dal 1° gennaio 2027. La misura, che interesserà centinaia di aziende, mira a rafforzare la sicurezza nazionale contro operazioni cibernetiche, spionaggio e sabotaggio. La decisione, annunciata dalla Ministra dell'Economia Heleen Herbert, sottolinea la crescente attenzione alla sovranità tecnicica e al controllo delle infrastrutture critiche.

→

Jun 09 2026

Market

Non più FAANG: l'era MANGOS ridefinisce il panorama tech

Il settore tecnicico è in fermento, con SpaceX, Anthropic e OpenAI pronte a fare il loro ingresso in borsa. Questo scenario potrebbe segnare la fine dell'era FAANG, introducendo un nuovo acronimo, MANGOS, per identificare i giganti che plasmeranno il futuro dell'innovazione. La transizione riflette un'evoluzione delle dinamiche di mercato e delle tecnicie emergenti, in particolare nel campo dell'intelligenza artificiale e dell'esplorazione spaziale.

→

Jun 09 2026

Altro

Taiwan valuta il divieto penale sull'export di chip AI verso la Cina

Taiwan sta valutando l'introduzione di misure più severe per limitare l'esportazione di chip AI verso la Cina, estendendo i divieti oltre le attuali liste nere. La proposta renderebbe un reato penale il contrabbando di server contenenti questi componenti, con implicazioni significative per la catena di approvvigionamento globale e per le strategie di deployment on-premise di Large Language Models, influenzando il TCO e la sovranità dei dati.

→

Jun 09 2026

Market

Klarna lancia conti di risparmio ad alto rendimento negli USA: APY al 3,28%

Klarna, la società nota per i servizi "buy now, pay later", ha introdotto conti di risparmio ad alto rendimento negli Stati Uniti. Con un APY iniziale del 3,28%, questi conti sono assicurati dalla FDIC tramite WebBank. L'iniziativa mira a integrare i servizi di risparmio per i clienti esistenti, segnando un passo significativo nell'ambizione di Klarna di espandere la propria offerta bancaria e differenziarsi nel panorama finanziario digitale.

→

Jun 09 2026

Hardware

AI1: Il Data Center Orbitale di Musk con Payload da 120 kW e Chip Intercambiabili

Elon Musk ha svelato i dettagli del suo primo data center orbitale, l'AI1 Satellite. Questa piattaforma, più ampia di un Boeing 747, è progettata per ospitare un payload di calcolo da 120 kW, con picchi fino a 150 kW, e integra un sistema di chip intercambiabili. L'iniziativa segna un passo verso l'elaborazione dati avanzata nello spazio, offrendo nuove prospettive per carichi di lavoro AI e LLM.

→

Jun 09 2026

LLM

Anthropic: Mythos è un rischio pubblico, ma l'accesso si estende a 200 organizzazioni

Anthropic ha dichiarato che il suo modello Mythos è troppo efficace nel trovare vulnerabilità software per essere rilasciato pubblicamente, temendo che possa essere usato per attacchi a infrastrutture critiche o furti di dati. Nonostante ciò, l'azienda ha deliberatamente esteso l'accesso a 150 nuove organizzazioni, portando il totale a circa 200 in 15 paesi. Questa strategia mira a bilanciare il potenziale rischio con la necessità di ricerca e sviluppo controllato.

→

Jun 09 2026

Hardware

V100 a slot singolo e mezza altezza con NVLink: nuove opzioni per l'on-premise

In Cina sono emerse schede NVIDIA V100 personalizzate, caratterizzate da un design a slot singolo e mezza altezza con NVLink. Queste GPU, disponibili in versioni da 16GB e 32GB VRAM, offrono piena performance con opzioni di alimentazione flessibili (75W o 300W). Con un prezzo stimato inferiore a 220 dollari, rappresentano una soluzione interessante per deployment on-premise compatti e a basso costo, specialmente per carichi di lavoro di inference LLM.

→

Jun 09 2026

Altro

SpaceX svela Gigasat: una fabbrica da 1 GW/anno per l'AI satellitare entro il 2027

SpaceX ha annunciato la costruzione della fabbrica Gigasat, un'imponente struttura di 11 milioni di piedi quadrati dedicata alla produzione di data center spaziali. L'obiettivo è generare 1 GW di potenza di calcolo AI all'anno dai suoi satelliti entro la fine del 2027, segnando un'ambiziosa espansione nell'infrastruttura di calcolo per l'intelligenza artificiale con un focus sulla distribuzione nello spazio. Questa mossa solleva questioni cruciali su sovranità dei dati e TCO per i deployment AI.

→

Jun 09 2026

Market

AMD investe fino a 2 miliardi di sterline per la ricerca AI nel Regno Unito

AMD ha annunciato un investimento significativo, fino a 2 miliardi di sterline, destinato ad accelerare la ricerca sull'intelligenza artificiale nel Regno Unito. Questa mossa sottolinea l'importanza strategica di sviluppare capacità AI avanzate a livello locale, con potenziali ricadute sull'infrastruttura hardware e sui modelli di deployment on-premise per le aziende che operano nel paese. L'iniziativa mira a rafforzare la posizione del Regno Unito nel panorama globale dell'AI.

→

Jun 09 2026

Market

OpenAI verso la quotazione: deposito confidenziale alla SEC

OpenAI ha avviato il processo per la sua offerta pubblica iniziale (IPO) con un deposito riservato presso la Securities and Exchange Commission (SEC) statunitense. Questa mossa segna un passo significativo per l'azienda leader nell'intelligenza artificiale generativa, con potenziali ripercussioni sul panorama competitivo e sulle strategie di adozione dell'AI da parte delle imprese, che dovranno valutare attentamente le opzioni di deployment on-premise e cloud.

→

Jun 09 2026

Market

Nvidia e SK Hynix: un'alleanza che ridefinisce la corsa alle memorie per l'AI

L'accordo tra Nvidia e SK Hynix intensifica la competizione nel mercato delle memorie ad alte prestazioni, essenziali per i carichi di lavoro AI e LLM. Questa mossa mette sotto pressione giganti come Samsung e Micron, evidenziando la crescente domanda di soluzioni di memoria avanzate per l'inference e il training on-premise. L'alleanza potrebbe influenzare la disponibilità e il TCO per le infrastrutture AI self-hosted.

→

Jun 09 2026

Hardware

Tencent e la strategia duale per i chip AI: Canghai V2 e partnership locali

Tencent sta adottando un approccio "dual-track" per lo sviluppo dei suoi chip AI, combinando il processore proprietario Canghai V2 con partnership strategiche a livello nazionale. Questa strategia mira a rafforzare il controllo sulla catena di fornitura e a ottimizzare le prestazioni per i carichi di lavoro di intelligenza artificiale, riflettendo una crescente enfasi sulla sovranità tecnicica e sull'efficienza operativa per i deployment su larga scala.

→

Jun 09 2026

Market

Anthropic si Assicura un Finanziamento da 35 Miliardi di Dollari per la Capacità TPU

Anthropic ha ottenuto un pacchetto di prestiti privati da 35 miliardi di dollari, supportato da Broadcom, per assicurarsi capacità di Tensor Processing Units (TPU). Questo finanziamento evidenzia la crescente necessità di accesso a risorse di calcolo specializzate per lo sviluppo e il deployment di Large Language Models (LLM), sottolineando la corsa all'infrastruttura AI e le implicazioni per le strategie di deployment.

→

Jun 09 2026

Altro

L'infrastruttura AI: Delta e Liteon per alimentazione e stabilità dei carichi

Delta e Liteon si concentrano sulle esigenze critiche di alimentazione e stabilità dei carichi di lavoro AI. Con la crescente adozione di Large Language Models (LLM) e carichi computazionali intensivi, garantire un'infrastruttura energetica robusta e affidabile diventa fondamentale, specialmente per i deployment on-premise. Le soluzioni mirano a supportare l'efficienza e la resilienza dei sistemi AI.

→

Jun 09 2026

Market

Nvidia e Hyundai rafforzano la partnership AI in robotica e mobilità

Nvidia e Hyundai hanno annunciato un'espansione della loro collaborazione strategica nel campo dell'intelligenza artificiale. L'accordo mira a potenziare lo sviluppo di soluzioni avanzate per la robotica e la mobilità, settori chiave che richiedono capacità di elaborazione AI sempre più sofisticate. Questa partnership sottolinea l'importanza dell'integrazione hardware-software per affrontare le sfide computazionali legate all'AI in contesti critici, con implicazioni significative per le strategie di deployment on-premise e edge.

→

Jun 09 2026

Hardware

RISC-V: Prestazioni CPU Fino a 8x Superiori in Cinque Anni

Un'analisi recente evidenzia un notevole balzo in avanti nelle prestazioni delle CPU RISC-V, con miglioramenti fino a otto volte superiori nell'arco di cinque anni. Il confronto tra il nuovo SoC SpacemiT K3, un RISC-V RVA23 di prima generazione sul mercato, e la scheda SiFive HiFive Unmatched di cinque anni fa, rivela la rapida evoluzione dell'hardware RISC-V. Questo progresso apre nuove prospettive per i deployment on-premise e le soluzioni edge, offrendo alternative sempre più competitive.

→

Jun 09 2026

Altro

Onsemi lancia Elite Pairing Studio: ottimizzare la progettazione energetica per l'AI on-premise

Onsemi ha presentato Elite Pairing Studio, una nuova piattaforma software progettata per semplificare la complessa fase di progettazione dei sistemi di alimentazione. Questo strumento mira a migliorare l'efficienza e l'affidabilità delle soluzioni energetiche, un aspetto cruciale per le infrastrutture di calcolo ad alte prestazioni, in particolare per i carichi di lavoro AI e Large Language Models (LLM) che richiedono un'attenta gestione della potenza e del TCO nei deployment on-premise.

→

Jun 09 2026

Market

Crisi di capacità TSMC: Google e Nvidia guardano a Intel per la produzione di chip

Le limitazioni nella capacità produttiva di TSMC stanno spingendo giganti tecnicici come Google e Nvidia a esplorare alternative per la fabbricazione dei loro chip avanzati. Questo scenario posiziona Intel come un potenziale partner strategico, evidenziando le complesse dinamiche della supply chain dei semiconduttori e le sue implicazioni dirette per i futuri deployment di hardware AI, cruciali per le strategie on-premise e la sovranità dei dati.

→

Jun 09 2026

Hardware

Nvidia a Computex: il consolidamento di un'egemonia nell'AI hardware

Computex ha ribadito la posizione dominante di Nvidia nel panorama dell'hardware per l'intelligenza artificiale. L'evento ha evidenziato come le soluzioni del gigante del silicio siano diventate un pilastro per lo sviluppo e il deployment di Large Language Models, influenzando profondamente le strategie di infrastruttura, specialmente per chi valuta opzioni self-hosted e la sovranità dei dati.

→

Jun 09 2026

Altro

Green SM di VinFast punta all'India: le sfide AI per il ride-hailing on-premise

Green SM, sostenuta da VinFast, mira al mercato indiano del ride-hailing, espandendo la sua presenza oltre il Sud-Est asiatico. Questa mossa strategica solleva questioni cruciali per l'implementazione di soluzioni AI e Large Language Models (LLM) in un contesto di crescita rapida. L'analisi si concentra sulle implicazioni per la sovranità dei dati, i requisiti di performance e il Total Cost of Ownership (TCO) per le aziende che valutano deployment on-premise in settori ad alta intensità di dati.

→

Jun 09 2026

Hardware

Alluminio Riciclato: SuperAlloy Ridisegna la Filiera dei Semiconduttori

SuperAlloy sta focalizzando la propria strategia sulla filiera dei semiconduttori, promuovendo l'uso di alluminio riciclato. Questa iniziativa mira a integrare la sostenibilità in un settore chiave per l'innovazione tecnicica, rispondendo alla crescente domanda di resilienza nelle supply chain e di gestione responsabile delle risorse. L'adozione di materiali riciclati può influenzare positivamente il TCO e la stabilità dell'hardware per le infrastrutture AI on-premise.

→

Jun 09 2026

Market

Chief Telecom prevede un secondo semestre più forte grazie alla domanda di data center AI

Chief Telecom anticipa una crescita significativa nella seconda metà dell'anno, trainata dall'incremento della domanda per i data center dedicati all'intelligenza artificiale. Questo trend riflette la crescente necessità di infrastrutture robuste per supportare i carichi di lavoro intensivi degli LLM e le applicazioni AI, spingendo le aziende a valutare attentamente le opzioni di deployment on-premise e cloud.

→

Jun 09 2026

Market

Taiwan e l'AI: colmare il digital divide e spingere l'adozione nelle PMI

Taiwan sta sfruttando il suo consolidato ecosistema tecnicico per affrontare il digital divide e accelerare l'adozione dell'intelligenza artificiale tra le Piccole e Medie Imprese (PMI). L'iniziativa mira a superare il 12% di adozione, evidenziando l'importanza di infrastrutture locali e soluzioni AI accessibili per favorire la competitività e la sovranità dei dati, temi centrali per chi valuta deployment on-premise.

→

Jun 09 2026

Market

NoPo Nanotechnologies: l'India e la sfida dei materiali avanzati per i chip

NoPo Nanotechnologies, azienda indiana guidata dal Co-Founder e CEO Gadhadar Reddy, si concentra sullo sviluppo di materiali avanzati per colmare una lacuna critica nella filiera di approvvigionamento dei chip. Questa iniziativa è fondamentale per rafforzare la resilienza della supply chain globale e supportare la produzione di hardware essenziale per i Large Language Models (LLM), con implicazioni dirette per la sovranità dei dati e i deployment on-premise.

→

Jun 09 2026

Altro

MedicalRec: Un sistema di raccomandazione per l'AI medica che riduce sprechi e consumi

Un nuovo sistema, MedicalRec, mira a ottimizzare la selezione dei modelli per la classificazione di immagini mediche, riducendo il consumo energetico e gli sprechi computazionali. Basato su un dataset pubblico di oltre 5.000 record, il sistema offre un approccio più efficiente per l'adozione dell'AI in sanità, affrontando le sfide legate al TCO e all'impatto ambientale dei deployment on-premise.

→

Jun 09 2026

Market

Pitchdrive chiude un fondo da 60 milioni per le startup AI europee

Pitchdrive, investitore europeo di venture capital pre-seed, ha annunciato la chiusura del suo quarto fondo, raggiungendo 60 milioni di euro e superando l'obiettivo iniziale. Il fondo, interamente sostenuto da investitori privati, si concentrerà su aziende AI-native e su quelle i cui modelli di business sono profondamente trasformati dall'intelligenza artificiale, in particolare nei settori software, robotica, mobilità e hardware. L'aumento della dimensione del fondo riflette la crescente necessità di infrastrutture di calcolo significative per le startup AI in rapida scalabilità.

→

Jun 09 2026

Frameworks

RL offline per il controllo del plasma nella fusione nucleare: un nuovo benchmark

Un nuovo benchmark, RL4F, è stato introdotto per standardizzare lo sviluppo di controller di plasma basati su Offline Reinforcement Learning (RL) per la fusione nucleare. Affrontando i costi e i rischi delle sperimentazioni online, RL4F sfrutta dati storici del Tokamak DIII-D. Le valutazioni hanno mostrato che i metodi di RL offline basati su modelli offrono le migliori performance medie, sebbene nessun approccio prevalga su tutti i compiti. Il progetto è open source per stimolare la ricerca.

→

Jun 09 2026

LLM

OmniMem: Ottimizzare la Memoria per LLM Audio-Visivi a Lungo Raggio

OmniMem è un nuovo framework di streaming progettato per migliorare l'efficienza della memoria negli LLM audio-visivi. Affronta le limitazioni causate dalla crescita lineare dei token video e delle KV caches, introducendo una gestione della memoria consapevole della modalità e una selezione degli stati KV basata sulle perturbazioni. Questo approccio consente una compressione efficace senza compromettere la comprensione a lungo raggio, offrendo miglioramenti significativi in termini di accuratezza e rilevanza per i deployment on-premise.

→

Jun 09 2026

Market

Zaro raccoglie 5,1 milioni di dollari per unificare l'AI aziendale

La startup londinese Zaro ha annunciato un finanziamento pre-seed da 5,1 milioni di dollari per sviluppare una piattaforma che mira a risolvere la frammentazione degli strumenti, dei workflow e dei dati AI nelle aziende. La soluzione di Zaro propone uno spazio di lavoro adattivo unificato, basato su un "shared context layer" e un approccio multi-modello. Quest'ultimo permette di ottimizzare i costi operativi, indirizzando i carichi di lavoro a modelli AI più efficienti in base alla complessità, un aspetto cruciale per le decisioni di deployment.

→

Jun 09 2026

Frameworks

PathoSage: Un Framework Agente per la Patologia Computazionale con Valutazione Strutturata dell'Evidenza

PathoSage introduce un framework a tre stadi per la patologia computazionale, mirato a migliorare il ragionamento multimodale a livello di patch. Affronta le allucinazioni degli MLLM e i conflitti di evidenza nei sistemi agentici, separando recupero della conoscenza, raccolta e giudizio dell'evidenza. Il suo componente chiave, Structured Evidence Deliberation, valuta in modo indipendente le informazioni e analizza i conflitti, riducendo i bias. Il sistema include anche un meccanismo per modellare l'affidabilità degli strumenti.

→

Jun 09 2026

Market

fonio.ai raccoglie 17 milioni di dollari per la sua piattaforma AI omnichannel

La startup europea fonio.ai ha chiuso un round di finanziamento seed da 17 milioni di dollari, raggiungendo una valutazione di 140 milioni. L'azienda sviluppa agenti AI per automatizzare le interazioni con i clienti, con un focus iniziale sulla comunicazione vocale. I nuovi capitali supporteranno l'espansione verso una piattaforma omnichannel e l'internazionalizzazione, offrendo soluzioni per la gestione autonoma delle richieste e la sovranità dei dati.

→

Jun 09 2026

Market

ELAN: Droni e PC AI ridefiniscono il panorama dei ricavi aziendali

ELAN Technology, un attore nel settore tecnicico, prevede un cambiamento significativo nella propria struttura di ricavi. L'azienda identifica la crescente domanda di droni e l'espansione del mercato dei PC dotati di funzionalità AI come i principali motori di questa trasformazione. Questo spostamento strategico riflette l'evoluzione del panorama tecnicico, dove l'intelligenza artificiale e le applicazioni autonome stanno diventando sempre più centrali, influenzando le strategie di business e le opportunità di mercato per i fornitori di componenti e soluzioni.

→

Jun 09 2026

Market

COMPUTEX 2026: La corsa all'AI si sposta dalle GPU agli ecosistemi completi

Il COMPUTEX 2026 evidenzia un'evoluzione cruciale nel panorama dell'intelligenza artificiale: l'attenzione si sposta dalla mera potenza delle GPU all'integrazione di ecosistemi hardware e software. Questo cambiamento impone nuove considerazioni strategiche per le aziende che valutano deployment on-premise, enfatizzando il TCO e la sovranità dei dati.

→

Jun 09 2026

Altro

Violato Tchap, il messenger sovrano francese: disaccordo sull'entità della breccia

Il servizio di messaggistica crittografata Tchap, sviluppato dalla Francia per i propri funzionari pubblici al fine di garantire la sovranità dei dati e l'indipendenza da piattaforme come WhatsApp e Telegram, ha subito una violazione. L'ANSSI ha rilevato la compromissione il 7 giugno, ma l'entità dei dati esfiltrati rimane oggetto di contesa tra le autorità francesi e l'attaccante. L'incidente solleva interrogativi sulla sicurezza delle soluzioni self-hosted.

→

Jun 09 2026

Market

L'ecosistema Nvidia al COMPUTEX 2026: Implicazioni per il deployment on-premise

Al COMPUTEX 2026, l'ecosistema di Nvidia ha dominato il dibattito, evidenziando la sua influenza crescente nel settore dell'intelligenza artificiale. Questo scenario solleva questioni cruciali per le aziende che valutano strategie di deployment on-premise per i Large Language Models, toccando aspetti come la sovranità dei dati, il Total Cost of Ownership e la scelta dell'infrastruttura hardware.

→

Jun 09 2026

Altro

Nvidia traccia la rotta per l'AI PC, Intel pondera le prossime mosse

Nvidia ha delineato la sua visione per l'AI PC, spingendo per l'elaborazione AI on-device e la decentralizzazione dei carichi di lavoro. Contemporaneamente, Intel adotta un approccio più riflessivo, senza annunci di prodotto imminenti. Questa dinamica evidenzia le diverse strategie dei giganti del silicio e le implicazioni per il deployment di Large Language Models (LLM) on-premise, la sovranità dei dati e il Total Cost of Ownership (TCO) per le aziende che valutano soluzioni AI locali.

→

Jun 09 2026

Altro

Distanza Semantica come Strato di Routing: Un Modello Decentralizzato per la Scoperta On-Device

Un nuovo prototipo esplora un'alternativa decentralizzata ai tradizionali sistemi di scoperta basati su indici centrali. L'approccio propone di calcolare la rilevanza direttamente sui dispositivi, sfruttando modelli di embedding locali come EmbeddingGemma-300M e comunicazioni peer-to-peer. Questo elimina la necessità di server centralizzati, account e classifiche globali, spostando il controllo e la sovranità dei dati verso l'utente e l'edge. Un'innovazione con implicazioni significative per i deployment on-premise e la gestione autonoma degli LLM.

→

Jun 09 2026

Market

Alibaba intensifica la strategia AI: il CEO alla guida della nuova unità

Alibaba riorganizza la sua strategia nel campo dell'intelligenza artificiale, ponendo il CEO a capo di una nuova unità dedicata. Questa mossa sottolinea la crescente importanza commerciale dei Large Language Models e la necessità per le aziende di valutare attentamente le opzioni di deployment, tra cui soluzioni on-premise, per garantire controllo e sovranità dei dati.

→

Jun 09 2026

LLM

Qwen3.6-35B-A3B: Impatto della Quantization e del Contesto Lungo sul Tool Calling

Uno studio approfondito ha esaminato l'impatto delle diverse tecniche di quantization GGUF e della gestione della KV cache sulle performance di tool calling del modello Qwen3.6-35B-A3B. La ricerca, condotta su GPU NVIDIA V100, ha confrontato quantizzazioni di ByteShape e Unsloth, rivelando che la quantization q8_0 per la KV cache offre prestazioni simili a f16, mentre il contesto lungo degrada significativamente l'efficacia del modello. I risultati offrono spunti cruciali per l'ottimizzazione dei deployment LLM on-premise.

→

Jun 09 2026

Altro

Alibaba Cloud espande l'infrastruttura in Malesia con focus su AI agentica e sovranità dei dati

Alibaba Cloud ha inaugurato una nuova regione cloud a Johor, Malesia, rafforzando la sua presenza nel Sud-Est asiatico. L'espansione include il lancio di servizi AI agentici e infrastrutture dedicate per la sovranità dei dati, cruciali per le aziende locali e i settori regolamentati. L'azienda sottolinea anche l'importanza della costo-efficacia nella selezione dei modelli LLM per deployment su larga scala.

→

Jun 09 2026

LLM

Bussola Politica per LLM Locali: Valutare il Bias nei Modelli Fine-tuned

I benchmark di "bussola politica" offrono uno strumento per analizzare il bias nei Large Language Models. Sebbene finora si siano concentrati sui modelli cloud, emerge la necessità di estendere queste metodologie ai deployment on-premise, specialmente per i modelli sottoposti a fine-tuning o modifiche. Comprendere le deviazioni di bias è cruciale per le organizzazioni che gestiscono LLM localmente, garantendo controllo e sovranità sui dati.

→

Jun 09 2026

Altro

Deliverance AI emerge dal riserbo con un OS per l'IA sovrana on-premise

Deliverance AI ha annunciato la sua uscita dalla modalità stealth, rivelando un Agentic Operating System progettato per l'IA aziendale. Con £6 milioni di ARR e sei clienti enterprise in pochi mesi, l'azienda mira a offrire a governi e settori regolamentati un controllo granulare su modelli e dati, supportando deployment on-premise, privati e air-gapped per garantire sovranità dei dati e conformità.

→

Jun 09 2026

LLM

Modelli ternari per LLM: promessa non mantenuta o potenziale inespresso?

I Large Language Models (LLM) ternari, come BitNet, avevano suscitato grande interesse per la loro capacità di ridurre drasticamente i requisiti di memoria e computazione. Nonostante le promesse iniziali, il modello ternario più grande disponibile si ferma a 2 miliardi di parametri. Questo solleva interrogativi sul perché i principali laboratori di AI non stiano adottando questa tecnicia, specialmente per scenari di deployment on-premise dove l'efficienza è cruciale.

→

Jun 09 2026

LLM

Gemma 4 26B: QAT e quantizzazioni tradizionali a confronto

Un recente benchmark ha messo a confronto diverse versioni quantizzate del modello Gemma 4 26B di Google, inclusa una variante con Quantization Aware Training (QAT) a 8 bit, su un MacBook M5 Pro. I risultati suggeriscono che la versione QAT 8-bit potrebbe non superare le quantizzazioni tradizionali a 6 bit in termini di accuratezza, specialmente su task di HumanEval. Questo solleva interrogativi sull'efficacia del QAT come sostituto universale per le quantizzazioni esistenti, influenzando le decisioni di deployment on-premise.

→

Jun 09 2026

Market

Duely raccoglie 1,1 milioni di euro per innovare i servizi legali M&A con l'AI

La startup belga Duely ha ottenuto un finanziamento di 1,1 milioni di euro per espandere i suoi servizi legali "AI-native" nel settore delle fusioni e acquisizioni (M&A). L'azienda, che ha sviluppato una tecnicia proprietaria per automatizzare le attività documentali intensive, intende accelerare la crescita in Europa e rafforzare la sua posizione nel mercato emergente dei servizi professionali basati sull'intelligenza artificiale, offrendo consulenza diretta anziché licenze software.

→

Jun 09 2026

Altro

Omi Med STT v1: ASR medico on-device per la sovranità dei dati sanitari

Omi Health ha rilasciato Omi Med STT v1, un modello ASR da 0.6B basato su NVIDIA Parakeet, ottimizzato per il parlato clinico. Progettato per l'esecuzione locale su Mac, Windows e Linux, il modello offre elevate prestazioni e mantiene i dati sensibili dei pazienti sul dispositivo, affrontando le sfide di privacy e sovranità. Il suo fine-tuning mirato lo rende competitivo con soluzioni cloud, con un focus sulla velocità di elaborazione locale.

→

Jun 09 2026

Market

Merchantee ottiene 1,8 milioni di euro per espandere l'AI nell'e-commerce europeo

Merchantee, specializzata in strumenti di intelligenza di mercato basati sull'AI per venditori e-commerce, ha ottenuto un finanziamento di 1,8 milioni di euro. L'investimento, guidato da Reflex Capital, supporterà lo sviluppo del prodotto e l'espansione in Europa, partendo da Polonia e Germania. La piattaforma automatizza la gestione di prezzi e promozioni su più marketplace, aiutando i merchant a navigare la crescente complessità del commercio digitale e a ottimizzare le operazioni senza aumentare le risorse umane.

→

Jun 09 2026

LLM

silx-ai/Quasar-Preview: Un LLM con finestra di contesto da 5 milioni di token

Il modello Quasar-Preview di silx-ai si distingue per una finestra di contesto eccezionalmente ampia, pari a 5 milioni di token. Questa capacità permette di elaborare volumi di dati senza precedenti, aprendo nuove frontiere per applicazioni aziendali che richiedono l'analisi di documenti estesi o intere basi di codice. Tale caratteristica solleva importanti considerazioni per il deployment on-premise, in termini di requisiti hardware e gestione delle risorse.

→

Jun 09 2026

Altro

ICEYE raccoglie oltre 1 miliardo di euro: spinta all'intelligence spaziale sovrana

ICEYE, azienda finlandese di tecnicia spaziale, ha completato un round di finanziamento di Serie F da oltre 1 miliardo di euro, raggiungendo una valutazione superiore ai 10 miliardi di euro. L'investimento, guidato da General Atlantic e con la partecipazione strategica di Nokia, mira a espandere la costellazione di satelliti SAR e a soddisfare la crescente domanda globale di sistemi di intelligence spaziale sovrana, rafforzando il controllo dei dati e l'autonomia strategica per governi e organizzazioni.

→

Jun 09 2026

Frameworks

ggml-webgpu: Prefill più rapidi per LLM quantizzati su Apple Silicon

Un recente aggiornamento per `ggml-webgpu` introduce significativi miglioramenti nelle velocità di prefill per i Large Language Models (LLM) quantizzati, in particolare i formati "k-quants". I test su Apple M2 Pro mostrano accelerazioni fino a 3.78x, rendendo l'inference locale più efficiente. Questi progressi sono cruciali per i deployment on-premise e edge, dove l'ottimizzazione delle risorse hardware e la sovranità dei dati sono prioritarie, riducendo il TCO e la dipendenza dal cloud.

→

Jun 09 2026

Altro

Aavuus: Finanziamento Pre-Seed per il tracciamento di precisione dei detriti spaziali

La startup finlandese Aavuus ha ottenuto un finanziamento Pre-Seed da Maki.vc per sviluppare una rete globale di stazioni laser terrestri. L'obiettivo è superare i limiti attuali nel tracciamento degli oggetti in orbita terrestre bassa, fornendo dati più rapidi e precisi per la sicurezza spaziale e la prevenzione delle collisioni. L'iniziativa risponde alla crescente sfida dei detriti spaziali, un problema critico per gli operatori satellitari e per la sostenibilità dell'economia spaziale.

→

Jun 09 2026

LLM

Apple: un LLM da 20 miliardi di parametri esegue l'inference dalla flash dell'iPhone

La conferenza sviluppatori di Apple ha messo in evidenza una Siri rinnovata. Tuttavia, la vera innovazione risiede in un modello AI da 20 miliardi di parametri che, pur essendo troppo grande per la RAM di un iPhone, riesce a eseguire l'inference direttamente dalla memoria flash del dispositivo. Questa soluzione tecnica, dettagliata in un post dedicato, apre nuove prospettive per l'esecuzione di Large Language Models on-device, con implicazioni significative per la sovranità dei dati e l'efficienza computazionale.

→

Jun 09 2026

Altro

L'IA Agente: la prossima frontiera per la finanza aziendale, tra coordinamento e controllo

L'intelligenza artificiale generativa ha già trasformato la gestione delle informazioni aziendali. La nuova sfida per le imprese, in particolare nel settore finanziario, è l'IA agente: sistemi capaci di coordinare processi complessi tra diversi sistemi di business. Questo richiede di bilanciare l'automazione con la necessità di mantenere controlli rigorosi, tracciabilità e responsabilità umana, aspetti cruciali per l'adozione in contesti critici.

→

Jun 09 2026

Altro

Zaro emerge dalla stealth con 5,1 milioni di dollari per l'AI on-premise

La startup londinese Zaro ha raccolto 5,1 milioni di dollari in un round pre-seed guidato da Cherry Ventures. L'obiettivo è sviluppare un ambiente di lavoro AI che le aziende possano possedere e controllare direttamente, in contrasto con le soluzioni basate su fornitori esterni. Questo approccio mira a rafforzare la sovranità dei dati e il controllo infrastrutturale, attirando investitori di spicco del settore AI.

→

Jun 09 2026

LLM

La Sorprendente Competenza di Gemma 4 31B nei Deployment LLM Locali

Un utente accademico ha riscontrato prestazioni inattese da Gemma 4 31B nell'analisi di codice complesso, superando Qwen 3.6 e Opus 4.7. La capacità del modello di comprendere le interdipendenze del codice suggerisce nuove metriche per la valutazione dei Large Language Models in contesti on-premise, dove il controllo e la precisione sono cruciali per la sovranità dei dati e l'ottimizzazione del TCO.

→

Jun 09 2026

LLM

LFM2.5-8B-A1B: L'LLM da 8B gira su CPU con Rust, efficienza on-premise

Un nuovo progetto open source dimostra la fattibilità di eseguire LLM da 8 miliardi di parametri interamente su CPU. L'implementazione Rust-native di LFM2.5-8B-A1B, testata su un Ryzen 7950x, raggiunge circa 37 token/s in fase di decodifica, con un consumo di memoria di circa 7GB. Questo approccio sottolinea il potenziale per deployment on-premise, offrendo controllo sui dati e riducendo la dipendenza da infrastrutture GPU costose, pur richiedendo ottimizzazioni per la fase di prefill.

→

Jun 09 2026

Frameworks

Apple introduce CoreAI: inference on-device potenziata per i suoi chip

Apple ha presentato CoreAI, un nuovo framework per l'inference di Large Language Models direttamente sui dispositivi con Apple Silicon. Progettato per superare le limitazioni di CoreML, CoreAI mira a ottimizzare le operazioni on-device, supportando modelli fino a 20 miliardi di parametri e rafforzando la capacità di elaborazione locale su iPhone e iPad. Questa mossa sottolinea l'impegno di Apple verso l'AI distribuita e il controllo dei dati.

→

Jun 09 2026

Hardware

Jetson Orin NX: LLM on-premise e benchmarking per Hermes Agent

Un utente ha riadattato un NVIDIA Jetson Orin NX per l'inference di Large Language Models (LLM) on-premise, trasformandolo da un server ingombrante a una soluzione compatta e silenziosa. L'obiettivo era superare i 10 token/s e supportare una finestra di contesto di 65K per Hermes Agent, con un consumo di 40W. I test con Gemma 4 26B A4B UD Q2_K_XL hanno confermato una finestra di contesto di 66K e performance di 14.65 token/s a 8K di contesto, scendendo a 10.21 token/s a 60K, evidenziando il potenziale degli LLM su hardware edge.

→

Jun 09 2026

Altro

Jetson Orin NX per LLM on-premise: performance e sfide di un deployment edge

Un progetto ha esplorato il riutilizzo di un NVIDIA Jetson Orin NX per l'inference di Large Language Models (LLM) on-premise, focalizzandosi su silenziosità e performance. Nonostante le sfide termiche dovute all'aumento del consumo energetico, il sistema ha raggiunto una finestra di contesto di 66K e un throughput di oltre 10 token/s con il modello Gemma 4 26B, dimostrando il potenziale dell'hardware edge per carichi di lavoro AI specifici e controllati.

→

Jun 09 2026

Market

OpenAI avvia la procedura confidenziale per l'IPO, seguendo Anthropic

OpenAI, l'azienda dietro ChatGPT, ha avviato in via confidenziale la procedura per la quotazione in borsa. Questa mossa segue di pochi giorni una decisione analoga da parte del suo concorrente Anthropic, segnalando una fase di maturazione e consolidamento nel mercato dei Large Language Models (LLM) e sollevando interrogativi sulle future strategie di deployment per le aziende.

→

🗄️ Archivio Notizie