SpaceX ha annunciato la costruzione della fabbrica Gigasat, un'imponente struttura di 11 milioni di piedi quadrati dedicata alla produzione di data center spaziali. L'obiettivo è generare 1 GW di potenza di calcolo AI all'anno dai suoi satelliti entro la fine del 2027, segnando un'ambiziosa espansione nell'infrastruttura di calcolo per l'intelligenza artificiale con un focus sulla distribuzione nello spazio. Questa mossa solleva questioni cruciali su sovranità dei dati e TCO per i deployment AI.
Delta e Liteon si concentrano sulle esigenze critiche di alimentazione e stabilità dei carichi di lavoro AI. Con la crescente adozione di Large Language Models (LLM) e carichi computazionali intensivi, garantire un'infrastruttura energetica robusta e affidabile diventa fondamentale, specialmente per i deployment on-premise. Le soluzioni mirano a supportare l'efficienza e la resilienza dei sistemi AI.
Onsemi ha presentato Elite Pairing Studio, una nuova piattaforma software progettata per semplificare la complessa fase di progettazione dei sistemi di alimentazione. Questo strumento mira a migliorare l'efficienza e l'affidabilità delle soluzioni energetiche, un aspetto cruciale per le infrastrutture di calcolo ad alte prestazioni, in particolare per i carichi di lavoro AI e Large Language Models (LLM) che richiedono un'attenta gestione della potenza e del TCO nei deployment on-premise.
Green SM, sostenuta da VinFast, mira al mercato indiano del ride-hailing, espandendo la sua presenza oltre il Sud-Est asiatico. Questa mossa strategica solleva questioni cruciali per l'implementazione di soluzioni AI e Large Language Models (LLM) in un contesto di crescita rapida. L'analisi si concentra sulle implicazioni per la sovranità dei dati, i requisiti di performance e il Total Cost of Ownership (TCO) per le aziende che valutano deployment on-premise in settori ad alta intensità di dati.
Un nuovo sistema, MedicalRec, mira a ottimizzare la selezione dei modelli per la classificazione di immagini mediche, riducendo il consumo energetico e gli sprechi computazionali. Basato su un dataset pubblico di oltre 5.000 record, il sistema offre un approccio più efficiente per l'adozione dell'AI in sanità, affrontando le sfide legate al TCO e all'impatto ambientale dei deployment on-premise.
Il servizio di messaggistica crittografata Tchap, sviluppato dalla Francia per i propri funzionari pubblici al fine di garantire la sovranità dei dati e l'indipendenza da piattaforme come WhatsApp e Telegram, ha subito una violazione. L'ANSSI ha rilevato la compromissione il 7 giugno, ma l'entità dei dati esfiltrati rimane oggetto di contesa tra le autorità francesi e l'attaccante. L'incidente solleva interrogativi sulla sicurezza delle soluzioni self-hosted.
Nvidia ha delineato la sua visione per l'AI PC, spingendo per l'elaborazione AI on-device e la decentralizzazione dei carichi di lavoro. Contemporaneamente, Intel adotta un approccio più riflessivo, senza annunci di prodotto imminenti. Questa dinamica evidenzia le diverse strategie dei giganti del silicio e le implicazioni per il deployment di Large Language Models (LLM) on-premise, la sovranità dei dati e il Total Cost of Ownership (TCO) per le aziende che valutano soluzioni AI locali.
Un nuovo prototipo esplora un'alternativa decentralizzata ai tradizionali sistemi di scoperta basati su indici centrali. L'approccio propone di calcolare la rilevanza direttamente sui dispositivi, sfruttando modelli di embedding locali come EmbeddingGemma-300M e comunicazioni peer-to-peer. Questo elimina la necessità di server centralizzati, account e classifiche globali, spostando il controllo e la sovranità dei dati verso l'utente e l'edge. Un'innovazione con implicazioni significative per i deployment on-premise e la gestione autonoma degli LLM.
Alibaba Cloud ha inaugurato una nuova regione cloud a Johor, Malesia, rafforzando la sua presenza nel Sud-Est asiatico. L'espansione include il lancio di servizi AI agentici e infrastrutture dedicate per la sovranità dei dati, cruciali per le aziende locali e i settori regolamentati. L'azienda sottolinea anche l'importanza della costo-efficacia nella selezione dei modelli LLM per deployment su larga scala.
Deliverance AI ha annunciato la sua uscita dalla modalità stealth, rivelando un Agentic Operating System progettato per l'IA aziendale. Con £6 milioni di ARR e sei clienti enterprise in pochi mesi, l'azienda mira a offrire a governi e settori regolamentati un controllo granulare su modelli e dati, supportando deployment on-premise, privati e air-gapped per garantire sovranità dei dati e conformità.
Omi Health ha rilasciato Omi Med STT v1, un modello ASR da 0.6B basato su NVIDIA Parakeet, ottimizzato per il parlato clinico. Progettato per l'esecuzione locale su Mac, Windows e Linux, il modello offre elevate prestazioni e mantiene i dati sensibili dei pazienti sul dispositivo, affrontando le sfide di privacy e sovranità. Il suo fine-tuning mirato lo rende competitivo con soluzioni cloud, con un focus sulla velocità di elaborazione locale.
ICEYE, azienda finlandese di tecnicia spaziale, ha completato un round di finanziamento di Serie F da oltre 1 miliardo di euro, raggiungendo una valutazione superiore ai 10 miliardi di euro. L'investimento, guidato da General Atlantic e con la partecipazione strategica di Nokia, mira a espandere la costellazione di satelliti SAR e a soddisfare la crescente domanda globale di sistemi di intelligence spaziale sovrana, rafforzando il controllo dei dati e l'autonomia strategica per governi e organizzazioni.
La startup finlandese Aavuus ha ottenuto un finanziamento Pre-Seed da Maki.vc per sviluppare una rete globale di stazioni laser terrestri. L'obiettivo è superare i limiti attuali nel tracciamento degli oggetti in orbita terrestre bassa, fornendo dati più rapidi e precisi per la sicurezza spaziale e la prevenzione delle collisioni. L'iniziativa risponde alla crescente sfida dei detriti spaziali, un problema critico per gli operatori satellitari e per la sostenibilità dell'economia spaziale.
L'intelligenza artificiale generativa ha già trasformato la gestione delle informazioni aziendali. La nuova sfida per le imprese, in particolare nel settore finanziario, è l'IA agente: sistemi capaci di coordinare processi complessi tra diversi sistemi di business. Questo richiede di bilanciare l'automazione con la necessità di mantenere controlli rigorosi, tracciabilità e responsabilità umana, aspetti cruciali per l'adozione in contesti critici.
La startup londinese Zaro ha raccolto 5,1 milioni di dollari in un round pre-seed guidato da Cherry Ventures. L'obiettivo è sviluppare un ambiente di lavoro AI che le aziende possano possedere e controllare direttamente, in contrasto con le soluzioni basate su fornitori esterni. Questo approccio mira a rafforzare la sovranità dei dati e il controllo infrastrutturale, attirando investitori di spicco del settore AI.
Un progetto ha esplorato il riutilizzo di un NVIDIA Jetson Orin NX per l'inference di Large Language Models (LLM) on-premise, focalizzandosi su silenziosità e performance. Nonostante le sfide termiche dovute all'aumento del consumo energetico, il sistema ha raggiunto una finestra di contesto di 66K e un throughput di oltre 10 token/s con il modello Gemma 4 26B, dimostrando il potenziale dell'hardware edge per carichi di lavoro AI specifici e controllati.
La distribuzione Ubuntu MATE proseguirà il suo sviluppo, nonostante l'assenza di una versione 26.04 e il recente cambio di leadership. A marzo, Martin Wimpress ha lasciato la guida del progetto, cercando nuovi contributori per mantenere attiva questa derivata di Ubuntu con il suo ambiente desktop basato su GNOME2. La notizia aveva generato preoccupazioni tra gli utenti, ma il team ha rassicurato sulla continuità del progetto.
Apple ha svelato "Apple Intelligence", un aggiornamento significativo per Siri. La nuova "Siri AI", in arrivo in autunno, integrerà modelli Foundation on-device potenziati da Google e funzionalità AI trasversali ai sistemi operativi. L'azienda ha enfatizzato un approccio incentrato sull'utente, mirando a un'esperienza conversazionale che superi le singole richieste, con elaborazione locale per maggiore privacy e reattività.
Alla WWDC 2026, Apple ha presentato significativi miglioramenti per Siri, potenziati dall'intelligenza artificiale, insieme a novità per iOS 27 e "Apple Intelligence". Sebbene l'annuncio si concentri sull'esperienza utente, l'integrazione pervasiva dell'AI in funzioni critiche solleva interrogativi fondamentali per le aziende che valutano strategie di deployment on-premise. La gestione di carichi di lavoro AI su infrastrutture locali diventa cruciale per la sovranità dei dati e il controllo sui processi di inference.
Alla WWDC, Apple ha presentato una serie di miglioramenti software e funzionalità attese, culminando con l'introduzione di una versione potenziata di Siri basata sull'AI. L'azienda intende integrare l'intelligenza artificiale come un elemento chiave all'interno di un più ampio sforzo di evoluzione del proprio ecosistema, piuttosto che come una tecnicia isolata. Questo approccio solleva interrogativi sulle strategie di deployment AI, rilevanti anche per le aziende che valutano soluzioni on-premise.