Google ha annunciato l'integrazione della tecnicia Gemini per la dettatura vocale direttamente in Gboard. Questa funzionalità di trascrizione sarà inizialmente disponibile sui dispositivi Samsung Galaxy e Google Pixel, segnando un passo significativo verso l'elaborazione AI on-device e sollevando interrogativi sul futuro delle soluzioni di dettatura di terze parti.
Google e SpaceX sono in trattative per esplorare la possibilità di realizzare data center nello spazio. L'iniziativa mira a posizionare l'orbita terrestre come futura frontiera per il computing AI, nonostante i costi attuali rimangano notevolmente superiori rispetto alle soluzioni terrestri. Questa prospettiva solleva interrogativi sui modelli di deployment futuri e sulle implicazioni per la sovranità dei dati e l'infrastruttura.
OpenAI ha presentato Daybreak, una nuova iniziativa di cybersecurity. La piattaforma mira a identificare vulnerabilità software, generare patch e validare correzioni all'interno delle codebase aziendali. Daybreak integra varianti di GPT-5.5 e Codex Security, collaborando con partner di sicurezza enterprise. Questa mossa posiziona OpenAI in diretta competizione con Mythos di Anthropic, segnando un'espansione significativa nel settore della difesa informatica basata su Large Language Models (LLM).
Waymo ha annunciato il richiamo di 3.791 robotaxi negli Stati Uniti. La decisione, sollecitata dalle autorità federali, è dovuta a un difetto software che potrebbe indurre i veicoli a percorrere strade allagate a velocità elevate. Il problema riguarda le versioni di quinta e sesta generazione del sistema di guida autonoma Waymo Driver, evidenziando le sfide nella gestione della complessità dei sistemi AI in ambienti reali e l'importanza di rigorose pipeline di testing e validazione.
ExecuTorch estende l'ecosistema PyTorch per l'inference AI su dispositivi edge con risorse limitate. Arm ha rilasciato laboratori pratici Jupyter che esplorano il deployment su CPU e NPU Arm (Cortex-A, Cortex-M, Ethos-U), evidenziando i benefici in termini di latenza e privacy. L'articolo analizza come ExecuTorch ottimizzi i modelli per l'esecuzione locale, affrontando le sfide hardware e i trade-off di performance, un aspetto cruciale per i deployment on-premise.
Una recente indagine di HiddenLayer ha rivelato un repository malevolo su Hugging Face, camuffato da rilascio ufficiale di OpenAI, che ha distribuito un infostealer a macchine Windows. Con circa 244.000 download prima della rimozione, l'incidente evidenzia i crescenti rischi nella supply chain del software AI, specialmente per le organizzazioni che integrano modelli da registry pubblici nei loro ambienti aziendali, inclusi quelli self-hosted, con implicazioni dirette sulla sovranità dei dati e la sicurezza infrastrutturale.
Un alto funzionario dell'ICE ha rivelato che i sistemi Palantir consentono agli agenti di accedere a un elenco di 20 milioni di persone tramite iPhone, accelerando le operazioni di identificazione e arresto. La tecnicia ha aumentato il tasso di successo nel localizzare i bersagli dall'27% a quasi l'80%, riducendo i tempi di indagine da ore a minuti. Questo solleva questioni critiche sulla sovranità dei dati e l'etica del deployment di piattaforme di analisi avanzate.
NHS England ha concesso ai contractor, inclusa Palantir, un accesso più ampio ai dati identificabili dei pazienti tramite un nuovo ruolo amministrativo sulla Federated Data Platform da 330 milioni di sterline. Questa modifica consente al personale esterno di bypassare le approvazioni caso per caso, sollevando preoccupazioni tra i gruppi di pazienti e i parlamentari laburisti che la definiscono una mossa pericolosa per la privacy.
L'industria dell'intelligenza artificiale sta esplorando nuove strategie per gestire il crescente fabbisogno energetico dei data center. Nvidia e i suoi partner stanno sviluppando un progetto pilota per micro data center distribuiti, posizionati strategicamente vicino alle sottostazioni elettriche. L'obiettivo è ottimizzare l'utilizzo dell'energia disponibile e migliorare la flessibilità operativa, spostando i carichi di lavoro di inference in base alla disponibilità della rete, un approccio cruciale per i deployment on-premise e ibridi.
Una recente campagna di attacchi alla supply chain, denominata 'mini Shai Hulud', ha colpito gli ecosistemi di sviluppo npm e AI. Pacchetti compromessi di Mistral AI e TanStack potrebbero aver esposto credenziali sensibili di GitHub, ambienti cloud e sistemi CI/CD. L'incidente evidenzia i rischi crescenti per la sicurezza delle pipeline di sviluppo e l'importanza di pratiche robuste per la protezione dei dati e la sovranità, specialmente in contesti di deployment on-premise e ibridi.
Un caso studio su Reddit dimostra come sia possibile ridurre il consumo energetico di una GPU RTX 4090 fino al 40% del suo limite massimo durante l'Inference di LLM con `llama.cpp`, senza sacrificare le performance. Questa ottimizzazione, ottenuta tramite la limitazione del power limit, offre vantaggi significativi in termini di TCO, gestione termica e longevità dell'hardware per i deployment self-hosted.
SoftBank ha annunciato l'intenzione di produrre batterie proprietarie basate su tecnicia ad acqua per alimentare i propri data center dedicati all'intelligenza artificiale. L'obiettivo è raggiungere una capacità di produzione su scala gigawatt-ora entro il 2028, una mossa strategica per gestire l'elevato consumo energetico delle infrastrutture AI e rafforzare l'autonomia energetica.
Google ha identificato una vulnerabilità zero-day sviluppata da intelligenza artificiale, capace di aggirare l'autenticazione a due fattori. Questa scoperta, insieme all'emergere di malware auto-modificanti e backdoor basate su Gemini, segna l'inizio di una nuova era nel cybercrime. L'automazione avanzata, come i robot che producono altri robot, evidenzia la crescente complessità delle infrastrutture che necessitano di protezione contro queste minacce evolute.
Il CEO della startup svedese Tandem Health, Lukas Saari, evidenzia le difficoltà per i competitor statunitensi nel mercato europeo, spinto dalla crescente preferenza per fornitori locali, specialmente nel settore sanitario. Tandem, che impiega Large Language Models per un co-pilota AI clinico, capitalizza su questa tendenza, rafforzando la sua posizione come attore chiave in un contesto dove la sovranità dei dati e la compliance sono priorità assolute per le istituzioni europee.
La Presidente della Commissione Europea, Ursula von der Leyen, ha annunciato l'intenzione di estendere le protezioni online per i minori, proponendo regole a livello di blocco per l'età minima sui social media. Un'applicazione UE per la verifica dell'età è tecnicamente pronta, mentre alcuni Stati membri come Francia e Spagna hanno già avviato iniziative nazionali. Questo solleva questioni importanti sulla sovranità dei dati e l'implementazione di soluzioni conformi.
Il sistema operativo open source Haiku, erede spirituale di BeOS, ha raggiunto un traguardo significativo con l'introduzione del supporto SMP multi-core per architetture ARM64. Questa funzionalità, già operativa in ambienti virtualizzati, segna un passo avanti per l'OS, affiancandosi a una serie di altri miglioramenti implementati nel corso di aprile. L'avanzamento apre scenari interessanti per il deployment su hardware diversificato, inclusi potenziali ambienti on-premise.
Il procuratore generale del Texas, Ken Paxton, ha avviato un'azione legale contro Netflix, accusando la piattaforma di streaming di raccogliere dati utente senza consenso e di utilizzare il design 'addictivo' dell'autoplay, specialmente per i bambini. Netflix ha respinto le accuse, definendole prive di fondamento. La vicenda solleva questioni cruciali sulla sovranità dei dati e il controllo delle informazioni personali, temi centrali per le decisioni di deployment tecnicico.
Ditto, una startup olandese nel settore health-tech, ha annunciato una raccolta fondi di 7,6 milioni di euro. L'azienda sviluppa soluzioni basate sull'intelligenza artificiale per generare riassunti delle visite mediche destinati ai pazienti. Il capitale, guidato da Heal Capital, supporterà l'espansione in mercati chiave come Germania, Regno Unito e Spagna. Questo tipo di applicazione AI nel settore sanitario solleva importanti questioni riguardo la sovranità dei dati e le scelte di deployment.
White Circle ha chiuso un round Seed da 11 milioni di dollari per la sua piattaforma di monitoraggio, sicurezza e controllo dei modelli AI in produzione. Il supporto di figure chiave del settore e una base clienti che include grandi banche digitali evidenziano la crescente domanda di soluzioni per la gestione dell'intelligenza artificiale in ambienti enterprise.
Nscale, azienda specializzata in infrastrutture AI, ha ottenuto un finanziamento di 790 milioni di dollari per proseguire la costruzione del suo data center dedicato all'intelligenza artificiale a Narvik, nel nord della Norvegia. L'operazione sottolinea l'importanza degli investimenti in infrastrutture fisiche per supportare carichi di lavoro AI, un aspetto cruciale per le aziende che valutano deployment on-premise e la sovranità dei dati.