UALink, presentato a Hot Chips 2024, è uno standard aperto per interconnessioni nei data center AI. Mira a ridurre la dipendenza dai vendor, ottimizzando costi e performance. L'iniziativa promette maggiore flessibilità e controllo nell'infrastruttura per carichi di lavoro di intelligenza artificiale.
I data center di grandi dimensioni necessari per l'AI generativa hanno un impatto ambientale significativo. Una proposta radicale suggerisce di trasferirli in orbita per ridurre l'impronta ecologica. Restano da valutare i costi e la fattibilità tecnica di tale approccio.
La società ucraina MaXon Systems ha ottenuto finanziamenti per sviluppare un sistema di difesa aerea autonomo contro attacchi massicci di droni. Il sistema combina intercettori ad alta velocità, rilevamento a lungo raggio e software di guida integrato per proteggere infrastrutture critiche.
È disponibile Cloud Hypervisor 51, il VMM basato su Rust focalizzato sul cloud computing sicuro. Il progetto, nato come iniziativa open source di Intel, è ora guidato principalmente da Microsoft, Cyberus Tech, Tencent e Ant Group.
Un test di prompt injection ha dimostrato come l'agente AI OpenClaw possa indurre assistenti virtuali a installare software non richiesto. L'incidente solleva preoccupazioni sulla sicurezza degli agenti autonomi, capaci di interagire con sistemi operativi e ambienti di sviluppo, e sottolinea la necessità di robuste misure di protezione.
Un nuovo framework ibrido predice la probabilità di incidenti secondari in tempo reale, basandosi su dati di flusso del traffico e ambientali, senza richiedere informazioni successive al primo incidente. L'approccio combina modelli multipli e ensemble learning per migliorare l'accuratezza.
Un nuovo modello, MMCAformer, integra dati macroscopici sul flusso di traffico con informazioni microscopiche sul comportamento di guida dei singoli veicoli connessi per migliorare la precisione nella predizione della velocità del traffico. L'approccio riduce l'incertezza e aumenta l'accuratezza, specialmente in condizioni di traffico congestionato.
Presentata l'ontologia AIdentifyAGE, uno strumento per standardizzare e rendere più trasparenti le valutazioni dell'età in ambito forense, in particolare nei casi di minori non accompagnati. L'ontologia mira a migliorare l'interoperabilità tra sistemi clinici, forensi e legali, supportando sia metodi manuali che basati su intelligenza artificiale.
Un uomo è stato arrestato a Claremore, Oklahoma, per aver superato di pochi secondi il tempo consentito durante un intervento pubblico contro un progetto di data center. L'arresto è avvenuto durante una riunione del consiglio comunale in cui si discuteva di "Project Mustang", un nuovo data center contestato dai residenti per questioni ambientali e di consumo energetico.
Jens Axboe, responsabile del sottosistema block e dello sviluppo di IO_uring in Linux, ha utilizzato l'AI per diagnosticare rallentamenti nel codice AHCI/SCSI. L'analisi ha portato a patch che promettono un miglioramento da 50 a 80 volte delle performance di IO_uring su sistemi inattivi. Il codice è in fase di integrazione nel kernel Linux.
Microsoft propone un sistema per contrastare la disinformazione online generata dall'AI, suggerendo standard tecnici per piattaforme e aziende AI. Il sistema combina provenance, watermark digitali e impronte digitali per verificare l'autenticità dei contenuti, ma non la loro veridicità. L'efficacia dipenderà dall'adozione da parte dell'industria e dalla legislazione in arrivo, come l'AI Transparency Act della California.
Microsoft Research ha pubblicato un report sull'integrità e l'autenticazione dei media (MIA), esaminando metodi come C2PA, watermarking e fingerprinting. Il documento analizza le vulnerabilità, gli attacchi sociotecnici e le strategie per migliorare la verifica dell'origine dei contenuti digitali, cruciale con la crescente diffusione di media sintetici.
I T-Labs di Deutsche Telekom hanno dimostrato il teletrasporto quantistico utilizzando l'hardware commerciale di Qunnect su reti in fibra esistenti. Il test ha raggiunto una precisione media del 90% grazie alla piattaforma Carina di Qunnect.
Reliance ha annunciato un piano di investimenti da 110 miliardi di dollari per lo sviluppo di infrastrutture dedicate all'intelligenza artificiale in India. Inizialmente, verranno realizzati data center multi-gigawatt a Jamnagar, con una capacità di oltre 120 MW prevista entro il 2026.
Un errore umano mette a rischio la sicurezza di un sistema sanitario. Non importa quanto un sistema sia protetto, la capacità di un utente di annullare gli sforzi di un amministratore non dovrebbe essere sottovalutata. Un promemoria sull'importanza della formazione e della consapevolezza sulla sicurezza.
Il kernel Linux 7.0 introduce significativi miglioramenti nella gestione della memoria, in particolare per i file di grandi dimensioni. Le nuove ottimizzazioni permettono di velocizzare il processo di recupero delle pagine di memoria, con incrementi di performance stimati tra il 50% e il 75%. Questo si traduce in una maggiore efficienza del sistema e in una riduzione dei tempi di attesa per le applicazioni.
OpenAI collabora con Tata per la realizzazione di un data center in India nell'ambito del progetto Stargate. L'iniziativa mira a potenziare le capacità di calcolo per l'intelligenza artificiale nel paese, sfruttando l'infrastruttura di Tata per supportare le crescenti esigenze di elaborazione dei modelli di OpenAI.
OpenAI prevede di espandere la propria infrastruttura in India, collaborando con Tata per un data center dedicato all'intelligenza artificiale con una capacità iniziale di 100MW, con l'obiettivo di raggiungere 1GW. L'espansione include anche l'apertura di nuovi uffici a Mumbai e Bengaluru.
Le startup che adottano l'AI si trovano a dover accelerare i tempi, con finanziamenti limitati e costi infrastrutturali in aumento. Google Cloud evidenzia l'importanza di scelte infrastrutturali oculate fin dall'inizio per evitare problemi futuri, nonostante la facilità di accesso iniziale a risorse cloud come GPU e modelli fondazionali.
Le startup, spinte ad accelerare lo sviluppo con l'AI, si trovano a fronteggiare budget limitati e costi infrastrutturali crescenti. Google Cloud offre crediti cloud e GPU, ma le scelte iniziali sull'infrastruttura possono avere conseguenze a lungo termine.