Anthropic ha presentato Managed Agents, un nuovo servizio che permette alle aziende di creare e rilasciare automazioni basate su agenti AI per il knowledge work. Interamente ospitato nel cloud, il servizio offre alle organizzazioni una soluzione per gestire carichi di lavoro continui, eliminando la necessità di infrastrutture locali. Questo approccio mira a semplificare il deployment di agenti AI per l'automazione aziendale, ponendosi come alternativa alle soluzioni self-hosted.
L'interesse per i Large Language Models (LLM) in locale è in crescita, spinto da esigenze di sovranità dei dati e controllo sui costi. Tuttavia, l'implementazione on-premise presenta una curva di apprendimento significativa, specialmente per chi si avvicina per la prima volta a queste tecnicie. Comprendere le sfide iniziali è cruciale per una strategia di deployment efficace e per massimizzare il ritorno sull'investimento.
Google Cloud e Intel hanno annunciato un'estensione pluriennale della loro partnership per l'infrastruttura AI. L'accordo prevede l'adozione continua dei processori Intel Xeon 6 per le istanze C4 e N4 di Google Cloud, oltre all'espansione dello sviluppo congiunto di Infrastructure Processing Units (IPU) personalizzate. Questa collaborazione mira a migliorare le capacità di calcolo e l'efficienza per i carichi di lavoro di intelligenza artificiale.
Una corte d'appello federale ha rifiutato di sospendere il divieto imposto dall'amministrazione Trump contro Anthropic, negando la mozione d'urgenza dell'azienda. La decisione, emessa da giudici nominati da repubblicani, rappresenta una battuta d'arresto per la società di AI. Anthropic sostiene di aver esercitato i propri diritti costituzionali rifiutando l'uso dei suoi modelli Claude AI per la guerra autonoma e la sorveglianza di massa, motivazioni che avrebbero portato al blocco governativo.
Il settore dell'ospitalità sta vivendo una profonda trasformazione, passando dai sistemi manuali a quelli digitali, e ora verso operazioni guidate dall'intelligenza artificiale. L'obiettivo è integrare l'AI per migliorare l'efficienza, mantenendo al contempo l'essenza dell'interazione umana. Questa evoluzione, esemplificata da figure come Arran Campolucci-Bordi di Casa Italia, solleva questioni cruciali su come bilanciare tecnicia e personalizzazione nell'era digitale.
L'interesse per il deployment di Large Language Models (LLM) su infrastrutture locali cresce, ma la sfida dell'inference senza GPU dedicate rimane centrale. Un'analisi delle capacità dei server Dell R750 con CPU Intel Xeon Gold 5318Y e 256GB di RAM, dotati di supporto VNNI, per carichi di lavoro LLM legati a coding e ricerca, esplorando i trade-off e le opportunità di questa configurazione.
Un utente con una NVIDIA RTX 4090 da 24GB VRAM evidenzia le difficoltà nell'ottenere risultati di editing immagine-a-immagine di qualità con Large Language Models (LLM) locali, a differenza della semplicità offerta da servizi cloud come Grok o Gemini. La discussione verte sulla necessità di prompting complessi o LORAs per compensare le limitazioni hardware e software in un contesto self-hosted, sollevando interrogativi sulle capacità attuali dei deployment on-premise per carichi di lavoro multimodali.
Coinspaid, uno dei maggiori fornitori europei di infrastrutture di pagamento blockchain, ha siglato una partnership strategica con The Residency, una community globale per fondatori e innovatori emergenti. L'accordo garantirà alle startup di The Residency l'accesso esclusivo, a condizioni preferenziali, alle soluzioni di infrastruttura stablecoin di Coinspaid, supportando la crescita e l'innovazione nel settore.
Molte aziende definiscono strategie ambiziose per l'intelligenza artificiale, ma la transizione dalla visione alla concreta implementazione in ambienti di produzione presenta notevoli complessità. La pressione per ottenere risultati tangibili spinge i leader tecnicici a valutare attentamente le risorse, l'infrastruttura e i trade-off tra soluzioni self-hosted e cloud, cercando di accelerare e scalare le proprie iniziative AI.
Marceu Martins, con 25 anni di esperienza, progetta sistemi in cui l'affidabilità è assoluta. Per lui, un tasso di errore dell'1% non è un difetto minore, ma una vulnerabilità sistemica. Questo approccio è cruciale in settori come le catene di approvvigionamento globali e le infrastrutture di telecomunicazione, dove anche piccole anomalie possono avere ripercussioni a cascata su sistemi interconnessi.
Nutanix ha annunciato l'intenzione di integrare il supporto per KubeVirt, consentendo ai propri clienti di orchestrare macchine virtuali e container direttamente su Kubernetes, con un focus specifico sui deployment all'edge. Questa mossa mira a semplificare la gestione delle infrastrutture distribuite e include piani per l'adozione dell'architettura Arm, riconoscendo la sua crescente rilevanza per i carichi di lavoro di intelligenza artificiale su hardware diversificato.
Un uomo dell'Ohio è stato il primo a essere condannato ai sensi del Take It Down Act, dopo aver ammesso di aver creato e condiviso immagini esplicite, sia reali che generate da intelligenza artificiale, di almeno dieci vittime senza il loro consenso. L'imputato ha utilizzato oltre cento modelli AI e decine di piattaforme installate sul suo telefono per produrre migliaia di immagini.
Demis Hassabis di Google DeepMind ha rivelato che la fusione con Google Brain ha permesso di accelerare lo sviluppo AI. Integrando le risorse di calcolo di Brain con la cultura di ricerca di DeepMind, l'organizzazione è tornata a un modello operativo più agile e imprenditoriale, migliorando l'efficienza e il ritmo delle innovazioni negli ultimi due-tre anni.
Un cittadino dell'Oklahoma è stato arrestato durante una riunione del consiglio comunale per aver superato di pochi secondi il tempo limite di parola. L'uomo stava esprimendo la sua opposizione a un proposto datacenter, sollevando preoccupazioni su consumo idrico, costi energetici e inquinamento acustico. Accusato di violazione di domicilio, ha dichiarato di voler combattere le accuse, sostenendo una violazione dei suoi diritti costituzionali.
L'adozione di sistemi AI agentici promette automazione, ma solleva complesse questioni di governance. Con l'entrata in vigore dell'EU AI Act, le organizzazioni devono garantire tracciabilità, controllo e interpretabilità delle azioni degli agenti. Questo è cruciale per evitare sanzioni, assicurare la conformità e mantenere la sovranità dei dati, focalizzandosi su log dettagliati, supervisione umana e capacità di revoca rapida.
La piattaforma GoZTASP introduce un'architettura zero-trust per la governance di sistemi autonomi eterogenei, inclusi droni e robot, in contesti operativi reali. Convalidata a TRL 7 in ambienti mission-critical e con componenti già in deployment, affronta sfide di integrità e sicurezza, estendendo la sua applicabilità a settori come sanità e infrastrutture critiche.
OpenAI ha sospeso il suo ambizioso progetto di datacenter Stargate nel Regno Unito, citando l'onere dei costi energetici e le complessità normative. La decisione, annunciata a pochi mesi dal lancio, solleva interrogativi sulle sfide infrastrutturali e di deployment per i Large Language Models su vasta scala, evidenziando i vincoli che le aziende devono affrontare nella costruzione di capacità AI.
Una ricerca ha dimostrato come Large Language Models di dimensioni contenute, eseguiti in locale, siano in grado di identificare le medesime vulnerabilità di sicurezza rilevate da Mythos, un riferimento nel settore. Questo evidenzia il potenziale dei deployment on-premise per l'analisi della sicurezza, offrendo controllo sui dati e autonomia operativa, aspetti cruciali per le aziende che gestiscono informazioni sensibili.
Microsoft ha improvvisamente bloccato gli account di due figure di spicco dell'open source, tra cui gli sviluppatori di VeraCrypt e WireGuard, impedendo loro di firmare aggiornamenti. L'azienda ha motivato l'azione con un processo di verifica automatizzato, privo di comunicazioni umane, e ha promesso di migliorare le proprie procedure. L'incidente evidenzia le sfide nella gestione degli account sviluppatore e le potenziali ripercussioni sulla sicurezza dei progetti.
La startup ceca Edmund ha raccolto 2,5 milioni di euro per la sua piattaforma di debugging basata su AI, progettata per la manutenzione industriale. L'azienda mira ad affrontare la crescente complessità dei sistemi produttivi e la carenza di ingegneri qualificati, riducendo drasticamente i tempi di inattività e i rischi operativi attraverso agenti AI che forniscono guida passo-passo per la risoluzione dei problemi.