Le aziende investono miliardi di dollari in agenti AI e infrastrutture per trasformare i processi aziendali, ma si riscontrano limitate successi nella realtà, a causa dell'impossibilità degli agenti di capire veramente i dati aziendali, le politiche e i processi. L'ontologia è la chiave per evitare che gli agenti AI sbagliano.
Andrej Karpathy, ex direttore di AI a Tesla e fondatore di OpenAI, ha scritto un codice dietro which una 'vibecode' per creare un sistema di orchestrazione del modello AI. Il progetto esplora il ruolo della gestione dei modelli AI in corporate e mette in luce la necessità di governance nel settore.
Un team di ricercatori cinese ha sviluppato un nuovo framework di apprendimento guidato che aiuta a addestrare agenti linguistici di grandi dimensioni (LLM) per compiti agenziali complessi e real-world. Il framework, chiamato Agent-R1, è compatibile con algoritmi di apprendimento guidato popolari e ha dimostrato notevoli miglioramenti sui compiti di ragionamento che richiedono più ritiri e interazioni multi-turn con strumenti.
Riassunto in italiano del 2025: anni di progresso tecnologico e diversità nel mondo degli AI.
Anthropic ha sviluppato un nuovo framework per gestire la memoria degli agenti AI, risolvendo il problema della loro capacità di ricordare istruzioni e conversazioni durante sessioni lunghe. Il nuovo SDK è stato testato con successo su diverse applicazioni.
La disponibilità e l'osservabilità sono fondamentali per rendere i modelli di linguaggio a grandi dimensioni (LLM) affidabili e trasparenti. Questo articolo esplora come applicare la principia dell'osservabilità per garantire la sicurezza, la trasparenza e la responsabilità nei processi decisionali AI.
Negli ultimi tempi, è emerso un problema in cui gli avvocati sono stati sanzionati per l'uso di AI in modo misleading. Questo articolo esplora le motivazioni e le sfide che questi professionisti legali affrontano quando si trovano a dover affrontare queste questioni.
Cloudflare accusa Perplexity di eseguire scraping su siti che hanno impostato tecnicamente le restrizioni anti-scraping.
L'articolo descrive una nuova architettura di agente profondo, KernelFalcon, progettata per generare kernel GPU autonomi. L'approccio combina la generazione di codice con la verifica della correttezza, utilizzando una combinazione di algoritmi di ottimizzazione e prove automatiche.
La piattaforma Ollama ha aggiornato il suo supporto a Qwen3-VL, offrendo una maggiore flessibilità ai suoi utenti.
Il ScreenAI è un modello che utilizza tecnologie avanzate per analizzare e comprendere i dati provenienti da schermi interattivi, come infografiche e contenuti multimediali.
La presentazione descrive l'applicazione di machine learning per la previsione delle inondazioni, con un focus sulla tecnologia Google e i suoi progressi nel settore.
Sviluppo e applicazione di un sistema AI integrato per migliorare l'efficienza e la precisione nel screening del cancro polmonare.
Il library AutoBNN offre una soluzione innovativa per la precessione dei dati temporali, combinando le forze delle BNN e GPs con composti kernel.
L'articolo descrive l'apprendimento automatico per la previdenza meteorologica utilizzando generativi, un nuovo approccio che rivoluziona il settore del meteo. Il modello SEEDS, sviluppato da esperti di Google Research, raggiunge risultati simili a quelli delle previsioni operative senza l'impiego dei risorse enormi necessarie.
Il research di shopping su ChatGPT consente di esplorare, confrontare e scoprire prodotti con guide personalizzate per facilitare la decisione acquistante.
Wake Vision è un nuovo dataset di grandi dimensioni, 6 milioni di immagini, che offre una soluzione significativa per l'applicazione TinyML del riconoscimento delle persone, fornendo una migliore performance e accuratezza rispetto ai dataset attuali.
I LLams continuano a crescere in dimensione, e la ricerca di un modo efficiente per il loro inferenza è essenziale. La sparsity rappresenta una soluzione promettente per questo problema, offrendo multipli speed-up necessari per l'inferenza su dispositivi esterni.
L'evento ha visto la presentazione di tecniche avanzate per l'inferenza LLM a scala, con esperti che hanno esplorato quantizzazione, pruning e deployement strategie.
La società sta rilasciando un nuovo modello di editing immagine, il Nano Banana, che consente agli utenti di ottenere risultati più precisi e personalizzati nella 'Help Me Edit' feature dell'app.