📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

📁 LLM AI generated

L'ontologia è la vera guardaila per evitare che gli agenti AI sbagliano

Le aziende investono miliardi di dollari in agenti AI e infrastrutture per trasformare i processi aziendali, ma si riscontrano limitate successi nella realtà, a causa dell'impossibilità degli agenti di capire veramente i dati aziendali, le politiche e i processi. L'ontologia è la chiave per evitare che gli agenti AI sbagliano.

2025-11-30 Fonte

📁 LLM AI generated

Un weekend di codice: come Andrej Karpathy ha creato un sistema di orchestrazione AI

Andrej Karpathy, ex direttore di AI a Tesla e fondatore di OpenAI, ha scritto un codice dietro which una 'vibecode' per creare un sistema di orchestrazione del modello AI. Il progetto esplora il ruolo della gestione dei modelli AI in corporate e mette in luce la necessità di governance nel settore.

2025-11-30 Fonte

📁 LLM AI generated

Nuovo framework di apprendimento guidato per LLM agenti: un passo verso la soluzione di compiti real-world complessi

Un team di ricercatori cinese ha sviluppato un nuovo framework di apprendimento guidato che aiuta a addestrare agenti linguistici di grandi dimensioni (LLM) per compiti agenziali complessi e real-world. Il framework, chiamato Agent-R1, è compatibile con algoritmi di apprendimento guidato popolari e ha dimostrato notevoli miglioramenti sui compiti di ragionamento che richiedono più ritiri e interazioni multi-turn con strumenti.

2025-11-30 Fonte

📁 LLM AI generated

2025: L'anno dei modelli multi-frontali

Riassunto in italiano del 2025: anni di progresso tecnologico e diversità nel mondo degli AI.

2025-11-30 Fonte

📁 LLM AI generated

Anthropic risolve il problema dell'agente AI con una nuova soluzione multi-sessione

Anthropic ha sviluppato un nuovo framework per gestire la memoria degli agenti AI, risolvendo il problema della loro capacità di ricordare istruzioni e conversazioni durante sessioni lunghe. Il nuovo SDK è stato testato con successo su diverse applicazioni.

2025-11-30 Fonte

📁 LLM AI generated

Observable AI: la chiave per rendere LLMs affidabili

La disponibilità e l'osservabilità sono fondamentali per rendere i modelli di linguaggio a grandi dimensioni (LLM) affidabili e trasparenti. Questo articolo esplora come applicare la principia dell'osservabilità per garantire la sicurezza, la trasparenza e la responsabilità nei processi decisionali AI.

2025-11-30 Fonte

📁 LLM AI generated

Sfide per i professionisti legali nell'uso di AI

Negli ultimi tempi, è emerso un problema in cui gli avvocati sono stati sanzionati per l'uso di AI in modo misleading. Questo articolo esplora le motivazioni e le sfide che questi professionisti legali affrontano quando si trovano a dover affrontare queste questioni.

2025-11-30 Fonte

📁 LLM AI generated

Perplexity scapa via con i codici di blocco per l'AI

Cloudflare accusa Perplexity di eseguire scraping su siti che hanno impostato tecnicamente le restrizioni anti-scraping.

2025-11-30 Fonte

📁 LLM AI generated

KernelFalcon: Deep Agent Architecture per la Generazione di Kernel GPU Autonoma

L'articolo descrive una nuova architettura di agente profondo, KernelFalcon, progettata per generare kernel GPU autonomi. L'approccio combina la generazione di codice con la verifica della correttezza, utilizzando una combinazione di algoritmi di ottimizzazione e prove automatiche.

2025-11-30 Fonte

📁 LLM AI generated

Ollama supporta ora la Qwen3-VL di Alibaba

La piattaforma Ollama ha aggiornato il suo supporto a Qwen3-VL, offrendo una maggiore flessibilità ai suoi utenti.

2025-11-30 Fonte

📁 LLM AI generated

ScreenAI: un modello per l'analisi di schermi interattivi

Il ScreenAI è un modello che utilizza tecnologie avanzate per analizzare e comprendere i dati provenienti da schermi interattivi, come infografiche e contenuti multimediali.

2025-11-29 Fonte

📁 LLM AI generated

Flood Forecasting with Machine Learning

La presentazione descrive l'applicazione di machine learning per la previsione delle inondazioni, con un focus sulla tecnologia Google e i suoi progressi nel settore.

2025-11-29 Fonte

📁 LLM AI generated

Integrazione di Modello di Riconoscimento per Immagini (MRI) per la screening del cancro polmonare

Sviluppo e applicazione di un sistema AI integrato per migliorare l'efficienza e la precisione nel screening del cancro polmonare.

2025-11-29 Fonte

📁 LLM AI generated

Introduzione al AutoBNN

Il library AutoBNN offre una soluzione innovativa per la precessione dei dati temporali, combinando le forze delle BNN e GPs con composti kernel.

2025-11-29 Fonte

📁 LLM AI generated

Apprendimento Automatico per la Previsione del Meteo con Generativi

L'articolo descrive l'apprendimento automatico per la previdenza meteorologica utilizzando generativi, un nuovo approccio che rivoluziona il settore del meteo. Il modello SEEDS, sviluppato da esperti di Google Research, raggiunge risultati simili a quelli delle previsioni operative senza l'impiego dei risorse enormi necessarie.

2025-11-29 Fonte

📁 LLM AI generated

Introduzione al research di shopping su ChatGPT

Il research di shopping su ChatGPT consente di esplorare, confrontare e scoprire prodotti con guide personalizzate per facilitare la decisione acquistante.

2025-11-29 Fonte

📁 LLM AI generated

Introduzione a Wake Vision: un dataset di alta qualità per l'applicazione TinyML

Wake Vision è un nuovo dataset di grandi dimensioni, 6 milioni di immagini, che offre una soluzione significativa per l'applicazione TinyML del riconoscimento delle persone, fornendo una migliore performance e accuratezza rispetto ai dataset attuali.

2025-11-27 Fonte

📁 LLM AI generated

Accelerando l'inferenza di LLM con sparsity

I LLams continuano a crescere in dimensione, e la ricerca di un modo efficiente per il loro inferenza è essenziale. La sparsity rappresenta una soluzione promettente per questo problema, offrendo multipli speed-up necessari per l'inferenza su dispositivi esterni.

2025-11-27 Fonte

📁 LLM AI generated

PyTorch ATX: Evento sulla futura infrastruttura di inferenza

L'evento ha visto la presentazione di tecniche avanzate per l'inferenza LLM a scala, con esperti che hanno esplorato quantizzazione, pruning e deployement strategie.

2025-11-27 Fonte

📁 LLM AI generated

Google annuncia ulteriori miglioramenti AI nel'applicativo di foto

La società sta rilasciando un nuovo modello di editing immagine, il Nano Banana, che consente agli utenti di ottenere risultati più precisi e personalizzati nella 'Help Me Edit' feature dell'app.

2025-11-27 Fonte