Claude ha avuto la settimana peggiore degli ultimi mesi. Anthropic ha dovuto correre ai ripari per un’ondata di errori che ha investito diversi modelli della famiglia Claude, proprio mentre l’azienda cercava di gestire le domande sulla sospensione improvvisa di due varianti, Claude Mythos 5 e Claude Fable 5.

L’incidente è emerso il 23 giugno intorno alle 14:19 UTC, quando la pagina di stato di Anthropic ha segnalato un incremento anomalo dei tassi di errore su più modelli. Poco dopo, l’azienda ha comunicato di essere passata alla fase di “identificazione” del fix, lasciando intendere che il problema avesse una radice comune. Non sono stati diffusi dettagli tecnici precisi, ma la sequenza suggerisce un bug a livello di infrastruttura di serving o di inference, non un degrado dei modelli in sé.

Cosa sappiamo degli errori e dei modelli sospesi

Al momento, Anthropic non ha fornito spiegazioni pubbliche sul perché Claude Mythos 5 e Claude Fable 5 siano stati tolti dall’accesso. I nomi “Mythos” e “Fable” fanno pensare a versioni specializzate – forse ottimizzate per task narrativi o creativi – ma l’assenza di dettagli ufficiali lascia spazio a ipotesi. La coincidenza con l’ondata di errori non aiuta la comunicazione: gli utenti enterprise che basano flussi di lavoro su questi modelli si trovano a fronteggiare sia interruzioni operative sia incertezza sulla disponibilità futura.

Un campanello d’allarme per chi dipende dal cloud

Il disservizio, per quanto circoscritto, riporta al centro del dibattito una domanda cruciale: quanto può essere solida la dipendenza da API cloud per carichi di lavoro critici? Le aziende che integrano LLM nei propri processi – dalla generazione di codice all’analisi documentale – non possono permettersi periodi di inattività non previsti. Se il fornitore non comunica in modo trasparente, il rischio operativo cresce e spinge a guardare con più attenzione alle alternative self-hosted.

Per chi valuta deployment on-premise, esistono trade-off non banali: da un lato, il controllo totale su latenza, versionamento dei modelli e gestione dei dati; dall’altro, l’investimento in hardware (GPU, VRAM) e competenze interne per mantenere pipeline di inference e fine-tuning. AI-RADAR dedica spazio a questi temi nella sezione /llm-onpremise, offrendo framework analitici per valutare TCO e strategie di deployment, senza suggerire soluzioni univoche.

Trasparenza e fiducia: il vero limite del cloud LLM

Oltre all’affidabilità tecnica, l’episodio tocca il tema della trasparenza. Sospendere modelli senza spiegazioni immediate può minare la fiducia delle imprese, soprattutto in settori regolamentati dove ogni variazione deve essere tracciabile. L’errore tecnico diventa così un problema di governance: chi usa LLM cloud deve accettare un certo grado di opacità, mentre l’on-premise permette audit e personalizzazione profonda, sebbene richieda risorse dedicate.

In questo scenario, la mossa di Anthropic di identificare rapidamente un fix è positiva, ma il contesto delle sospensioni irrisolte pesa. La comunità tecnica attende risposte chiare. Per le organizzazioni, è un promemoria: la scelta tra cloud e self-hosted non è solo una questione di prestazioni, ma di controllo sul proprio stack di intelligenza artificiale.