Anthropic: Claude Mythos scopre oltre 10.000 vulnerabilità critiche in un mese

L'impatto di Claude Mythos sulla cybersecurity

Anthropic ha recentemente annunciato un risultato significativo nel campo della cybersecurity attraverso la sua iniziativa Project Glasswing. Questo programma ristretto, che impiega l'LLM Claude Mythos, ha identificato oltre 10.000 potenziali vulnerabilità ad alta o critica gravità in alcuni dei software più importanti a livello sistemico a livello globale. Questi risultati sono stati ottenuti in un solo mese dall'avvio del programma, sottolineando l'efficacia e la rapidità con cui gli strumenti basati su intelligenza artificiale possono operare nell'analisi della sicurezza.

La scoperta di un numero così elevato di candidati a vulnerabilità in un lasso di tempo così breve evidenzia la complessità crescente degli ecosistemi software moderni. Tra le oltre 10.000 segnalazioni iniziali, 1.726 sono state validate come veri positivi, e di queste, 1.094 sono state confermate come vulnerabilità di gravità alta o critica. Questi numeri non solo dimostrano la capacità di Project Glasswing di individuare problemi reali, ma anche la persistente sfida che le organizzazioni affrontano nel mantenere la sicurezza dei propri sistemi.

LLM e l'analisi delle vulnerabilità: un nuovo paradigma

L'impiego di un Large Language Model come Claude Mythos per l'analisi delle vulnerabilità rappresenta un cambio di paradigma nel settore della cybersecurity. Gli LLM sono in grado di elaborare e comprendere vaste quantità di codice sorgente, identificando pattern, anomalie e potenziali punti deboli che potrebbero sfuggire agli strumenti tradizionali o all'analisi umana, a causa della loro scala. La capacità di analizzare rapidamente intere codebase e di correlare informazioni da diverse sezioni del codice permette di accelerare notevolmente il processo di scoperta delle vulnerabilità.

È fondamentale distinguere tra "candidati a vulnerabilità" e "veri positivi" o "vulnerabilità confermate". Gli LLM eccellono nell'identificazione di schemi che potrebbero indicare un problema, generando un ampio set di candidati. La fase successiva, cruciale, prevede la validazione da parte di esperti umani o strumenti automatizzati più specifici per confermare la reale esistenza e la gravità della vulnerabilità. Questo approccio ibrido, che combina la potenza di calcolo degli LLM con l'esperienza umana, massimizza l'efficienza e l'accuratezza del processo di auditing della sicurezza.

Implicazioni per la sovranità dei dati e i deployment on-premise

La scoperta di un numero così elevato di vulnerabilità critiche ha profonde implicazioni per le organizzazioni, in particolare quelle che gestiscono software "systemically important" e che optano per deployment on-premise. In questi contesti, la sovranità dei dati e il controllo diretto sull'infrastruttura sono priorità assolute. La presenza di vulnerabilità non mitigate può compromettere gravemente la sicurezza dei dati sensibili e la conformità normativa, come il GDPR.

Per le aziende che scelgono soluzioni self-hosted o ambienti air-gapped, la responsabilità della sicurezza ricade interamente sull'organizzazione. Strumenti come Project Glasswing, sebbene non specificamente progettati per l'uso on-premise, evidenziano la necessità di adottare strategie proattive per l'identificazione e la mitigazione delle minacce. La valutazione del Total Cost of Ownership (TCO) per un deployment on-premise deve necessariamente includere i costi associati alla gestione delle vulnerabilità, al patching e al mantenimento di un team di sicurezza qualificato. Per chi valuta deployment on-premise, AI-RADAR offre framework analitici su /llm-onpremise per valutare i trade-off tra controllo, sicurezza e costi operativi.

La sfida del patching e le prospettive future

Nonostante la capacità degli LLM di scoprire vulnerabilità a una velocità senza precedenti, la sfida successiva, e spesso più ardua, è quella di applicare le patch in modo tempestivo ed efficace. La velocità con cui vengono scoperte nuove vulnerabilità supera spesso la capacità delle organizzazioni di sviluppare, testare e rilasciare le correzioni necessarie, specialmente per software complessi e interconnessi. Questo "gap di patching" può lasciare le organizzazioni esposte per periodi prolungati.

In futuro, gli LLM potrebbero non limitarsi solo alla scoperta, ma anche assistere nella generazione di patch o suggerire mitigazioni. L'integrazione di queste tecnicie avanzate nei cicli di sviluppo del software (DevSecOps) potrebbe trasformare radicalmente il modo in cui le aziende affrontano la sicurezza. È chiaro che la protezione dei sistemi critici richiederà un approccio multistrato, combinando l'automazione intelligente con l'esperienza umana, per garantire che la velocità di scoperta non sia vanificata dalla lentezza della risposta.