General Motors (GM) sta accelerando lo sviluppo della guida autonoma attraverso l'uso intensivo di simulazioni e reinforcement learning. L'azienda punta a risolvere le sfide poste dagli scenari rari e complessi, addestrando i propri sistemi di AI a velocità superiori di 50.000 volte rispetto al tempo reale.
Affrontare gli scenari limite
La guida autonoma richiede la capacità di interpretare un ambiente in costante cambiamento e di reagire in tempo reale. GM si concentra sulla gestione degli scenari limite, ovvero quelle situazioni rare, ambigue e inattese che determinano l'affidabilità e la sicurezza di un sistema autonomo. Questi scenari includono eventi rari come la presenza di oggetti inattesi sulla strada o situazioni che richiedono capacità di ragionamento tipicamente umane.
Vision Language Action Models
GM sta sviluppando Vision Language Action (VLA) models, modelli che combinano la comprensione delle immagini con la capacità di agire. Questi modelli vengono affinati per compiti specifici legati alla guida, consentendo al veicolo di interpretare gesti e segnali stradali complessi. Per ridurre la latenza, GM utilizza un approccio ibrido, con un modello di grandi dimensioni per decisioni semantiche di alto livello e un modello più piccolo per il controllo spaziale immediato.
Simulazioni ad alta fedeltà
Per addestrare i modelli a gestire situazioni pericolose, GM esegue milioni di simulazioni ad alta fedeltà, equivalenti a decine di migliaia di giorni di guida umana. Queste simulazioni permettono di testare il sistema in scenari virtuali che sarebbero troppo rischiosi da affrontare nel mondo reale. GM utilizza anche tecniche di AI generativa per creare nuovi dati di addestramento, modellando situazioni estreme e preservando la geometria delle scene.
Reinforcement Learning e "Boxworld"
GM ha sviluppato un simulatore proprietario, GM Gym, che include un ambiente di reinforcement learning multi-agente chiamato "Boxworld". Questo ambiente astratto permette di simulare migliaia di conducenti al secondo, addestrando i modelli a velocità elevatissime. I modelli sviluppati in Boxworld vengono poi trasferiti al mondo reale tramite una tecnica chiamata "On Policy Distillation", che consente di ereditare le strategie di guida apprese in simulazione.
Stress-test e incertezza epistemica
GM utilizza un sistema chiamato SHIFT3D per creare oggetti "avversari" che mettono alla prova il sistema di percezione. Inoltre, i modelli sono dotati di una "testa di incertezza epistemica" che permette all'AI di riconoscere quando si trova di fronte a una situazione sconosciuta, segnalando i casi più complessi per ulteriori analisi.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!