Evo 2: Un modello genomico su larga scala

Nel 2025, era stato presentato un sistema di AI chiamato Evo, addestrato su un numero elevatissimo di genomi batterici. Questo sistema era in grado di identificare il gene successivo in un cluster di geni correlati o suggerire una proteina completamente nuova.

La prima versione di Evo funzionava grazie alla tendenza dei batteri ad aggregare geni correlati. Tuttavia, questo non è vero per gli organismi con cellule complesse, che presentano strutture genomiche altrettanto complesse.

Evo 2 rappresenta un'evoluzione significativa. Questo modello è stato addestrato su genomi provenienti da tutti e tre i domini della vita (batteri, archeobatteri ed eucarioti). Dopo l'addestramento su migliaia di miliardi di paia di basi di DNA, Evo 2 ha sviluppato rappresentazioni interne di caratteristiche chiave anche in genomi complessi come il nostro, incluse sequenze di DNA regolatorie e siti di splicing, che possono essere difficili da individuare per gli umani.