Noema Atlas: la rete P2P che libera i pesi degli LLM dai silos

La dipendenza da hub centralizzati per la distribuzione degli LLM non era mai stata messa in discussione, fino a quando il timore di un intervento governativo non ha reso evidente la fragilità del sistema. Il team di Noema AI risponde con Noema Atlas, una rete peer-to-peer open source che trasferisce i pesi dei modelli direttamente tra macchine, senza affidarsi esclusivamente a Hugging Face.

La fragilità del modello hub-centrico

L’ecosistema dell’intelligenza artificiale open si è costruito attorno a repository come Hugging Face, che hanno semplificato l’accesso a migliaia di modelli. Pochi però hanno considerato cosa succederebbe se un’autorità nazionale decidesse di limitare l’accesso a determinati pesi, ad esempio quelli di origine cinese. La rimozione di Fable e altri episodi hanno scosso la comunità, rivelando la vulnerabilità di un singolo punto di distribuzione. Noema Atlas si presenta come alternativa pensata proprio per questo scenario: una rete peer-to-peer che consente a chiunque di condividere pesi di LLM verificati, riducendo la dipendenza da qualsiasi server centrale.

Un trasferimento diretto, verificato e deduplicato

Noema Atlas è costruito in Rust e sfrutta il protocollo Iroh per i trasferimenti diretti tra macchine, superando NAT con relay e stabilendo connessioni QUIC. Ogni file è identificato dal proprio hash BLAKE3, non dal nome o dalla posizione. Questo meccanismo di content-addressing garantisce che la stessa copia di un peso, proveniente da qualsiasi peer, venga deduplicata automaticamente e verificata byte per byte durante lo streaming. In questo modo, file identici tra varianti di modelli o mirror vengono conservati una sola volta, sfruttando reflink o hard link dove il file system lo permette. Il fallback verso Hugging Face e altri mirror è opzionale e si attiva solo se nessun peer nelle vicinanze ha il file richiesto.

Sovranità operativa e resilienza comunitaria

L’aspetto che differenzia Noema Atlas da un semplice download manager è la sua architettura pensata per la sovranità dei dati. I pesi scaricati da fonti pubbliche vengono riseeduti di default, contribuendo alla resilienza della rete, mentre i download privati o a pagamento rimangono confinati fino a esplicita autorizzazione dell’utente. Questo permette anche di recuperare e rimettere in circolo modelli rimossi da Hugging Face, semplicemente importandoli, assegnando un titolo e una licenza, e condividendoli tramite link privati o sulla rete aperta. La verifica del contenuto è integrale, ma la scelta della licenza resta in capo all’utente, separando la validazione tecnica dal giudizio legale.

Uno stack in evoluzione per il deployment locale

Noema Atlas si presenta con un’applicazione desktop nativa per macOS, Windows e Linux, senza runtime web, quindi leggera sulla memoria, e con un’interfaccia CLI per ambienti headless o automazioni via SSH. Parallelamente, Noema Atlas Studio offre una variante più moderna dell’interfaccia, condividendo lo stesso motore e archivio. Il progetto è ancora in fase iniziale e il team invita la comunità a contribuire, segnalando bug e proponendo miglioramenti. Per chi sta valutando deployment on-premise di LLM e cerca di evitare vincoli esterni, l’approccio di Atlas segna un passo concreto verso un’infrastruttura distribuita e verificabile, anche se il percorso è appena iniziato. Le implicazioni per il TCO e la gestione dei pesi su larga scala sono ancora da esplorare, ma la direzione è chiara: meno dipendenza, più controllo.