Linux 7.2: la miglioria MGLRU spinge MongoDB fino al +100% di throughput

Gli appassionati di tuning del kernel lo sanno: anche piccoli ritocchi nella gestione della memoria possono portare benefici enormi. L’ultima tornata di migliorie legate alla “MM” (memory management) confluita nel kernel Linux 7.2 non fa eccezione. Tra queste spicca un perfezionamento del Multi-Gen LRU (MGLRU) che, secondo le prime osservazioni, regala a MongoDB un incremento del throughput compreso tra il 30 e il 100%. Il dato non è solo una curiosità da changelog: tocca un pezzo di infrastruttura cruciale per i carichi moderni, dai servizi web all’elaborazione dati per pipeline di intelligenza artificiale.

Una patch che cambia le regole del reclaim

MGLRU non è una novità assoluta: introdotto nelle versioni precedenti del kernel, punta a migliorare il meccanismo di recupero delle pagine di memoria (page reclaim) quando il sistema è sotto pressione. A differenza del classico approccio Least Recently Used, che può sbagliare la stima della “freddezza” di una pagina, MGLRU organizza la memoria in generazioni multiple e scandisce meglio quali pagine stanno per essere utilizzate e quali possono essere sacrificate senza impattare le prestazioni. Questo riduce i fenomeni di thrashing e evita che il sistema sprechi cicli di I/O su disco.

La versione integrata in Linux 7.2 affina ulteriormente questa logica. Senza entrare in dettagli di sviluppo che esulano dalla fonte, il risultato è misurabile: database come MongoDB, che lavorano con set di dati spesso più grandi della RAM disponibile e fanno largo uso di cache, beneficiano di una memoria gestita con maggiore lungimiranza. Più pagine calde restano nella RAM fisica, meno letture da disco, più operazioni al secondo.

Perché MongoDB (e non solo) ringrazia

MongoDB è un bersaglio ideale per verificare i progressi di MGLRU. È un database orientato ai documenti che mantiene frequentemente in memoria indici, dati parziali e working set che eccedono la RAM fisica in scenari di produzione. Quando il kernel sbaglia il reclaim, il database soffre latenze e cali di throughput. L’incremento osservato – fino al raddoppio delle operazioni elaborate – suggerisce che la nuova euristica centra meglio l’obiettivo: ridurre il numero di cache miss senza costringere a configurazioni hardware esagerate.

Ma l’effetto non si ferma a MongoDB. Qualsiasi applicazione che tenga in memoria un grande volume di dati e faccia affidamento su una cache efficiente – dai sistemi di caching come Redis ai vector store impiegati nei flussi RAG – può beneficiare di un kernel che gestisce la pressione mnemonica con più intelligenza. In pratica, è un boost “gratuito” che arriva senza cambiare hardware, solo aggiornando il sistema operativo.

Framework on-premise: ogni ciclo conta

Per chi sceglie deployment on-premise o self-hosted, il TCO è un parametro sensibile. Ogni watt di alimentazione, ogni GB di RAM e ogni operazione di I/O hanno un costo che si accumula nel tempo. Migliorie a livello kernel come quella di MGLRU rappresentano un alleato silenzioso: riducono la necessità di overprovisioning di memoria, abbassano la pressione sui dischi e, indirettamente, possono contenere le spese operative. Non è un caso che le grandi aziende con data center propri seguano con attenzione ogni release del kernel proprio alla ricerca di queste ottimizzazioni.

In un contesto in cui le pipeline per l’inference di LLM on-premise o l’addestramento distribuito convivono con database di metadati e code di messaggi, un database più scattante significa meno colli di bottiglia e una migliore efficienza complessiva. E sebbene MGLRU non sia una bacchetta magica per tutti i carichi, il suo contributo è un promemoria di quanto conti la “casa” software sotto il piano applicativo.

Una conferma, non un punto d’arrivo

Il salto di prestazioni di MongoDB con Linux 7.2 non è solo un numero da condividere tra sistemisti. Segnala una direzione: il kernel continua ad affinare i meccanismi di gestione memoria, e chi opera infrastrutture ad alta densità di dati ha tutto l’interesse a testare questi miglioramenti. Non servono GPU speciali o licenze costose: basta la volontà di aggiornare il sistema e misurare l’impatto sui propri carichi di lavoro. In un’epoca in cui ogni punto percentuale di efficienza conta, soprattutto nei cluster on-premise che non possono delegare elasticità al cloud, MGLRU è un tassello che merita attenzione.