Allineamento di ontologie multilingue: una nuova frontiera
Un nuovo studio presenta un sistema per l'allineamento di ontologie cross-linguali, basato sull'utilizzo di similarità coseno tra embedding vettoriali. L'obiettivo è quello di identificare e collegare concetti equivalenti espressi in lingue diverse, un problema cruciale per l'integrazione di dati e la creazione di knowledge graph globali.
Il sistema proposto si distingue per l'arricchimento contestuale delle entità ontologiche, ottenuto tramite tecniche innovative di descrizione. Un modello transformer multilingue, messo a punto ad hoc, genera embedding di alta qualità. La similarità coseno viene utilizzata per identificare coppie di entità ontologiche positive, con un filtraggio basato su soglie per trattenere solo le entità più simili.
La valutazione del sistema è stata condotta sul dataset OAEI-2022 multifarm track, ottenendo un punteggio F1 del 71%, un miglioramento del 16% rispetto al miglior sistema di riferimento. Questo risultato suggerisce che la pipeline di allineamento proposta è in grado di catturare le sottili similarità cross-linguali tra le entità.
I knowledge graph sono diventati uno strumento essenziale per rappresentare e gestire la conoscenza in diversi domini. La capacità di allineare knowledge graph multilingue apre nuove prospettive per la condivisione e l'integrazione di informazioni a livello globale, superando le barriere linguistiche.
💬 Commenti (0)
🔒 Accedi o registrati per commentare gli articoli.
Nessun commento ancora. Sii il primo a commentare!