ChartDiff: Un Nuovo Benchmark per la Comprensione Comparativa di Grafici
È stato introdotto ChartDiff, il primo benchmark su larga scala progettato per la comprensione comparativa tra coppie di grafici. Composto da 8.541 coppie, il dataset valuta la capacità dei Large Language Models (LLM) e di altri modelli di riassumere...