# **Modelli LLM superano la linear regression per prevedere mortalità da tumori polmonari** In un recente studio, i modelli di apprendimento automatico Explainable Machine Learning (EML) hanno dimostrato un'efficacia superiore rispetto alla regressione lineare per prevedere le mortalità da tumori polmonari ai livello di contea negli Stati Uniti. I ricercatori hanno applicato tre modelli: Random Forest, Gradient Boosting Regression e Linear Regression. La performance dei modelli è stata valutata utilizzando l'indice R-squared e l'errore radicale medio (RMSE). I risultati dello studio sono stati contrastanti: * Il modello di foresta alberata ha ottenuto un valore più alto dell'R-squared pari a 41,9% e un errore medio radicale pari a 12,8. * La regressione lineare si è dimostrata meno efficace rispetto agli altri modelli con valori medi inferiori. I risultati sono stati analisiati utilizzando la Shapley Additive Explanations (SHAP) per determinare l'importanza dei variabili e il loro impatto direzionale. La percentuale di fumatori è stata identificata come il predittore più importante, seguita dai valori medii delle proprietà immobiliari e dalla percentuale di popolazione etnica messicana. Inoltre, la Getis-Ord (Gi*) ha rivelato significative bollicine di mortalità elevata nei comuni del mid-eastern degli Stati Uniti. Il modello di foresta alberata è dimostrato avere un rendimento superiore per le previsioni delle mortalità da tumori polmonari, evidenziando l'importanza dei tassi di fumatori, dei valori medii delle proprietà e della percentuale di popolazione messicana. Questi risultati offrono preziosi indizi pratici per la progettazione di interventi mirati, la promozione degli esami e l'attuazione di misure per ridurre le disparità sanitarie nelle regioni colpite più da LC negli Stati Uniti.