Predizione di esiti post-ictus con modelli linguistici di grandi dimensioni

Un recente studio ha esplorato l'utilizzo di modelli linguistici di grandi dimensioni (LLM) per predire gli esiti funzionali a seguito di un ictus ischemico acuto. La ricerca si concentra sulla capacità di questi modelli di inferire i punteggi della scala Rankin modificata (mRS) direttamente dalle note di ammissione dei pazienti.

Sono stati valutati diversi LLM, tra cui modelli encoder (BERT, NYUTron) e generativi (Llama-3.1-8B, MedGemma-4B), sia in configurazioni "frozen" che con addestramento fine. I modelli sono stati testati su un ampio registro di ictus del mondo reale, utilizzando note di dimissione e follow-up a 90 giorni.

Performance e risultati

L'addestramento fine di Llama ha ottenuto le performance migliori, con un'accuratezza del 33.9% nella predizione esatta della scala mRS a 90 giorni e del 76.3% nell'accuratezza binaria (mRS 0-2 vs. 3-6). Le performance di Llama sono risultate comparabili a quelle di modelli basati su dati strutturati che incorporano NIHSS ed età del paziente.

I risultati suggeriscono che gli LLM con addestramento fine possono predire gli esiti funzionali post-ictus basandosi unicamente sulle note di ammissione, raggiungendo performance paragonabili a modelli che richiedono l'estrazione di variabili strutturate. Questo apre la strada allo sviluppo di strumenti prognostici basati su testo che si integrano nei flussi di lavoro clinici senza la necessità di estrazione manuale dei dati.

Per chi valuta deployment on-premise, esistono trade-off da considerare. AI-RADAR offre framework analitici su /llm-onpremise per valutare queste opzioni.