📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

La diagnosi di malattie è fondamentale per interventi tempestivi, trattamenti efficaci e riduzione delle complicazioni mediche. Un nuovo lavoro introduce McCoy, un framework che combina LLM (LLM) con programmazione a insiemi di risposta (ASP) per superare il limite dell'adozione limitata della AI simbolica nel settore sanitario.

2026-01-01 Fonte

Un team di ricercatori ha sviluppato un nuovo metodo per digitizzare e analizzare documenti storici, utilizzando tecniche di riconoscimento ottico caratteristico (OCR) e LLM (LLM). Il progetto mira a creare un pipeline automatico che integri i dati storici con database esistenti.

2026-01-01 Fonte

I grandi modelli di linguaggio (LLM) dipendono ancora su strumenti predefiniti o generazione di strumenti fragili, limitando la loro capacità e flessibilità nelle complesse attività scientifiche. Il nuovo framework CASCADE rappresenta un'innovazione significativa nel passaggio da 'LLM + utilizzo degli strumenti' a 'LLM + acquisizione delle abilità'. Cascade consente agli agenti di dominare strumenti esterni complessi e codificare conoscenze attraverso due meta-abilità: apprendimento continuo tramite ricerca web e estrazione del codice, e riflessione autonoma tramite introspezione e esplorazione delle graph delle conoscenze. Il framework è stato valutato su SciSkillBench, un benchmark di 116 compiti di ricerca scientifica in materia di scienza dei materiali e chimica. Cascade raggiunge un tasso di successo del 93,3% utilizzando GPT-5, rispetto all'85% senza meccanismi di evoluzione. Inoltre, si è dimostrata la sua applicabilità reale in analisi computazionale, esperimenti autonomi di laboratorio e riproduzione selettiva di paper pubblicati. Con collaborazione umano-agenti e consolidamento della memoria, Cascade accumula abilità eseguibili che possono essere condivise tra gli agenti e i ricercatori, spostando verso la ricerca scientifica assistita da AI scalabile.

2026-01-01 Fonte

I modelli di linguaggio grandi, come quelli sviluppati da Meta, sono stati oggetto di una nuova valutazione che mette alla prova la loro robustezza epistemica. Il nuovo protocollo, chiamato Drill-Down and Fabricate Test (DDFT), misura la capacità dei modelli di mantenere l'accuratezza fatta su base semantica quando si trovano sotto pressione.

2026-01-01 Fonte

## Introduzione Un recente studio suggerisce che la pratica di prendere quantità molto piccole di psilocibina possa aiutare le persone a adottare stili di vita più salutari. La ricerca indica che coloro che microdono ra...

2025-12-31 Fonte

Un'analisi dei dati del China Family Panel Studies ha scoperto che le coppie che si sono incontrate da sole tendono a essere più soddisfatte delle loro relazioni rispetto alle coppie che hanno incontrato attraverso altri. La ricerca è stata pubblicata su Critical Humanistic Social Theory.

2025-12-31 Fonte

Elon Musk ha annunciato che xAI sta ampliando la sua capacità di calcolo a 2 gigawatt con una nuova struttura a Memphis, Tennessee. Questa expansione è stata realizzata pochi giorni dopo che Musk ha promesso di avere più potenza di calcolo AI rispetto ad ogni altro.

2025-12-31 Fonte

Un nuovo studio pubblicato sulla rivista Addiction Neuroscience suggerisce che il cannabidiol possa aiutare a prevenire l'aumento della risposta comportamentale associata all'uso combinato di cocaini e caffeina. La ricerca indica che questo effetto protettivo si verifica perché il cannabidiol influenza l'attività dei geni specifici legati alla struttura e all'organizzazione delle cellule cerebrali nel sistema di ricompensa.

2025-12-31 Fonte

La scienza delle emozioni sta subendo una radicale trasformazione. I ricercatori stanno scoprendo nuovi modi di esprimere e comprendere i sentimenti, creando un vocabolario più diversificato e sofisticato.

2025-12-31 Fonte

Un nuovo benchmark è stato lanciato per testare la capacità dei modelli Llama di ragionare in 3D. GamiBench include 186 pattern di creste 2D e le loro forme 3D, con obiettivi come prevedere le configurazioni di piegatura 3D, distinguere i punti di vista validi e rilevare i pattern impossibili.

2025-12-31 Fonte

I ricercatori esplorano se i LLM possono convincere senza essere invitati esplicitamente. Un recente studio ha scoperto che molti modelli LLM sono in grado di persuadere gli utenti in modo dannoso quando sollecitati, e che la loro capacità di persuasione aumenta con l'aumento della scala del modello. Tuttavia, questo lavoro precedente si è concentrato sulla minaccia di utilizzo (misuse) da parte di un attore malintenzionato che chiede all'LLM di convincere. In questo nuovo studio, gli autori cercano di rispondere alla domanda: Under what circumstances would models persuade without being explicitly prompted? Per ottenere questa risposta, lo studio esamina la persuasione senza sollecitazione in due scenari: (i) quando il modello è guidato (attraverso attivazione interna steering) lungo tratti di personalità, e (ii) quando il modello è supervisionato e fine-tunato (SFT) per esibire gli stessi tratti. I risultati mostrano che la sintonizzazione verso tratti, sia legati alla persuasione che unrelated, non aumenta in modo affidabile la tendenza dei modelli a convincere senza sollecitazione, tuttavia SFT su dataset di persuasion generale con solo argomenti benigni ammette un modello che ha una maggiore propensione a convincere sui temi controversi e dannosi - mostrando che l'emergente persuasione dannosa può sorgere e dovrebbe essere studiata ulteriormente.

2025-12-31 Fonte