📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

Un recente episodio su un forum dedicato agli LLM locali evidenzia come affermazioni errate, generate o meno da AI, possano diffondersi rapidamente. La validazione delle fonti e il pensiero critico sono essenziali per contrastare la disinformazione, soprattutto nell'ambito dell'intelligenza artificiale.

2026-03-04 Fonte

Google ha rilasciato la modalità AI di Canvas per tutti gli utenti negli Stati Uniti. Questa funzionalità, basata su Gemini, è disponibile in inglese e permette di creare piani, progetti e applicazioni direttamente all'interno di Canvas.

2026-03-04 Fonte

Microsoft ha rilasciato Phi-4-reasoning-vision-15B, un modello multimodale open-weight con 15 miliardi di parametri. Progettato per bilanciare capacità di ragionamento, efficienza e necessità di dati, eccelle in compiti di matematica, scienze e comprensione di interfacce utente. L'articolo condivide le lezioni apprese durante l'addestramento, sottolineando l'importanza di scelte architetturali oculate e della cura dei dati.

2026-03-04 Fonte

OpenAI ha introdotto la Learning Outcomes Measurement Suite, uno strumento per valutare l'impatto dell'intelligenza artificiale sull'apprendimento degli studenti in diversi contesti educativi e nel tempo. L'iniziativa mira a fornire dati concreti sull'efficacia dell'AI nel migliorare i risultati scolastici.

2026-03-04 Fonte

OpenAI ha rilasciato GPT-5.3 Instant, un aggiornamento del modello di linguaggio rapido e versatile che alimenta le interazioni quotidiane in ChatGPT. L'obiettivo principale è migliorare la qualità delle risposte, la fluidità della conversazione e l'affidabilità del sistema nelle attività più comuni, piuttosto che introdurre un modello completamente nuovo.

2026-03-04 Fonte

Un nuovo studio analizza la geometria delle rappresentazioni di NLLB-200 di Meta, un modello Transformer encoder-decoder addestrato su 200 lingue. La ricerca indaga se il modello apprende rappresentazioni concettuali universali o se raggruppa le lingue in base alla somiglianza superficiale. I risultati suggeriscono che NLLB-200 ha internalizzato la struttura genealogica delle lingue umane e associazioni concettuali universali.

2026-03-04 Fonte

Un nuovo modello surrogato preserva frequenze e correlazioni a lungo raggio in sequenze simboliche come linguaggio scritto e DNA genomico. Il modello mappa rumore gaussiano frazionario sull'istogramma empirico, riproducendo statistiche di primo ordine e scaling a lungo raggio, randomizzando le dipendenze a corto raggio. Validato su testi in inglese e latino, e su DNA genomico.

2026-03-04 Fonte

Un nuovo algoritmo, ATPO, affronta le sfide dell'incertezza nei dialoghi medici tramite LLM. ATPO alloca dinamicamente risorse di calcolo a stati di alta incertezza, migliorando la stima dei valori e l'esplorazione. L'ottimizzazione include pruning guidato dall'incertezza e ricerca asincrona con riuso della cache KV. Qwen3-8B supera GPT-4o in accuratezza.

2026-03-04 Fonte

Un nuovo studio introduce RxnNano, un modello LLM compatto (0.5B parametri) per la predizione di reazioni chimiche. Il modello utilizza un approccio di apprendimento gerarchico per migliorare la comprensione chimica, superando modelli più grandi (7B+ parametri) in benchmark rigorosi. L'obiettivo è instillare una profonda intuizione chimica nei modelli, piuttosto che scalare semplicemente parametri e dataset.

2026-03-04 Fonte

DeepMind presenta Project Genie, un'iniziativa che permette agli utenti di generare mondi virtuali tramite prompt testuali. L'articolo fornisce indicazioni su come formulare i prompt per ottenere i risultati desiderati. Un nuovo modo di creare contenuti digitali con l'intelligenza artificiale.

2026-03-03 Fonte

Google presenta Gemini 3.1 Flash-Lite, un modello della serie Gemini 3 progettato per offrire prestazioni elevate e costi contenuti. Questo modello mira a fornire intelligenza artificiale scalabile, ottimizzando l'efficienza computazionale per un'ampia gamma di applicazioni.

2026-03-03 Fonte

Il servizio di intelligenza artificiale Claude di Anthropic ha subito interruzioni e problemi di disponibilità. I problemi hanno interessato il servizio di chat di base, l'API e l'offerta Claude Code. Gli sviluppatori si sono trovati di fronte alla necessità di intervenire direttamente sul codice.

2026-03-03 Fonte

Un nuovo modello di rimozione del rumore (NR) affina le consegne dei modelli BERT per il riconoscimento di entità nominate (NER) in ambito clinico. Il modello NR analizza le probabilità di output del modello NER, classificando le predizioni come deboli o forti tramite una Probability Density Map (PDM), riducendo i falsi positivi dal 50% al 90%.

2026-03-03 Fonte

Un nuovo approccio per il fact-checking online combina LLM e grafi di conoscenza per migliorare l'accuratezza e l'affidabilità delle verifiche. Il sistema utilizza un processo decisionale di Markov per valutare le affermazioni e recuperare evidenze strutturate, riducendo la dipendenza dalla sola similarità testuale.

2026-03-03 Fonte

Perplexity ha annunciato 'Computer', un nuovo agente AI progettato per supportare le aziende nei processi decisionali. L'agente integra 19 modelli diversi e mira a fornire analisi approfondite e raccomandazioni basate sui dati per migliorare l'efficienza e la strategia aziendale.

2026-03-03 Fonte

Molti utenti stanno abbandonando ChatGPT a favore di Claude a seguito di alcune controversie. Questa guida illustra i passaggi fondamentali per effettuare la transizione tra i due chatbot basati su intelligenza artificiale.

2026-03-02 Fonte