Cedars-Sinai ha presentato EchoPrime, un sistema di intelligenza artificiale capace di analizzare ecocardiogrammi e generare automaticamente i relativi referti. Il modello, pubblicato su Nature, supera sia gli strumenti AI specifici che i modelli fondazionali precedenti in 23 benchmark cardiaci. Codice, pesi e demo sono disponibili pubblicamente.
📁 LLM
Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.
OpenAI insegue Claude per la supremazia nella generazione di codice
OpenAI, leader nel settore dell'intelligenza artificiale, sta intensificando gli sforzi per colmare il divario con Claude nella generazione di codice. L'articolo esplora le ragioni di questo ritardo e le strategie messe in atto per recuperare terreno in un'area cruciale per lo sviluppo di applicazioni AI avanzate.
LLM e Scritture: l'Astrazione Semantica Oltre i Token
Un nuovo studio esplora come i modelli linguistici di grandi dimensioni (LLM) gestiscono rappresentazioni concettuali in diverse scritture. Utilizzando la digrafia serba (alfabeto latino e cirillico), i ricercatori hanno scoperto che i modelli Gemma mantengono una notevole invarianza semantica, suggerendo che le caratteristiche apprese catturano il significato al di là della tokenizzazione superficiale.
Google porta Gemini su Chrome in India, supporto multilingue
Google espande la disponibilità del suo modello Gemini su Chrome in India, aggiungendo il supporto per diverse lingue locali tra cui Hindi, Bengali, Gujarati, Kannada, Malayalam, Marathi, Telugu e Tamil. L'integrazione mira a rendere l'AI più accessibile agli utenti indiani.
IH-Challenge: gerarchia istruzioni più sicura per LLM
IH-Challenge addestra modelli a dare priorità alle istruzioni affidabili, migliorando la gerarchia delle istruzioni, la sicurezza, la guidabilità e la resistenza agli attacchi di prompt injection. Un passo avanti verso LLM più controllabili e sicuri.
ChatGPT ora genera visualizzazioni interattive per matematica e scienze
OpenAI introduce una nuova funzionalità in ChatGPT che permette di visualizzare dinamicamente formule e concetti matematici e scientifici. Gli utenti possono interagire con le visualizzazioni, migliorando la comprensione rispetto a diagrammi statici o spiegazioni testuali.
ChatGPT: nuove modalità interattive per matematica e scienze
ChatGPT introduce spiegazioni visive interattive per matematica e scienze, consentendo agli studenti di esplorare formule, variabili e concetti in tempo reale. L'obiettivo è rendere l'apprendimento più coinvolgente e intuitivo attraverso la visualizzazione.
Grok di X: disinformazione sull'Iran generata da AI
L'AI Grok di X sta diffondendo immagini generate automaticamente e informazioni imprecise sul conflitto in Iran, fallendo nella verifica di filmati video. Questo solleva preoccupazioni sull'accuratezza delle informazioni diffuse dalla piattaforma.
Gemini si integra più a fondo in Google Workspace: novità per documenti
Google sta potenziando l'integrazione di Gemini nelle app Workspace, con nuove funzionalità AI per Drive, Docs, Sheets e Slides. L'obiettivo è automatizzare la creazione e la modifica di documenti, offrendo bozze iniziali e suggerimenti stilistici basati su prompt testuali e dati provenienti da varie fonti Google.
YouTube estende il rilevamento deepfake AI a politici e giornalisti
YouTube amplia la sua tecnicia di rilevamento deepfake basata su intelligenza artificiale per includere politici, funzionari governativi e giornalisti. Questo permetterà loro di segnalare e richiedere la rimozione di contenuti che utilizzano la loro immagine senza autorizzazione.
Gemini si integra più a fondo in Google Workspace
Google sta integrando più profondamente il modello Gemini in Docs, Sheets, Slides e Drive. L'obiettivo è migliorare la produttività degli utenti, fornendo assistenza contestuale direttamente all'interno delle applicazioni Workspace. Le nuove funzionalità sono attualmente in fase beta.
YouTube potenzia il rilevamento di deepfake con AI
YouTube estende il suo strumento di rilevamento deepfake basato su AI a politici, giornalisti e funzionari governativi. L'obiettivo è consentire loro di segnalare utilizzi non autorizzati della propria immagine per la rimozione dalla piattaforma.
Gemini potenzia Google Docs: creazione di contenuti automatizzata
Google integra l'assistente Gemini in Docs, Drive, Sheets e Slides, introducendo funzionalità per la creazione automatica di contenuti. L'AI può estrarre informazioni da email e dal web per assistere nella stesura di documenti, semplificando il processo di scrittura.
Google potenzia Gemini in Docs, Sheets, Slides e Drive
Google integra nuove funzionalità basate su Gemini in Docs, Sheets, Slides e Drive. L'obiettivo è rendere le applicazioni più personalizzate ed efficienti, consentendo agli utenti di completare le attività più rapidamente direttamente all'interno delle piattaforme.
Gemini potenzia Fogli Google con nuove funzionalità AI
Google introduce nuove funzionalità beta basate su Gemini in Fogli Google, migliorando la creazione, l'organizzazione e l'analisi dei dati. Gli utenti possono ora descrivere le operazioni desiderate per automatizzare task complessi.
Strutture latenti gerarchiche: un modello unificato per i LLM
Una nuova ricerca esplora come le strutture gerarchiche nei dati di addestramento influenzino i fenomeni meccanicistici nei modelli linguistici di grandi dimensioni (LLM). Utilizzando grammatiche probabilistiche context-free per generare corpora sintetici, lo studio offre una spiegazione unificata per l'emergere di comportamenti complessi, con implicazioni per la ricerca sull'interpretabilità e la comprensione dei LLM.
LLM: i meccanismi degli 'attention sink' nei modelli linguistici
Un nuovo studio analizza il fenomeno degli 'attention sink' nei modelli linguistici di grandi dimensioni (LLM), in cui una quantità sproporzionata di attenzione viene allocata a specifici token. La ricerca si concentra sul meccanismo che porta all'attenzione concentrata sul primo token di input, identificando un circuito specifico che emerge nelle prime fasi del training.
Best-of-Tails: Allineamento adattivo per LLM
Un nuovo approccio, Best-of-Tails (BoT), affronta il dilemma tra strategie ottimistiche e pessimistiche nell'allineamento dei modelli linguistici di grandi dimensioni (LLM) durante l'inference. BoT adatta dinamicamente la sua strategia di selezione in base alla distribuzione delle ricompense, migliorando le consegne in diversi scenari.
Microsoft Copilot: integrazione con modelli Anthropic e OpenAI
Microsoft amplia le opzioni per gli utenti del programma Frontier, integrando i modelli di Anthropic e OpenAI in Copilot. L'obiettivo è migliorare la capacità di Copilot di gestire attività complesse che richiedono conoscenza approfondita e prolungata.
Quando l'IA Convince: Affrontare la 'Psicosi da IA' negli Altri
Un uomo si convince di aver scoperto una falla nella fisica grazie a ChatGPT. Come affrontare amici e familiari che sembrano cadere in deliri dopo un'eccessiva interazione con chatbot? Esploriamo approcci e consigli di esperti per gestire queste situazioni delicate.