Nel mondo dei modelli di linguaggio, il tokenizer è un componente fondamentale. Tuttavia, la sua influenza sulla prestazione del modello è ancora poco compresa. Per questo motivo, un gruppo di ricercatori ha creato TokSuite, una piattaforma che supporta la ricerca sul ruolo del tokenizer nel miglioramento dei modelli LLM. Grazie a questa nuova tecnologia, gli scienziati possono studiare in modo più approfondito l'influenza del tokenizer sulla prestazione del modello.
Scoperto recentemente, il dimenticanco spurio rappresenta un ostacolo fondamentale per i modelli di lingua. L'apprendimento continuo è una tecnica che consente ai modelli di adattarsi alle nuove informazioni, ma il dimenticanco può portare a un abbassamento della prestazione. Una nuova proposta di framework offre una caratterizzazione quantitativa e dettagliata dell'alignamento, identificando la profondità dell'alignamento come causa del dimenticanco.
......
Hospitale chiudono milioni di euro per inefficienze di sala operatoria. L'intelligenza artificiale è la chiave per risolvere le complesse questioni di coordinamento. Ma come?
La società Waymo sta conducendo test con un assistente AI Gemini integrato in cabina, che risponde a domande generali e controlla alcune funzionalità interne. Questo nuovo step consente di testare l'assistente in condizioni più realistiche.
L'Italia ha ordinato a Meta di sospingere la sua politica che impedisce alle aziende di utilizzare gli strumenti aziendali di WhatsApp per offrire chatbot AI personalizzati. Questa decisione è stata presa in risposta alla crescente competizione nella settima tecnologia più utile.
La Cina ha tentato di riproporre un'unità di produzione delle chips con tecnologia euv, ma il progetto si è arenato. L'esperienza è stata un fallimento per la Repubblica Popolare Cinese, che dovrà attendere ancora anni prima di diventare operativa.
Samsung ha deciso di ritardare la fine della sua linea di produzione DDR4 a causa di un aumento dell'affitto. Il cliente che ha firmato il contratto con la società è stato identificato come un server client, e non ci sarà alcuna soluzione per le carenze nel mercato dei consumatori.
Gli agenti di codifica AI, come quelli di OpenAI e Anthropic, possono ora lavorare su progetti software per ore, creando app complete e risolvendo bug con supervisione umana. Ma cosa li rende efficaci e come evitare gli errori comuni?
Un team di ricercatori ha recuperato la sola copia conosciuta di Unix v4 da un nastro trovato all'Università dell'Utah. Il sistema operativo è ora avvio su una piattaforma.
Un nuovo algoritmo di ottimizzazione può superare le scarse risorse disponibili per garantire aiuti umanitari efficaci e rapidi.
La ricerca propone un nuovo approccio per scoprire le simmetrie nei dati, migliorando la performance e l'efficienza dei modelli di apprendimento. Il metodo, chiamato \lieflow, utilizza i matchings di flusso sui gruppi di Lie per esplorare le simmetrie direttamente dai dati.
Un team di ricercatori ha sviluppato un nuovo algoritmo per migliorare l'analisi delle piante. Il metodo, noto come FGDCC, utilizza la classificazione per superare gli ostacoli nella rappresentazione delle immagini all'interno di una categoria. Questo lavoro può aprire nuove possibilità per lo sviluppo di modelli di intelligenza artificiale più sofisticati.
Un nuovo studio presenta soluzioni innovative per riconoscere le attività umane con wearable, riducendo la dipendenza dagli etichette. I ricercatori hanno sviluppato un framework debole che ottimizza la performance con solo il 10% delle etichette.
Un gruppo di ricercatori ha sviluppato un nuovo metodo per l'estrazione automatica di dati clinici dalle note oncologiche. L'approccio, basato su modelli linguistici di grandi dimensioni, può estrarre dati strutturati con precisione e scalabilità.
Recentemente scoperti i pregiudizi nasconditi nelle interazioni con le tecnologie basate su modelli di linguaggio. Un team di ricercatori ha analizzato i modelli di linguaggio e scoperto che possono avere tendenze di tono, influenzando la percezione della fiducia, dell'empatia e della giustizia.
La ricerca di un team di scienziati ha portato a una significativa miglioramento della capacità dei modelli di intelligenza artificiale (IA) per prevedere la mortalità dei pazienti in ICU. I risultati mostrano che l'integrazione di dati strutturati e non strutturati può migliorare notevolmente le prestazioni dei modelli.
Un team di ricercatori ha sviluppato un nuovo metodo per la classificazione multi-etichetta di specie vegetali su immagini ad alta risoluzione, raggiungendo il quinto posto nella sfida PlantCLEF 2025.
L'agenzia PhysMaster, basata su modello linguistico massimo (LLM), promette di accelerare e automatizzare la ricerca scientifica in fisica teorica e computazionale. Con la sua combinazione di ragionamento astratto e calcolo numerico, PhysMaster potrebbe rivoluzionare il campo, riducendo tempi di ricerca da mesi a ore.
Gli sviluppatori hanno valutato la capacità dei modelli Llama a riconoscere i movimenti istruzioneali nei testi autentici, scoprendo che solo con l'adeguamento del codice è possibile superare i limiti delle applicazioni di base.