Google ha annunciato Lyria 3 Pro, un modello AI evoluto per la creazione di musica. Questo strumento genera brani più lunghi e personalizzabili, integrandosi con Gemini e altre piattaforme aziendali. L'iniziativa espande le capacità musicali basate sull'intelligenza artificiale in diversi servizi Google.
Google introduce Lyria 3, l'ultima versione del suo modello di intelligenza artificiale per la generazione di musica. Il modello è disponibile in anteprima a pagamento tramite la Gemini API e per test in Google AI Studio, aprendo nuove possibilità per la creazione musicale assistita dall'AI.
Google porta Lyria 3, il suo modello di generazione musicale, direttamente negli strumenti di lavoro dei professionisti. L'obiettivo è semplificare e velocizzare il processo creativo, offrendo nuove possibilità per la composizione musicale all'interno dell'ecosistema Google.
Lo scorso settembre, OpenAI ha rilasciato una demo di Sora 2, generando un ampio dibattito sulle sue capacità di generazione video. Nonostante la demo non sia più disponibile, il lavoro di sviluppo sul modello continua internamente.
Google presenta TurboQuant, una tecnica per comprimere le cache KV dei modelli linguistici di grandi dimensioni (LLM) fino a 3 bit, ottenendo un incremento di performance fino a 8 volte su GPU Nvidia H100 senza perdita di accuratezza. Riduce i requisiti di memoria di almeno sei volte.
Un dipendente di DeepSeek ha anticipato l'arrivo di un nuovo modello linguistico di grandi dimensioni (LLM) che supererebbe le prestazioni dell'attuale DeepSeek V3.2. L'annuncio, poi rimosso, ha generato grande interesse nella comunità open source focalizzata su LLM.
Google Research presenta TurboQuant, un nuovo algoritmo di compressione per LLM che promette una riduzione di almeno 6 volte della memoria della cache chiave-valore e un aumento di velocità fino a 8 volte, senza sacrificare l'accuratezza. L'innovazione punta a ridefinire l'efficienza nell'ambito dell'intelligenza artificiale.
RWS ha presentato Language Weaver Pro, un nuovo modello di traduzione linguistica. Secondo l'azienda, il modello supera DeepL e Gemini in 31 delle 32 lingue testate internamente. Language Weaver Pro è integrato nel portafoglio Trados.
Un nuovo studio valuta l'efficacia di diverse strategie di prompting (Zero-Shot, Few-Shot, Chain-of-Thought) su modelli linguistici di grandi dimensioni (LLM) come GPT-3.5, GPT-4 e GPT-4o, applicate al question answering su grafici. L'analisi si concentra sull'accuratezza e l'aderenza al formato delle risposte, usando il dataset ChartQA.
Un nuovo studio esplora l'uso di Large Language Models (LLM) per la generazione di dati sintetici, con l'obiettivo di migliorare le performance di modelli più piccoli tramite fine-tuning. La ricerca si concentra sull'analisi della diversità dei dati generati nello spazio degli embedding e propone un metodo di campionamento mirato per ottimizzare le consegne.
Una ricerca esplora se il pensiero richieda un formato linguistico, come ipotizzato dalla teoria del Linguaggio del Pensiero (LoT). Simulazioni con agenti AI rivelano che protocolli di comunicazione emergenti superano in efficienza i linguaggi predefiniti, suggerendo che la cognizione collaborativa ottimale potrebbe non dipendere da strutture simboliche.
GigaChat ha rilasciato con licenza MIT i pesi dei suoi modelli GigaChat-3.1-Ultra (702B) e Lightning (10B). Ultra è progettato per ambienti ad alte risorse, mentre Lightning punta all'inference locale. Entrambi sono pre-addestrati da zero e ottimizzati per inglese e russo, con buone performance multilingua e tool calling. GigaChat-3.1-Lightning raggiunge 0.76 nel benchmark BFCLv3.
Un utente cerca modelli LLM capaci di competere con Claude Opus, ma con un vincolo estremo: soli 32MB di VRAM. La discussione esplora i limiti hardware e le possibili alternative, considerando l'esecuzione locale con Ollama su hardware obsoleto.
Il team di Reka AI, un laboratorio di ricerca focalizzato su modelli utili per applicazioni nel mondo reale, ha partecipato a una sessione AMA (Ask Me Anything) su Reddit, nel subreddit LocalLLaMA. L'attenzione si è concentrata sul loro modello Reka Edge e sulla direzione della loro ricerca, con un focus particolare sull'inference e le API.
HP introduce "HP IQ", una nuova applicazione AI locale integrata nei suoi portatili business. Questa applicazione permette di chattare, condividere file, registrare e riassumere le riunioni, con l'obiettivo di differenziare i prodotti HP nel mercato.
OpenAI ha interrotto Sora, la sua app basata sul modello di generazione video e audio Sora 2. Nonostante le impressionanti capacità del modello sottostante, l'interesse per un feed social interamente generato dall'intelligenza artificiale non è stato sufficiente a sostenerne la crescita.
OpenAI ha annunciato la chiusura di Sora, l'applicazione per la generazione di video che aveva suscitato grande interesse al suo lancio nel 2024. La società ha ringraziato gli utenti per il loro contributo e ha promesso maggiori dettagli sui tempi di chiusura e sulla conservazione dei lavori creati con la piattaforma.
La nuova modalità automatica di Claude Code di Anthropic consente all'AI di eseguire compiti con meno approvazioni. Questo riflette una tendenza verso strumenti più autonomi, che bilanciano velocità ed efficienza con meccanismi di sicurezza integrati. L'obiettivo è accelerare i processi mantenendo il controllo sui risultati.
Google TV si arricchisce con tre nuove funzionalità basate su Gemini: risposte visive, approfondimenti tematici e aggiornamenti sportivi. L'integrazione mira a fornire un'esperienza utente più interattiva e informativa direttamente sul televisore.
OpenAI rilascia policy di sicurezza basate su prompt per proteggere i più giovani nell'utilizzo di sistemi AI. Le policy sono pensate per gli sviluppatori che usano gpt-oss-safeguard, con l'obiettivo di moderare i rischi specifici per questa fascia d'età.