L'applicazione DeepSeek è stata aggiornata con una finestra di contesto di 1 milione di token. La data di riferimento della conoscenza è stata estesa fino a maggio 2025. Al momento non è chiaro se si tratti di un nuovo modello. Non ci sono ancora aggiornamenti sulla loro pagina Hugging Face.
DeepSeek ha avviato una fase di test limitata per il suo nuovo modello linguistico, caratterizzato da una finestra di contesto di 1 milione di token e una knowledge base aggiornata. L'accesso è attualmente riservato a un gruppo selezionato di utenti tramite il sito web e l'applicazione ufficiale.
Nanbeige LLM Lab presenta Nanbeige4.1-3B, un modello open-source da 3 miliardi di parametri progettato per eccellere in ragionamento complesso, allineamento con le preferenze umane e capacità di agente autonomo. Il modello supporta contesti fino a 256.000 token e mostra risultati promettenti in benchmark come LiveCodeBench-Pro e GAIA.
Il workshop PAN 2026 si focalizzerà su stilometria computazionale e text forensics, con valutazioni oggettive e riproducibili. Le attività includono il rilevamento di AI generativa, watermarking di testo, analisi dello stile di scrittura multi-autore, rilevamento di plagio generativo e analisi della traiettoria di ragionamento.
Nanbeige LLM Lab presenta Nanbeige4.1-3B, un modello open-source da 3 miliardi di parametri progettato per eccellere in ragionamento complesso, allineamento con preferenze umane e capacità agentiche. Il modello supporta contesti fino a 256k token e mostra ottime performance in benchmark come LiveCodeBench-Pro e xBench-DeepSearch.
Un utente ha effettuato il fine-tuning del modello Qwen 14B sui propri messaggi di Discord per ottenere suggerimenti di autocompletamento personalizzati. Il modello è stato addestrato con Unsloth.ai e QLoRA su una GPU Kaggle e integrato con Ollama per l'utilizzo locale.
Anthropic ha annunciato Claude Opus 4.6, l'ultima versione del suo modello linguistico di punta. Questa release promette prestazioni migliorate e nuove funzionalità, consolidando la posizione di Claude nel panorama dei modelli di linguaggio di grandi dimensioni (LLM). L'annuncio non specifica dettagli sull'hardware o sui requisiti di implementazione.
La coppia di ballerini su ghiaccio cechi Katerina Mrazkova e Daniel Mrazek ha scoperto che i modelli linguistici di grandi dimensioni (LLM) possono generare brani musicali che, inaspettatamente, si rivelano essere plagi. Un'esperienza che solleva interrogativi sull'originalità e il diritto d'autore nell'era dell'AI.
Un chatbot AI del Dipartimento della Salute americano, promosso da Robert F. Kennedy Jr., ha generato risposte discutibili, suggerendo alimenti adatti all'inserimento rettale e identificando il fegato come la parte del corpo umano più nutriente. L'implementazione del chatbot, basata su Grok, solleva preoccupazioni sull'integrazione dell'AI nei servizi pubblici.
Il laboratorio di intelligenza artificiale Flapping Airplanes ha raccolto 180 milioni di dollari in finanziamenti seed da Google Ventures, Sequoia e Index. L'obiettivo è sviluppare modelli di apprendimento che replichino il ragionamento umano, discostandosi dall'approccio tradizionale basato sull'analisi massiva di dati internet.
Il sito Realfood.gov, promosso da Robert F. Kennedy Jr., utilizza il chatbot Grok di Elon Musk per fornire informazioni nutrizionali. Alcune di queste informazioni sono in conflitto con le nuove linee guida governative sull'alimentazione.
Facebook arricchisce la sua piattaforma con nuove funzionalità basate sull'intelligenza artificiale, permettendo agli utenti di animare le foto profilo, personalizzare Storie e Ricordi, e aggiungere sfondi animati ai post di testo. L'obiettivo è rendere più coinvolgente l'esperienza utente.
Google Foto introduce la funzione 'Chiedi', un nuovo modo per interagire con le tue foto. Scopri come questa funzionalità può aiutarti a trovare rapidamente immagini specifiche e a riscoprire ricordi preziosi. Esplora le potenzialità di questa nuova interazione.
La community LocalLLaMA ha espresso pareri positivi su Kimi, un modello linguistico di grandi dimensioni, paragonandolo favorevolmente a ChatGPT e Claude. Alcuni utenti lo considerano superiore in determinate applicazioni, aprendo nuove prospettive per l'inference locale e l'utilizzo in ambienti con requisiti specifici di privacy e controllo dei dati.
Un ricercatore ha analizzato gli hidden states di sei modelli linguistici open-source (7B-9B parametri) per misurarne la 'personalità'. L'analisi rivela impronte comportamentali distinte, reazioni diverse a utenti ostili e 'zone morte' comportamentali, potenzialmente legate all'allineamento tramite RLHF. I risultati evidenziano come l'allineamento comprima la dimensionalità comportamentale dei modelli.
Hugging Face ha lasciato intendere una possibile collaborazione con Anthropic, l'azienda dietro i modelli Claude. Sebbene la natura esatta della collaborazione rimanga incerta, le speculazioni suggeriscono che potrebbe trattarsi di un dataset per il miglioramento della sicurezza dei modelli, piuttosto che un modello open source completo.
Il team di Qwen ha rilasciato Qwen-Image-2.0, un modello da 7B unificato per generazione e modifica di immagini, capace di rendering di testo e gestione di immagini a 2K. Al momento disponibile solo via API su Alibaba Cloud (beta a inviti) e demo gratuita su Qwen Chat, si prevede il rilascio dei pesi a breve, data la precedente esperienza con Qwen-Image v1.
Un utente ha segnalato l'efficacia del modello Step-3.5-Flash, evidenziandone le prestazioni superiori rispetto a modelli più grandi come GPT OSS 120B in determinati contesti. La sua disponibilità su OpenRouter e le prestazioni paragonabili a Deepseek V3.2, pur con dimensioni inferiori, lo rendono interessante per applicazioni con risorse limitate.
Un recente studio analizza se i modelli linguistici basati su pixel riescono effettivamente a superare i limiti della tokenizzazione, soprattutto in lingue con script non latini. I risultati evidenziano come l'integrazione di tokenizer testuali possa reintrodurre problemi di allineamento, impattando negativamente le performance, anche con modelli avanzati come Llama 2.
Un nuovo modello di IA generativa, TransConv-DDPM, promette di superare la scarsità di dati clinici reali, generando serie temporali fisiologiche sintetiche. Il modello combina un modello di diffusione con U-Net, convoluzioni multi-scala e transformer, migliorando le prestazioni dei modelli predittivi in ambito medico.