📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

L'applicazione DeepSeek è stata aggiornata con una finestra di contesto di 1 milione di token. La data di riferimento della conoscenza è stata estesa fino a maggio 2025. Al momento non è chiaro se si tratti di un nuovo modello. Non ci sono ancora aggiornamenti sulla loro pagina Hugging Face.

2026-02-11 Fonte

DeepSeek ha avviato una fase di test limitata per il suo nuovo modello linguistico, caratterizzato da una finestra di contesto di 1 milione di token e una knowledge base aggiornata. L'accesso è attualmente riservato a un gruppo selezionato di utenti tramite il sito web e l'applicazione ufficiale.

2026-02-11 Fonte

Nanbeige LLM Lab presenta Nanbeige4.1-3B, un modello open-source da 3 miliardi di parametri progettato per eccellere in ragionamento complesso, allineamento con le preferenze umane e capacità di agente autonomo. Il modello supporta contesti fino a 256.000 token e mostra risultati promettenti in benchmark come LiveCodeBench-Pro e GAIA.

2026-02-11 Fonte

Il workshop PAN 2026 si focalizzerà su stilometria computazionale e text forensics, con valutazioni oggettive e riproducibili. Le attività includono il rilevamento di AI generativa, watermarking di testo, analisi dello stile di scrittura multi-autore, rilevamento di plagio generativo e analisi della traiettoria di ragionamento.

2026-02-11 Fonte

Nanbeige LLM Lab presenta Nanbeige4.1-3B, un modello open-source da 3 miliardi di parametri progettato per eccellere in ragionamento complesso, allineamento con preferenze umane e capacità agentiche. Il modello supporta contesti fino a 256k token e mostra ottime performance in benchmark come LiveCodeBench-Pro e xBench-DeepSearch.

2026-02-11 Fonte

Un utente ha effettuato il fine-tuning del modello Qwen 14B sui propri messaggi di Discord per ottenere suggerimenti di autocompletamento personalizzati. Il modello è stato addestrato con Unsloth.ai e QLoRA su una GPU Kaggle e integrato con Ollama per l'utilizzo locale.

2026-02-11 Fonte

Anthropic ha annunciato Claude Opus 4.6, l'ultima versione del suo modello linguistico di punta. Questa release promette prestazioni migliorate e nuove funzionalità, consolidando la posizione di Claude nel panorama dei modelli di linguaggio di grandi dimensioni (LLM). L'annuncio non specifica dettagli sull'hardware o sui requisiti di implementazione.

2026-02-11 Fonte

La coppia di ballerini su ghiaccio cechi Katerina Mrazkova e Daniel Mrazek ha scoperto che i modelli linguistici di grandi dimensioni (LLM) possono generare brani musicali che, inaspettatamente, si rivelano essere plagi. Un'esperienza che solleva interrogativi sull'originalità e il diritto d'autore nell'era dell'AI.

2026-02-10 Fonte

Un chatbot AI del Dipartimento della Salute americano, promosso da Robert F. Kennedy Jr., ha generato risposte discutibili, suggerendo alimenti adatti all'inserimento rettale e identificando il fegato come la parte del corpo umano più nutriente. L'implementazione del chatbot, basata su Grok, solleva preoccupazioni sull'integrazione dell'AI nei servizi pubblici.

2026-02-10 Fonte

Il laboratorio di intelligenza artificiale Flapping Airplanes ha raccolto 180 milioni di dollari in finanziamenti seed da Google Ventures, Sequoia e Index. L'obiettivo è sviluppare modelli di apprendimento che replichino il ragionamento umano, discostandosi dall'approccio tradizionale basato sull'analisi massiva di dati internet.

2026-02-10 Fonte

Il sito Realfood.gov, promosso da Robert F. Kennedy Jr., utilizza il chatbot Grok di Elon Musk per fornire informazioni nutrizionali. Alcune di queste informazioni sono in conflitto con le nuove linee guida governative sull'alimentazione.

2026-02-10 Fonte

Facebook arricchisce la sua piattaforma con nuove funzionalità basate sull'intelligenza artificiale, permettendo agli utenti di animare le foto profilo, personalizzare Storie e Ricordi, e aggiungere sfondi animati ai post di testo. L'obiettivo è rendere più coinvolgente l'esperienza utente.

2026-02-10 Fonte

Google Foto introduce la funzione 'Chiedi', un nuovo modo per interagire con le tue foto. Scopri come questa funzionalità può aiutarti a trovare rapidamente immagini specifiche e a riscoprire ricordi preziosi. Esplora le potenzialità di questa nuova interazione.

2026-02-10 Fonte

La community LocalLLaMA ha espresso pareri positivi su Kimi, un modello linguistico di grandi dimensioni, paragonandolo favorevolmente a ChatGPT e Claude. Alcuni utenti lo considerano superiore in determinate applicazioni, aprendo nuove prospettive per l'inference locale e l'utilizzo in ambienti con requisiti specifici di privacy e controllo dei dati.

2026-02-10 Fonte

Un ricercatore ha analizzato gli hidden states di sei modelli linguistici open-source (7B-9B parametri) per misurarne la 'personalità'. L'analisi rivela impronte comportamentali distinte, reazioni diverse a utenti ostili e 'zone morte' comportamentali, potenzialmente legate all'allineamento tramite RLHF. I risultati evidenziano come l'allineamento comprima la dimensionalità comportamentale dei modelli.

2026-02-10 Fonte

Hugging Face ha lasciato intendere una possibile collaborazione con Anthropic, l'azienda dietro i modelli Claude. Sebbene la natura esatta della collaborazione rimanga incerta, le speculazioni suggeriscono che potrebbe trattarsi di un dataset per il miglioramento della sicurezza dei modelli, piuttosto che un modello open source completo.

2026-02-10 Fonte

Il team di Qwen ha rilasciato Qwen-Image-2.0, un modello da 7B unificato per generazione e modifica di immagini, capace di rendering di testo e gestione di immagini a 2K. Al momento disponibile solo via API su Alibaba Cloud (beta a inviti) e demo gratuita su Qwen Chat, si prevede il rilascio dei pesi a breve, data la precedente esperienza con Qwen-Image v1.

2026-02-10 Fonte

Un utente ha segnalato l'efficacia del modello Step-3.5-Flash, evidenziandone le prestazioni superiori rispetto a modelli più grandi come GPT OSS 120B in determinati contesti. La sua disponibilità su OpenRouter e le prestazioni paragonabili a Deepseek V3.2, pur con dimensioni inferiori, lo rendono interessante per applicazioni con risorse limitate.

2026-02-10 Fonte

Un recente studio analizza se i modelli linguistici basati su pixel riescono effettivamente a superare i limiti della tokenizzazione, soprattutto in lingue con script non latini. I risultati evidenziano come l'integrazione di tokenizer testuali possa reintrodurre problemi di allineamento, impattando negativamente le performance, anche con modelli avanzati come Llama 2.

2026-02-10 Fonte

Un nuovo modello di IA generativa, TransConv-DDPM, promette di superare la scarsità di dati clinici reali, generando serie temporali fisiologiche sintetiche. Il modello combina un modello di diffusione con U-Net, convoluzioni multi-scala e transformer, migliorando le prestazioni dei modelli predittivi in ambito medico.

2026-02-10 Fonte