📁 LLM

Questa sezione LLM monitora release di modelli, quantizzazione, capacita di ragionamento e impatti pratici su deployment locale o ibrido. L'obiettivo e focalizzarsi su cio che cambia davvero le decisioni tecniche: finestra di contesto, latenza, footprint memoria, licenze e evidenza valutativa su famiglie open e commerciali. E una raccolta pensata per team che cercano segnali affidabili, non rumore. Integra la lettura con la pillar LLM, i vincoli hardware e l'integrazione framework.

📁 LLM AI generated

DeepSeek: finestra di contesto estesa a 1 milione di token

L'applicazione DeepSeek è stata aggiornata con una finestra di contesto di 1 milione di token. La data di riferimento della conoscenza è stata estesa fino a maggio 2025. Al momento non è chiaro se si tratti di un nuovo modello. Non ci sono ancora aggiornamenti sulla loro pagina Hugging Face.

2026-02-11 Fonte

📁 LLM AI generated

DeepSeek testa nuovo modello con finestra di contesto da 1 milione di token

DeepSeek ha avviato una fase di test limitata per il suo nuovo modello linguistico, caratterizzato da una finestra di contesto di 1 milione di token e una knowledge base aggiornata. L'accesso è attualmente riservato a un gruppo selezionato di utenti tramite il sito web e l'applicazione ufficiale.

2026-02-11 Fonte

📁 LLM AI generated

Nanbeige4.1-3B: un modello compatto che ragiona e agisce

Nanbeige LLM Lab presenta Nanbeige4.1-3B, un modello open-source da 3 miliardi di parametri progettato per eccellere in ragionamento complesso, allineamento con le preferenze umane e capacità di agente autonomo. Il modello supporta contesti fino a 256.000 token e mostra risultati promettenti in benchmark come LiveCodeBench-Pro e GAIA.

2026-02-11 Fonte

📁 LLM AI generated

PAN 2026: analisi di AI generativa e stilometria computazionale

Il workshop PAN 2026 si focalizzerà su stilometria computazionale e text forensics, con valutazioni oggettive e riproducibili. Le attività includono il rilevamento di AI generativa, watermarking di testo, analisi dello stile di scrittura multi-autore, rilevamento di plagio generativo e analisi della traiettoria di ragionamento.

2026-02-11 Fonte

📁 LLM AI generated

Nanbeige4.1-3B: un modello compatto per ragionamento e capacità agentiche

Nanbeige LLM Lab presenta Nanbeige4.1-3B, un modello open-source da 3 miliardi di parametri progettato per eccellere in ragionamento complesso, allineamento con preferenze umane e capacità agentiche. Il modello supporta contesti fino a 256k token e mostra ottime performance in benchmark come LiveCodeBench-Pro e xBench-DeepSearch.

2026-02-11 Fonte

📁 LLM AI generated

Fine-tuning di Qwen 14B per autocompletamento su Discord

Un utente ha effettuato il fine-tuning del modello Qwen 14B sui propri messaggi di Discord per ottenere suggerimenti di autocompletamento personalizzati. Il modello è stato addestrato con Unsloth.ai e QLoRA su una GPU Kaggle e integrato con Ollama per l'utilizzo locale.

2026-02-11 Fonte

📁 LLM AI generated

Anthropic presenta Claude Opus 4.6: l'ultima evoluzione del modello

Anthropic ha annunciato Claude Opus 4.6, l'ultima versione del suo modello linguistico di punta. Questa release promette prestazioni migliorate e nuove funzionalità, consolidando la posizione di Claude nel panorama dei modelli di linguaggio di grandi dimensioni (LLM). L'annuncio non specifica dettagli sull'hardware o sui requisiti di implementazione.

2026-02-11 Fonte

📁 LLM AI generated

Pattinaggio su ghiaccio e AI: quando l'IA crea musica... e plagi!

La coppia di ballerini su ghiaccio cechi Katerina Mrazkova e Daniel Mrazek ha scoperto che i modelli linguistici di grandi dimensioni (LLM) possono generare brani musicali che, inaspettatamente, si rivelano essere plagi. Un'esperienza che solleva interrogativi sull'originalità e il diritto d'autore nell'era dell'AI.

2026-02-10 Fonte

📁 LLM AI generated

Il chatbot nutrizionale di RFK Jr. suggerisce cibi per via rettale

Un chatbot AI del Dipartimento della Salute americano, promosso da Robert F. Kennedy Jr., ha generato risposte discutibili, suggerendo alimenti adatti all'inserimento rettale e identificando il fegato come la parte del corpo umano più nutriente. L'implementazione del chatbot, basata su Grok, solleva preoccupazioni sull'integrazione dell'AI nei servizi pubblici.

2026-02-10 Fonte

📁 LLM AI generated

Flapping Airplanes: 180 milioni di dollari per una nuova AI

Il laboratorio di intelligenza artificiale Flapping Airplanes ha raccolto 180 milioni di dollari in finanziamenti seed da Google Ventures, Sequoia e Index. L'obiettivo è sviluppare modelli di apprendimento che replichino il ragionamento umano, discostandosi dall'approccio tradizionale basato sull'analisi massiva di dati internet.

2026-02-10 Fonte

📁 LLM AI generated

Sito web nutrizionale basato su Grok in disaccordo con RFK Jr.

Il sito Realfood.gov, promosso da Robert F. Kennedy Jr., utilizza il chatbot Grok di Elon Musk per fornire informazioni nutrizionali. Alcune di queste informazioni sono in conflitto con le nuove linee guida governative sull'alimentazione.

2026-02-10 Fonte

📁 LLM AI generated

Facebook introduce nuove funzioni AI per profili e post

Facebook arricchisce la sua piattaforma con nuove funzionalità basate sull'intelligenza artificiale, permettendo agli utenti di animare le foto profilo, personalizzare Storie e Ricordi, e aggiungere sfondi animati ai post di testo. L'obiettivo è rendere più coinvolgente l'esperienza utente.

2026-02-10 Fonte

📁 LLM AI generated

Google Foto: la nuova funzione 'Chiedi' per trovare le tue immagini

Google Foto introduce la funzione 'Chiedi', un nuovo modo per interagire con le tue foto. Scopri come questa funzionalità può aiutarti a trovare rapidamente immagini specifiche e a riscoprire ricordi preziosi. Esplora le potenzialità di questa nuova interazione.

2026-02-10 Fonte

📁 LLM AI generated

Kimi: un LLM promettente secondo la community LocalLLaMA

La community LocalLLaMA ha espresso pareri positivi su Kimi, un modello linguistico di grandi dimensioni, paragonandolo favorevolmente a ChatGPT e Claude. Alcuni utenti lo considerano superiore in determinate applicazioni, aprendo nuove prospettive per l'inference locale e l'utilizzo in ambienti con requisiti specifici di privacy e controllo dei dati.

2026-02-10 Fonte

📁 LLM AI generated

Analisi della 'personalità' di LLM open-source tramite hidden states

Un ricercatore ha analizzato gli hidden states di sei modelli linguistici open-source (7B-9B parametri) per misurarne la 'personalità'. L'analisi rivela impronte comportamentali distinte, reazioni diverse a utenti ostili e 'zone morte' comportamentali, potenzialmente legate all'allineamento tramite RLHF. I risultati evidenziano come l'allineamento comprima la dimensionalità comportamentale dei modelli.

2026-02-10 Fonte

📁 LLM AI generated

Hugging Face anticipa una collaborazione con Anthropic

Hugging Face ha lasciato intendere una possibile collaborazione con Anthropic, l'azienda dietro i modelli Claude. Sebbene la natura esatta della collaborazione rimanga incerta, le speculazioni suggeriscono che potrebbe trattarsi di un dataset per il miglioramento della sicurezza dei modelli, piuttosto che un modello open source completo.

2026-02-10 Fonte

📁 LLM AI generated

Qwen-Image-2.0: modello unificato da 7B per generazione e modifica immagini

Il team di Qwen ha rilasciato Qwen-Image-2.0, un modello da 7B unificato per generazione e modifica di immagini, capace di rendering di testo e gestione di immagini a 2K. Al momento disponibile solo via API su Alibaba Cloud (beta a inviti) e demo gratuita su Qwen Chat, si prevede il rilascio dei pesi a breve, data la precedente esperienza con Qwen-Image v1.

2026-02-10 Fonte

📁 LLM AI generated

Step-3.5-Flash: un modello LLM compatto ma potente

Un utente ha segnalato l'efficacia del modello Step-3.5-Flash, evidenziandone le prestazioni superiori rispetto a modelli più grandi come GPT OSS 120B in determinati contesti. La sua disponibilità su OpenRouter e le prestazioni paragonabili a Deepseek V3.2, pur con dimensioni inferiori, lo rendono interessante per applicazioni con risorse limitate.

2026-02-10 Fonte

📁 LLM AI generated

Modelli Linguistici Visuali: Tokenizzazione Aggirata o Reintrodotta?

Un recente studio analizza se i modelli linguistici basati su pixel riescono effettivamente a superare i limiti della tokenizzazione, soprattutto in lingue con script non latini. I risultati evidenziano come l'integrazione di tokenizer testuali possa reintrodurre problemi di allineamento, impattando negativamente le performance, anche con modelli avanzati come Llama 2.

2026-02-10 Fonte

📁 LLM AI generated

TransConv-DDPM: IA Generativa per Serie Temporali Biomediche

Un nuovo modello di IA generativa, TransConv-DDPM, promette di superare la scarsità di dati clinici reali, generando serie temporali fisiologiche sintetiche. Il modello combina un modello di diffusione con U-Net, convoluzioni multi-scala e transformer, migliorando le prestazioni dei modelli predittivi in ambito medico.

2026-02-10 Fonte