Sviluppo e Competizione di Modelli AI

2026-02-06 • DigiTimes

Google: l'AI rivitalizza la ricerca, non la soppianta

Secondo Digitimes, i recenti progressi di Google nell'integrazione dell'intelligenza artificiale nel motore di ricerca dimostrano come l'AI stia potenziando, e non sostituendo, le funzionalità di ricerca esistenti. L'azienda sta ottenendo significati...

#LLM On-Premise #DevOps

2026-02-05 • TechCrunch AI

Reddit punta sulla ricerca AI per nuove opportunità di business

Reddit identifica nella ricerca potenziata dall'intelligenza artificiale una significativa opportunità di crescita del proprio business. L'azienda punta a migliorare l'esperienza utente e monetizzare ulteriormente la piattaforma attraverso nuove funz...

#LLM On-Premise #DevOps

2026-02-05 • Ars Technica AI

OpenAI: GPT-5.3-Codex estende le capacità oltre la semplice scrittura di codice

OpenAI ha annunciato GPT-5.3-Codex, una nuova versione del suo modello di programmazione avanzato, accessibile tramite riga di comando, estensione IDE, interfaccia web e una nuova app desktop per macOS. Questo modello supera le versioni precedenti in...

#LLM On-Premise #DevOps

2026-02-05 • TechCrunch AI

OpenAI rilancia il modello di sviluppo agentico Codex

OpenAI ha annunciato un aggiornamento del suo modello di sviluppo agentico Codex, progettato per accelerare le capacità di sviluppo. La notizia arriva poco dopo un annuncio simile da parte di Anthropic, segnalando una competizione crescente nel setto...

#LLM On-Premise #DevOps

2026-02-05 • LocalLLaMA

Nuovi modelli OCR: LightOnOCR-2 e GLM-OCR migliorano l'accuratezza

Sono stati rilasciati LightOnOCR-2 e GLM-OCR, due nuovi modelli per il riconoscimento ottico dei caratteri (OCR). Un utente ha segnalato prestazioni superiori rispetto alle soluzioni disponibili a fine 2025, con GLM-OCR che offre velocità e output st...

2026-02-05 • TechCrunch AI

OpenAI lancia una piattaforma per le aziende per costruire e gestire agenti AI

OpenAI ha lanciato Frontier, una nuova piattaforma progettata per le aziende per costruire e deployare agenti AI.

#LLM On-Premise

2026-02-05 • OpenAI Blog

GPT-5.3-Codex: un agente nativo per attività tecniche complesse

Presentato GPT-5.3-Codex, un agente basato su Codex progettato per affrontare attività tecniche complesse nel mondo reale. Combina elevate prestazioni di programmazione con capacità di ragionamento generale per supportare progetti a lungo termine.

#LLM On-Premise #DevOps

2026-02-05 • OpenAI Blog

GPT-5.3-Codex: nuovo modello per la generazione di codice

Presentato GPT-5.3-Codex, un modello avanzato per la generazione di codice che combina le prestazioni di GPT-5.2-Codex con capacità di ragionamento e conoscenza professionale superiori. Il modello si posiziona come uno dei più avanzati nel suo genere...

#LLM On-Premise #DevOps

2026-02-05 • TechCrunch AI

Anthropic presenta Opus 4.6 con nuove funzionalità per 'team di agenti'

Anthropic ha rilasciato la versione 4.6 di Opus, il suo modello linguistico di punta. Questa release punta ad ampliare la sua applicabilità a nuovi casi d'uso, in particolare quelli che coinvolgono team di agenti AI.

#LLM On-Premise #DevOps

2026-02-05 • TechCrunch AI

Meta testa app standalone per video AI 'Vibes'

Meta sta sperimentando un'applicazione indipendente per 'Vibes', la sua piattaforma di video brevi generati tramite intelligenza artificiale. Lanciata a settembre, Vibes consente agli utenti di creare e condividere video AI e di accedere a un feed de...

#LLM On-Premise #DevOps

2026-02-05 • LocalLLaMA

gWorld: modello 8B batte Llama 4 da 402B generando codice web

Trillion Labs e KAIST AI hanno presentato gWorld, un modello di mondo visuale open-weight per interfacce grafiche mobile. gWorld, disponibile nelle versioni 8B e 32B, genera codice web eseguibile anziché pixel, superando in accuratezza modelli più gr...

#LLM On-Premise #Fine-Tuning #DevOps

2026-02-05 • LocalLLaMA

AnyTTS: sintesi vocale universale per sistemi di AI conversazionale

Uno sviluppatore ha creato AnyTTS, un sistema che permette di usare qualsiasi motore di text-to-speech (TTS) con diverse interfacce di AI conversazionale, inclusi ChatGPT e modelli LLM locali. L'integrazione avviene tramite la clipboard, semplificand...

#LLM On-Premise #DevOps

2026-02-05 • LocalLLaMA

Google: attenzione sequenziale per modelli AI più efficienti

Google Research ha presentato una nuova tecnica, chiamata attenzione sequenziale, per rendere i modelli di intelligenza artificiale più leggeri e veloci senza compromettere l'accuratezza. L'innovazione promette di ridurre i costi computazionali e mig...

#LLM On-Premise #DevOps

2026-02-05 • DigiTimes

MediaTek punta a 1 miliardo di dollari nel mercato ASIC cloud entro il 2026

MediaTek prevede una crescita significativa nel mercato dei chip ASIC per il cloud, con l'obiettivo di raggiungere un fatturato di 1 miliardo di dollari entro il 2026. L'azienda punta a consolidare la propria posizione in questo settore in espansione...

#Hardware #LLM On-Premise #DevOps

2026-02-05 • LocalLLaMA

Codag: visualizzare i workflow LLM in VSCode

Uno sviluppatore ha creato Codag, un'estensione open source per VSCode che visualizza i workflow degli LLM direttamente nell'ambiente di sviluppo. Supporta diversi framework come OpenAI, Anthropic, Gemini, LangChain, LangGraph e CrewAI, oltre a vari ...

2026-02-05 • TechCrunch AI

Altman critica aspramente le pubblicità di Claude durante il Super Bowl

Sam Altman, CEO di OpenAI, ha reagito in modo acceso alle pubblicità di Claude trasmesse durante il Super Bowl, arrivando a definire il suo rivale "disonesto" e "autoritario" in un lungo sfogo.

2026-02-04 • LocalLLaMA

Kimi K2.5: nuovo record tra i modelli open-source su ECI

Kimi K2.5 stabilisce un nuovo primato tra i modelli open-source sull'Epoch Capabilities Index (ECI), un indice che aggrega diversi benchmark. Con un punteggio di 147, si allinea a modelli come o3, Grok 4 e Sonnet 4.5, pur rimanendo indietro rispetto ...

#LLM On-Premise #DevOps

2026-02-04 • LocalLLaMA

Qwen3-Coder-Next-FP8: un nuovo re per la generazione di codice?

Un utente di Reddit ha segnalato performance eccellenti del modello Qwen3-Coder-Next-FP8. La discussione si concentra sulla sua capacità di generazione di codice, suggerendo un potenziale miglioramento rispetto ad alternative esistenti. L'articolo or...

#Fine-Tuning

2026-02-04 • LocalLLaMA

Mistral AI lancia Voxtral Mini: trascrizione vocale multilingue in tempo reale

Mistral AI presenta Voxtral Mini 4B Realtime 2602, un modello open-source per la trascrizione vocale multilingue in tempo reale. Offre accuratezza paragonabile ai sistemi offline con una latenza inferiore a 500ms, supporta 13 lingue ed è ottimizzato ...

#Hardware #LLM On-Premise #DevOps

2026-02-04 • Wired AI

Mistral AI sfida i colossi con traduzioni ultra-rapide

La startup francese Mistral AI adotta un approccio diverso rispetto ai grandi laboratori statunitensi, puntando sull'efficienza e sulla velocità di traduzione dei suoi modelli, con un occhio di riguardo all'ottimizzazione delle risorse hardware.

#Hardware #LLM On-Premise #DevOps

2026-02-04 • IEEE Spectrum

AlphaGenome: DeepMind interpreta il DNA non codificante con l'AI

DeepMind presenta AlphaGenome, uno strumento di deep learning per interpretare il DNA non codificante, quella parte del genoma che regola l'attività genica. AlphaGenome mira a migliorare la comprensione dei meccanismi biologici e accelerare la scoper...

#Fine-Tuning

2026-02-04 • LocalLLaMA

Intern-S1-Pro: un nuovo modello linguistico di grandi dimensioni

È stato rilasciato Intern-S1-Pro, un modello linguistico di grandi dimensioni (LLM) con circa 1 trilione di parametri. Sembra essere una versione scalata del modello Qwen3-235B, con un'architettura basata su 512 esperti.

#Hardware #LLM On-Premise #DevOps

2026-02-04 • LocalLLaMA

Qwen3-Coder-Next REAP: nuovo modello GGUF da 48B

È disponibile un nuovo modello Qwen3-Coder-Next REAP da 48 miliardi di parametri, convertito in formato GGUF. Questo formato facilita l'utilizzo del modello su diverse piattaforme hardware, rendendolo accessibile a un'ampia gamma di sviluppatori e ri...

#Hardware #LLM On-Premise #DevOps

2026-02-04 • ArXiv cs.CL

STEMVerse: un framework per valutare il ragionamento STEM negli LLM

Un nuovo studio introduce STEMVerse, un framework diagnostico per analizzare le capacità di ragionamento scientifico, tecnicico, ingegneristico e matematico (STEM) dei modelli linguistici di grandi dimensioni (LLM). STEMVerse mira a superare i limiti...

#LLM On-Premise #DevOps

2026-02-04 • ArXiv cs.CL

LLM: Misurare la divergenza tra ragionamento interno e risposte finali

Un nuovo studio introduce l'Hypocrisy Gap, una metrica per quantificare quanto i modelli linguistici (LLM) alterino il loro ragionamento interno per compiacere l'utente. Utilizzando autoencoder sparsi, la metrica confronta la "verità" interna del mod...

2026-02-04 • ArXiv cs.LG

UNSO: Ottimizzazione Unificata Newton-Schulz per prestazioni stabili

Un nuovo approccio, chiamato UNSO (Unified Newton-Schulz Orthogonalization), mira a risolvere i problemi di efficienza e stabilità nell'iterazione Newton-Schulz, utilizzata in ottimizzatori come Muon e sulla varietà di Stiefel. Il metodo consolida la...

2026-02-04 • DigiTimes

Alphabet espande le operazioni a Bangalore, focus sull'AI in India

Alphabet prevede una significativa espansione delle sue attività a Bangalore, in India. Questa mossa sottolinea l'importanza crescente dell'India come hub per lo sviluppo dell'intelligenza artificiale e la volontà di Alphabet di investire in questo s...

#LLM On-Premise #DevOps

2026-02-03 • Anthropic News

Xcode di Apple supporta ora l'SDK Claude Agent

L'ambiente di sviluppo integrato (IDE) Xcode di Apple ora supporta l'SDK Claude Agent. Questa integrazione potrebbe semplificare lo sviluppo di applicazioni che sfruttano le capacità di Claude.

2026-02-03 • Ars Technica AI

Xcode 26.3 supporta Claude e Codex tramite Model Context Protocol

Apple ha annunciato Xcode 26.3, una nuova versione del suo IDE che supporta strumenti di agentic coding come Codex e Claude Agent. L'integrazione è resa possibile tramite Model Context Protocol (MCP), che consente agli agenti AI di interagire con str...

#LLM On-Premise #DevOps

2026-02-03 • TechCrunch AI

Xcode integra agenti di Anthropic e OpenAI per la generazione di codice

La nuova versione di Xcode (26.3) introduce funzionalità di generazione di codice basate su agenti, grazie all'integrazione di Claude Agent di Anthropic e Codex di OpenAI. Questa novità mira a semplificare e velocizzare il processo di sviluppo per gl...

#LLM On-Premise #DevOps

2026-02-03 • LocalLLaMA

ACE-Step 1.5: il modello open source che sfida Suno nella generazione musicale

È disponibile ACE-Step 1.5, un modello open source per la generazione di musica. Promette di superare Suno in termini di qualità, generando brani completi in circa 2 secondi su una GPU A100 e funzionando localmente su PC con 4GB di VRAM. Il codice, i...

#Hardware #LLM On-Premise #Fine-Tuning

2026-02-03 • LocalLLaMA

GLM rilascia un modello OCR open source

GLM ha rilasciato un modello di riconoscimento ottico dei caratteri (OCR) open source. Il modello, denominato GLM-OCR, è disponibile su Hugging Face. Sembra essere composto da un modello di visione da 0.9 miliardi di parametri e un modello linguistic...

#LLM On-Premise #DevOps

2026-02-03 • DigiTimes

Apple rafforza l'integrazione AI con l'acquisizione di Q.ai

Apple ha acquisito Q.ai, segnalando un ulteriore investimento nell'integrazione di hardware e intelligenza artificiale. Questa mossa strategica potrebbe portare a miglioramenti nelle prestazioni dei dispositivi e a nuove funzionalità basate su AI, co...

#Hardware #LLM On-Premise #DevOps

2026-02-03 • ArXiv cs.CL

MediGRAF: IA clinica ibrida per l'analisi sicura dei dati sanitari

Un nuovo sistema ibrido, MediGRAF, combina grafi di conoscenza e LLM per interrogare i dati sanitari dei pazienti. Il sistema integra dati strutturati e non strutturati, ottenendo un'accuratezza del 100% nelle risposte e un elevato livello di qualità...

#Fine-Tuning #RAG

2026-02-03 • ArXiv cs.CL

PPoGA: Ragionamento avanzato con Knowledge Graph per LLM

Un nuovo framework, PPoGA, migliora la capacità dei modelli linguistici di grandi dimensioni (LLM) di rispondere a domande complesse basate su Knowledge Graph. Ispirato al controllo cognitivo umano, PPoGA introduce meccanismi di auto-correzione per s...

#LLM On-Premise #DevOps

2026-02-03 • ArXiv cs.LG

OGD4All: LLM per accesso semplificato a dati governativi geospaziali

OGD4All è un framework che utilizza modelli linguistici di grandi dimensioni (LLM) per semplificare l'interazione dei cittadini con i dati geospaziali aperti del governo. Il sistema combina recupero semantico dei dati, ragionamento agentico per la ge...

#LLM On-Premise #Fine-Tuning #DevOps

2026-02-03 • DigiTimes

Cina: ByteDance e Alibaba competono con nuovi modelli AI

La competizione nel settore dell'intelligenza artificiale in Cina si intensifica con l'annuncio di nuovi modelli di punta da parte di ByteDance e Alibaba. Questa mossa evidenzia la crescente importanza del mercato cinese nello sviluppo e nell'impleme...

#LLM On-Premise #DevOps

2026-02-03 • DigiTimes

Corsa all'IA in Cina: duello a tre per la leadership

La competizione nel settore dei modelli di intelligenza artificiale in Cina si fa sempre più serrata, con tre contendenti principali che si sfidano per la leadership. La posta in gioco è alta, considerando il ruolo strategico dell'IA nello sviluppo t...

#LLM On-Premise #DevOps

2026-02-02 • Google AI Blog

Google AI presenta Genie 3, un modello interattivo in tempo reale

L'ultimo episodio del podcast Google AI: Release Notes si concentra su Genie 3, un modello del mondo interattivo in tempo reale. Logan Kilpatrick ne discute con Diego Rivas e Shlomi Fruchter. Approfondimenti sull'evoluzione dei modelli AI e le loro a...

#LLM On-Premise #DevOps

2026-02-02 • TechCrunch AI

OpenAI rilascia app MacOS per la generazione di codice tramite agenti

OpenAI ha lanciato una nuova applicazione per MacOS dedicata a Codex, integrando le tecniche di generazione di codice tramite agenti che hanno guadagnato popolarità dall'introduzione di Codex lo scorso anno. L'app mira a semplificare e potenziare il ...

#Fine-Tuning

2026-02-02 • Ars Technica AI

OpenAI lancia l'app desktop Codex per macOS, sfida Claude Code

OpenAI ha rilasciato una app desktop per macOS dedicata a Codex, il suo strumento di sviluppo basato su modelli linguistici di grandi dimensioni (LLM). Questa mossa mira a competere con Claude Code di Anthropic, offrendo un'alternativa alle interfacc...

#LLM On-Premise #DevOps

2026-02-02 • Tech.eu

Berget AI: 2,1 milioni di euro per l'AI sovrana in Svezia

La startup svedese Berget AI ha raccolto 2,1 milioni di euro per sviluppare una piattaforma AI full-stack che garantisca la sovranità dei dati. L'azienda si rivolge a sviluppatori che desiderano creare applicazioni AI utilizzando modelli linguistici ...

#LLM On-Premise #DevOps

2026-02-02 • MIT Technology Review

AI aziendale: scegliere il caso d'uso iniziale per il successo

Molte aziende hanno investito frettolosamente nell'AI generativa, spesso senza ottenere i risultati sperati. Mistral AI suggerisce di partire da un caso d'uso "iconico": strategico, urgente, di forte impatto e fattibile. Questo approccio consente di ...

#LLM On-Premise #DevOps

2026-02-02 • OpenAI Blog

Snowflake e OpenAI: intelligenza artificiale avanzata sui dati enterprise

Snowflake e OpenAI hanno stretto una partnership da 200 milioni di dollari per integrare capacità di intelligenza artificiale avanzata direttamente all'interno della piattaforma Snowflake. L'obiettivo è consentire lo sviluppo di agenti AI e l'estrazi...

#LLM On-Premise #DevOps

2026-02-02 • DigiTimes

Computex: Huang preannuncia una nuova fase nella corsa all'AI

Jensen Huang, CEO di NVIDIA, prepara il terreno per il Computex, segnalando un'intensificazione della competizione nel settore dell'intelligenza artificiale. L'evento dovrebbe fare luce sulle ultime innovazioni hardware e software che alimentano la p...

#Hardware #LLM On-Premise #DevOps

2026-02-02 • AI News

ThoughtSpot: Agenti AI per analisi dati e decisioni

ThoughtSpot introduce una nuova generazione di agenti AI per l'analisi dei dati, con l'obiettivo di trasformare la business intelligence da passiva ad attiva. Questi agenti monitorano continuamente i dati, diagnosticano i cambiamenti e automatizzano ...

2026-02-02 • TechCrunch AI

Dispositivi AI per la trascrizione automatica di meeting

Nuovi dispositivi fisici sfruttano l'intelligenza artificiale per trascrivere l'audio in tempo reale, generando riassunti e identificando azioni da intraprendere durante le riunioni. Alcuni modelli offrono anche traduzione simultanea, migliorando la ...

#Hardware

2026-02-02 • DigiTimes

ByteDance accelera su Doubao nell'affollata arena dell'IA

ByteDance intensifica gli sforzi nel campo dell'intelligenza artificiale con Doubao, in un contesto di crescente competizione. L'azienda punta a consolidare la propria posizione nel mercato, sfruttando le opportunità offerte dall'attuale panorama tec...

#LLM On-Premise #DevOps

2026-02-02 • ArXiv cs.CL

MrRoPE: Un approccio unificato per estendere la finestra di contesto dei LLM

Un nuovo studio introduce MrRoPE, una formulazione generalizzata per estendere la finestra di contesto dei modelli linguistici di grandi dimensioni (LLM) basata su una prospettiva di conversione del sistema numerico. Questo approccio unifica diverse ...

#LLM On-Premise #Fine-Tuning #DevOps

2026-02-02 • ArXiv cs.AI

JAF: Un Foresta di Agenti Giudici per il Raffinamento dell'AI

JAF (Judge Agent Forest) è un framework che impiega agenti giudici per valutare e migliorare iterativamente i processi di ragionamento degli agenti AI. JAF analizza congiuntamente gruppi di query e risposte, identificando modelli e incongruenze per f...

#RAG

2026-02-02 • LocalLLaMA

Step-3.5-Flash: performance superiore con meno parametri

Il modello Step-3.5-Flash, con un'architettura a parametri attivi ridotta (11B su 196B totali), dimostra performance superiori a DeepSeek v3.2 in benchmark di coding e agenti. DeepSeek v3.2 utilizza un'architettura con molti più parametri attivi (37B...

#Hardware #LLM On-Premise #DevOps

2026-02-01 • LocalLLaMA

OLMO 3.5: in arrivo un modello ibrido per inference LLM efficiente

Il modello OLMO 3.5 di AI2 combina l'attenzione transformer standard con l'attenzione lineare tramite Gated Deltanet. Questo approccio ibrido mira a migliorare l'efficienza e ridurre l'utilizzo di memoria, mantenendo la qualità del modello. La serie ...

#Fine-Tuning

2026-02-01 • LocalLLaMA

4chan e LLM: dati "sporchi" possono migliorare le consegne?

Un esperimento ha mostrato come l'addestramento di un modello linguistico su un dataset derivato da 4chan abbia portato a risultati inattesi. Il modello, Assistant_Pepe_8B, ha superato le prestazioni del modello base Nemotron di NVIDIA, nonostante fo...

#Hardware #LLM On-Premise #Fine-Tuning

2026-01-31 • DigiTimes

Nvidia smentisce rottura con OpenAI e annuncia maxi-investimento

Jensen Huang, CEO di Nvidia, ha negato le voci di una rottura con OpenAI, sottolineando anzi l'importanza della partnership. L'azienda ha inoltre annunciato un investimento significativo, il più grande della sua storia, in un progetto non specificato...

#Hardware #LLM On-Premise #DevOps

2026-01-31 • LocalLLaMA

g-HOOT: Un Nuovo Articolo di Ricerca nel Mondo dell'AI

Un nuovo articolo di ricerca, disponibile su arXiv, denominato "g-HOOT in the Machine", ha catturato l'attenzione della comunità di LocalLLaMA. L'articolo, identificato tramite il link arXiv fornito, promette di esplorare nuove frontiere nel campo de...

2026-01-30 • LocalLLaMA

GPT-OSS: un modello open-source ancora competitivo?

Un utente di LLM locali si interroga sull'eccezionale performance di GPT-OSS 120B, un modello open-source datato ma ancora competitivo. Nonostante le nuove architetture e modelli, GPT-OSS eccelle per velocità, efficacia e tool calling. L'articolo esp...

#LLM On-Premise #Fine-Tuning #DevOps

2026-01-30 • LocalLLaMA

Kimi-k2.5: performance paragonabili a Gemini 2.5 Pro in contesti ampi

Un utente su Reddit riporta che il modello Kimi-k2.5 raggiunge prestazioni simili a Gemini 2.5 Pro nella gestione di contesti di grandi dimensioni. La discussione si concentra sulle implicazioni di tale risultato per i modelli LLM open source.

#LLM On-Premise #DevOps

2026-01-30 • LocalLLaMA

LeCun: i migliori modelli open source non vengono dall'Occidente

Yann LeCun afferma che i modelli open source più avanzati provengono dalla Cina, sottolineando come l'apertura stia guidando il progresso dell'intelligenza artificiale. La chiusura e l'accesso limitato rischiano di rallentare l'innovazione occidental...

#LLM On-Premise #DevOps

Sviluppo e Competizione di Modelli AI

Articoli Correlati