Progressi negli LLM e Mercato dell'AI Generativa

2026-04-29 • LocalLLaMA

Xiami mimo-v2.5 pro: Un LLM open weight supera Opus 4.5 nella classifica Arena

Il modello Xiami mimo-v2.5 pro, rilasciato con licenza MIT, ha superato Opus 4.5 nella classifica Arena dedicata ai modelli di linguaggio per il coding. Questo risultato posiziona Xiami mimo-v2.5 pro al nono posto, un gradino sopra il suo predecessor...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-29 • LocalLLaMA

Deepseek V4 Pro: 100 milioni di token a 2,65 dollari, una svolta nel mercato LLM?

L'emergere di un'offerta per 100 milioni di token del modello Deepseek V4 Pro a soli 2,65 dollari sta generando discussioni nel settore degli LLM. Questo prezzo estremamente competitivo solleva interrogativi sulle dinamiche di mercato e sulle strateg...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • The Next Web

OpenAI: il mercato smentisce le rassicurazioni sulla crescita

Nonostante le rassicurazioni di OpenAI, che ha definito "clickbait" le voci su mancate previsioni di crescita e ha ribadito la piena sintonia tra i vertici, il mercato ha reagito con scetticismo. Un report del Wall Street Journal, che indicava il man...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • The Next Web

Nvidia Nemotron 3 Nano Omni: il modello multimodale per l'Edge Computing

Nvidia ha presentato Nemotron 3 Nano Omni, un modello AI multimodale open-weight da 30 miliardi di parametri, ottimizzato per l'inference su dispositivi edge. Grazie a un'architettura Mixture-of-Experts, attiva solo 3 miliardi di parametri per passat...

#Hardware #LLM On-Premise #DevOps

2026-04-28 • LocalLLaMA

Mistral Medium in arrivo: un'analisi dei parametri e delle architetture

Mistral AI si prepara a rilasciare il suo modello "Medium", che si distinguerà per 128 miliardi di parametri. Questa nuova iterazione, che potrebbe adottare un'architettura densa o una versione meno sparsa di Mixture of Experts (MoE) rispetto a Mistr...

#Hardware #LLM On-Premise #DevOps

2026-04-28 • LocalLLaMA

Mistral AI: attesa per un nuovo modello o strumento

L'ecosistema degli LLM è in fermento per un potenziale annuncio da parte di Mistral AI. Un recente post sui social media suggerisce l'imminente rilascio di nuovi modelli o l'aggiornamento di strumenti esistenti, un evento che potrebbe avere ripercuss...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • LocalLLaMA

NVIDIA Nemotron-3 Nano Omni 30B: Un LLM Multimodale per il Deployment Locale

NVIDIA ha rilasciato Nemotron-3 Nano Omni 30B, un Large Language Model multimodale capace di elaborare input audio, immagini e testo per generare risposte testuali. Disponibile in precisione BF16 e in formato GGUF ottimizzato, questo modello si posiz...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • LocalLLaMA

Ling-2.6-flash: Un nuovo LLM ottimizzato per deployment locali

È stato rilasciato Ling-2.6-flash, un nuovo Large Language Model che si posiziona come soluzione interessante per l'inference su infrastrutture proprietarie. La sua presenza nella comunità dedicata ai deployment locali suggerisce un'attenzione partic...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • Tom's Hardware

Mercato AI in calo: OpenAI non raggiunge gli obiettivi, azioni Nvidia e AMD in sofferenza

Il mercato dell'intelligenza artificiale ha registrato un calo significativo dopo le indiscrezioni secondo cui OpenAI non avrebbe raggiunto i propri obiettivi interni di utenti attivi e ricavi. La notizia ha avuto immediate ripercussioni sui titoli d...

#Hardware #LLM On-Premise #DevOps

2026-04-28 • Tech.eu

Freepik si reinventa come Magnific: una piattaforma AI creativa integrata per l'impresa

Freepik ha annunciato il rebranding in Magnific, consolidando la sua offerta in una piattaforma AI creativa completa. Con un ARR di 200 milioni di dollari e oltre un milione di abbonati, inclusi 250 clienti enterprise come BBC e DeliveryHero, Magnifi...

#LLM On-Premise #DevOps

2026-04-28 • LocalLLaMA

Microsoft presenta TRELLIS.2: un modello Open Source da immagine a 3D con 4 miliardi di parametri

Microsoft ha rilasciato TRELLIS.2, un modello generativo 3D Open Source da 4 miliardi di parametri, progettato per creare asset ad alta fedeltà con texture PBR da semplici immagini. Sfruttando una struttura a voxel sparsa e compressione spaziale, TRE...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • LocalLLaMA

Deepseek Vision: Un Nuovo Modello Multimodale All'Orizzonte

Xiaokang Chen ha annunciato l'imminente rilascio di Deepseek Vision, un nuovo modello che promette di espandere le capacità degli LLM verso l'elaborazione multimodale. L'arrivo di modelli di visione solleva questioni cruciali per le aziende che valut...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • LocalLLaMA

MIMO V2.5 Pro: Un Nuovo LLM per il Panorama On-Premise

XiaomiMiMo ha rilasciato MIMO V2.5 Pro, un nuovo Large Language Model che si inserisce nel crescente interesse per le soluzioni AI self-hosted. Questo modello offre alle aziende l'opportunità di esplorare il deployment locale, affrontando le sfide le...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • The Register AI

Il costo nascosto della flessibilità: il vendor lock-in negli LLM e l'aumento dei prezzi

La percezione di poter facilmente scambiare modelli di intelligenza artificiale sta svanendo. Il vendor lock-in e l'incremento dei costi rappresentano sfide crescenti per le aziende, spingendo i decision-maker a riconsiderare le strategie di deployme...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-28 • ArXiv cs.LG

KARL: Reinforcement Learning per LLM più affidabili e meno 'allucinati'

Un nuovo framework, KARL, sfrutta il Reinforcement Learning per mitigare le allucinazioni negli LLM. Introducendo un sistema di ricompensa dinamico e una strategia di training a due stadi, KARL permette ai modelli di astenersi dalle risposte incerte,...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-27 • 404 Media

Un terzo dei nuovi siti web è generato dall'AI: uno studio rivela l'impatto sulla rete

Una ricerca congiunta di Stanford, Imperial College London e Internet Archive ha rivelato che circa un terzo dei siti web creati dal 2022 è generato o assistito dall'AI. Lo studio, che ha analizzato l'evoluzione del web dopo il lancio di ChatGPT, evi...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-27 • DigiTimes

L'AI aziendale vira verso l'Inference: riallineamento delle architetture di calcolo

Il panorama dell'intelligenza artificiale in ambito aziendale sta vivendo una transizione significativa, con un'attenzione crescente verso i carichi di lavoro di inference. Questo cambiamento impone un riallineamento strutturale delle architetture di...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-27 • DigiTimes

DeepSeek Ridefinisce la Competizione AI: Efficienza al Posto della Scala Pura

DeepSeek sta ridefinendo il panorama competitivo dell'intelligenza artificiale, spostando il focus dalla mera grandezza dei modelli all'efficienza operativa. Questo approccio ha implicazioni significative per le aziende che valutano deployment on-pre...

#Hardware #LLM On-Premise #DevOps

2026-04-27 • ArXiv cs.LG

Accelerare i Multimodal Foundation Models: un approccio integrato hardware-software

Una nuova metodologia mira ad accelerare i Multimodal Foundation Models (MFM) attraverso un co-design hardware-software dei blocchi Transformer. L'approccio include ottimizzazioni della pipeline, fine-tuning, e tecniche di compressione come la quanti...

#Hardware #LLM On-Premise #DevOps

2026-04-26 • Tom's Hardware

DeepSeek V4: un LLM da 1.6 trilioni di parametri su chip Huawei, tra accuse USA

DeepSeek ha rilasciato la versione V4 del suo Large Language Model, caratterizzato da 1.6 trilioni di parametri e sviluppato su chip Huawei. Questo annuncio giunge mentre il governo statunitense intensifica le accuse di furto di proprietà intellettua...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-25 • DigiTimes

Le aziende AI cinesi accelerano sul deployment e l'inference a GITEX Asia

Le aziende cinesi attive nel settore dell'intelligenza artificiale stanno spostando il loro focus verso il deployment e l'inference dei Large Language Models. Questa tendenza, evidenziata a GITEX Asia, indica una maturazione del mercato, che si conce...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-24 • The Register AI

DeepSeek V4: LLM open weights ottimizzato per acceleratori Huawei Ascend

DeepSeek ha presentato V4, un nuovo Large Language Model a pesi aperti che promette prestazioni elevate e una significativa riduzione dei costi di inference. Il modello si distingue per il supporto esteso alla famiglia di acceleratori AI Ascend di Hu...

#Hardware #LLM On-Premise #DevOps

2026-04-24 • TechCrunch AI

ComfyUI: 30 milioni di dollari per il controllo dei media generati da AI, valore a 500 milioni

ComfyUI, piattaforma che offre strumenti per la generazione di immagini, video e audio tramite intelligenza artificiale, ha raccolto 30 milioni di dollari, raggiungendo una valutazione di 500 milioni. L'investimento sottolinea l'importanza di soluzio...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-24 • TechCrunch AI

DeepSeek presenta nuovi LLM che riducono il divario con i modelli di punta

DeepSeek ha annunciato l'anteprima di nuovi Large Language Models (LLM) che, grazie a miglioramenti architetturali, superano DeepSeek V3.2 in efficienza e performance. L'azienda dichiara che questi modelli hanno quasi raggiunto le capacità dei princi...

#Hardware #LLM On-Premise #DevOps

2026-04-24 • DigiTimes

DeepSeek V4 e l'integrazione Huawei: un segnale per lo stack AI cinese

DeepSeek ha presentato i suoi modelli V4, caratterizzati da una significativa integrazione con le tecnicie Huawei. Questa mossa indica una potenziale ridefinizione dello stack tecnicico per l'intelligenza artificiale in Cina, con implicazioni per l'a...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-24 • The Next Web

DeepSeek lancia V4-Pro e V4-Flash, puntando all'eccellenza Open Source

DeepSeek, startup di Hangzhou, ha rilasciato le versioni di anteprima dei suoi nuovi LLM, V4-Pro e V4-Flash, disponibili su Hugging Face. Il modello V4-Pro si distingue per le prestazioni superiori in ambito di programmazione e matematica tra i model...

#Hardware #LLM On-Premise #DevOps

2026-04-23 • The Register AI

Anthropic: Claude ha 'peggiorato' durante gli sforzi per renderlo più intelligente

Anthropic ha riconosciuto che il suo modello Claude ha effettivamente prodotto risposte di qualità inferiore nell'ultimo mese. Gli utenti non si sbagliavano: l'azienda ha ammesso che, nel tentativo di rendere l'AI più intelligente, una serie di modif...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-23 • The Register AI

Claude Opus 4.7: Le nuove salvaguardie generano frustrazione tra gli sviluppatori

Il recente rilascio di Claude Opus 4.7 da parte di Anthropic, con le sue salvaguardie rafforzate, sta causando problemi. Gli sviluppatori lamentano un aumento dei rifiuti da parte del classificatore di uso accettabile, che impedisce l'impiego legitti...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-23 • The Next Web

OpenAI presenta GPT-5.5: un nuovo modello base per task complessi

OpenAI ha annunciato GPT-5.5, il suo primo modello base completamente riaddestrato da GPT-4.5. Con il nome in codice "Spud", è progettato per gestire attività multi-step complesse con minima supervisione umana. Il modello stabilisce nuovi benchmark i...

#Hardware #LLM On-Premise #DevOps

2026-04-23 • TechCrunch AI

OpenAI presenta GPT-5.5: capacità estese e la visione di una 'superapp' AI

OpenAI ha annunciato il rilascio di GPT-5.5, il suo ultimo modello che promette capacità avanzate in diverse categorie. L'azienda lo posiziona come un passo fondamentale verso la creazione di una 'superapp' basata sull'intelligenza artificiale. Quest...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-23 • OpenAI Blog

GPT-5.5: Un Nuovo Orizzonte per i Modelli Linguistici Avanzati

OpenAI ha presentato GPT-5.5, il suo LLM più sofisticato, progettato per essere più rapido e capace nell'affrontare compiti complessi come la programmazione, la ricerca e l'analisi dei dati. Questa evoluzione solleva importanti considerazioni per le ...

#Hardware #LLM On-Premise #DevOps

2026-04-23 • The Next Web

OpenAI presenta un nuovo modello di generazione immagini con capacità di ragionamento potenziate

OpenAI ha rilasciato un nuovo modello di generazione di immagini che integra capacità di ragionamento sulla composizione e ricerca contestuale sul web. Il modello è in grado di produrre fino a otto immagini coerenti da un singolo prompt e di gestire ...

#Hardware #LLM On-Premise #DevOps

2026-04-23 • ArXiv cs.LG

WorkflowGen: un Framework Adattivo per Ottimizzare i Workflow degli LLM

WorkflowGen è un nuovo framework che affronta le inefficienze degli agenti LLM, come l'elevato consumo di token e l'instabilità. Proposto come soluzione adattiva basata sull'esperienza pregressa, riduce il consumo di token di oltre il 40% e migliora ...

#LLM On-Premise #Fine-Tuning #DevOps

2026-04-23 • DigiTimes

La domanda di AI rafforza il ciclo delle apparecchiature per semiconduttori

L'industria dei semiconduttori sta vivendo una ripresa, guidata in particolare dalla crescente domanda di intelligenza artificiale. Questo trend sta rafforzando il ciclo delle apparecchiature di produzione, con aziende come Lam Research che beneficia...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-22 • OpenAI Blog

ChatGPT Images 2.0: nuove capacità per la generazione di immagini e il ragionamento visivo

OpenAI ha presentato ChatGPT Images 2.0, un modello di generazione di immagini all'avanguardia che introduce significativi miglioramenti. Le novità includono un rendering del testo più accurato all'interno delle immagini, un supporto multilingue este...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-22 • Microsoft Research

AutoAdapt: L'automazione dell'adattamento di LLM per scenari critici

Microsoft Research presenta AutoAdapt, un Framework Open Source che automatizza l'adattamento di Large Language Models a domini specialistici e ad alto rischio. Il sistema affronta le sfide di riproducibilità, costi e tempi, trasformando processi man...

#Hardware #LLM On-Premise #Fine-Tuning

2026-04-22 • 404 Media

Tokenmaxxing: le startup spendono più in AI che in personale, ma a quale costo?

Un nuovo fenomeno nel mondo delle startup, il "tokenmaxxing", vede le aziende vantarsi di spendere più in risorse AI che in salari per i dipendenti. Questa tendenza, presentata come indicatore di crescita e innovazione, solleva interrogativi sulla so...

#Hardware #LLM On-Premise #DevOps

2026-04-22 • Wired AI

Rilevamento AI: un'estensione Chrome etichetta i contenuti generati, sollevando interrogativi sull'autenticità

Pangram Labs ha aggiornato la sua estensione Chrome, progettata per identificare e segnalare i contenuti generati da intelligenza artificiale. Lo strumento applica etichette di avviso direttamente sui feed social degli utenti, evidenziando la crescen...

#LLM On-Premise #DevOps

Progressi negli LLM e Mercato dell'AI Generativa

Articoli Correlati