Hardware per LLM Locali
Benchmark, guide alle GPU e build workstation per la sovranità dei dati.
Google raziona l'accesso a Gemini per Meta: carenza di potenza di calcolo
Secondo il Financial Times, Google ha imposto limiti a Meta nell'uso dei modelli Gemini perché non riesce a fornire la capacità di calcolo...
Linux sfoltisce i driver, l'AI scova le falle: così il kernel prepara l'infrastruttura del futuro
Mentre il Q2 2026 volge al termine, Phoronix fa il punto sulle novità del kernel Linux: rimozione di driver obsoleti, rilevamento di vulnerabilità...
UPI verso il miliardo di transazioni: l’AI è il motore, ma serve un’infrastruttura locale
Il sistema di pagamenti indiano UPI punta al miliardo di transazioni giornaliere. Secondo il CEO di NPCI, l’intelligenza artificiale sarà...
Per accedere all’anteprima di GPT 5.6 Sol servono impronte e passaporto: cosa significa?
Un utente Reddit ha condiviso la procedura di candidatura per l’anteprima di GPT 5.6 Sol: scanner del volto, controllo delle impronte digitali e...
Tiny PC, grandi passioni: Tarlin lancia capsule toy con licenza dei ‘big four’
L'azienda giapponese Tarlin sigla un accordo con i quattro principali produttori mondiali di componenti PC per creare schede madri, case e CPU in...
Instagram trasforma l’algoritmo in esperienza centrale
Mosseri vuole portare in primo piano 'Your Algorithm', lo strumento per scegliere i temi da vedere. Non più un’impostazione nascosta, ma un...
Perché Salesforce promuove un concorrente AI su Slack? La strategia che confonde i dipendenti
L’annuncio di Claude Tag di Anthropic ha scatenato confusione dentro Salesforce: la società, proprietaria di Slack, ha promosso il prodotto sui...
Sunrise: piattaforma energetica integrata per data center AI
Sunrise sviluppa una piattaforma energetica integrata per rispondere ai consumi crescenti dei data center AI. L'iniziativa affronta picchi di...
Kaori vede ordini fuel cell estendersi a un anno e accelera l’espansione produttiva
Il portafoglio commesse di Kaori per celle a combustibile raggiunge orizzonti annuali, mentre l’azienda potenzia gli impianti a Taiwan e...
LG Chem valuta più CCL: l’AI fa pressione sulla filiera dei semiconduttori
Il gigante chimico sudcoreano studia l’aumento della produzione di copper clad laminate, materiale chiave per i circuiti stampati di chip AI. La...
Sfida a Starlink: la joint venture Rakuten-AST SpaceMobile per il Giappone
Rakuten e AST SpaceMobile annunciano una joint venture per fornire banda larga satellitare diretta agli smartphone in Giappone, mirando a...
Sfida a due nel benchmark US Ban: OpenAI e Anthropic pareggiano
L'anteprima di GPT 5.6 porta OpenAI in parità con Anthropic nel benchmark US Ban. I modelli cinesi restano indietro, Gemini da aggiornare. Per chi...
Model Registry: i modelli open viaggiano su torrent, Hugging Face fa da riserva
Un nuovo progetto sfrutta file torrent e web seeding per distribuire Large Language Models open source, con Hugging Face come fonte di fallback....
Anche Google crede nei modelli piccoli per il coding
Google ha organizzato hackathon per Gemma 4 31B, un LLM compatto che nel cloud raggiunge 1500 token/s, da 50 a 100 volte più di quanto si ottenga...
Dalle risate dei primati alla musica egocentrica: il lato computazionale della scienza
Quattro studi rivelano scoperte eterogenee, dall'evoluzione del riso all'impatto sugli eventi meteo. Ma dietro questi risultati c'è un'esigenza...
Il capo di Vision Pro verso OpenAI: cosa significa per l’hardware AI
Paul Meade, il vicepresidente Apple responsabile del visore Vision Pro, lascerebbe l’azienda per unirsi al team hardware di OpenAI. Un passaggio...
Dopo Mythos, anche GPT-5.6 viene frenato: il peso delle richieste governative sui modelli cloud
OpenAI limita il lancio di GPT-5.6 in seguito a una richiesta governativa, dichiarando che le restrizioni non dovrebbero diventare la norma. Il...
SpectralQuant riduce il gap della quantization Q4_K_M al 96.5%: un salto per i modelli locali
Spectral Labs ha rilasciato una quantization Q4_K_M di Qwen3.5 0.8B con un nuovo metodo calibrato che recupera il 96.5% del divario qualitativo...
OpenAI pesca da Uber India per guidare l'espansione nel suo mercato più grande fuori dagli USA
Prabhjeet Singh, ex presidente di Uber India e Sud Asia, è il primo managing director per l'India di OpenAI. Guiderà crescita consumer, adozione...
Diagnosi di cancro, combatte con l'AI: il caso Christou accende il dibattito sulla privacy
Connor Christou ha usato Claude per analizzare esami, immagini e dati biometrici durante il suo percorso oncologico. Una scelta potente ma che...
Intel Nova Lake: 52 core e fino a 474W per il desktop di nuova generazione
Secondo indiscrezioni, la futura CPU Intel Nova Lake a 52 core potrebbe raggiungere un valore di potenza di picco di 474W, imponendo ai...
4090 e 5090 con 96 GB di VRAM? L'alert dal mondo dei laboratori GPU
Un piccolo laboratorio GPU americano lancia un avviso pubblico: le schede customizzate GeForce RTX 4090 e 5090 con 96 GB di VRAM sono una truffa....
Startup asiatiche lanciano modelli AI 'Mythos-like' sfidando l'export ban USA
Nell'ombra delle restrizioni all'esportazione di tecnicie AI imposte dagli Stati Uniti, startup asiatiche stanno rilasciando modelli con capacità...
Linux MD RAID5 migliora la scalabilità fino al 17%: cosa cambia per lo storage on-prem
Una nuova serie di patch per il codice RAID5 di Linux MD promette miglioramenti di scalabilità tra il 10 e il 17% in alcune configurazioni. Un...
Orthrus porta la testa a diffusione su Qwen 3.5/3.6 e Gemma 4: codice open source in arrivo
I modelli Orthrus con head a diffusione stanno per atterrare su Hugging Face, accompagnati dal codice completo di training e evaluation. Una...
GNOME ora ha un assistente AI che genera immagini: Newelle 1.4.5
Dopo tre anni di sviluppo, Newelle raggiunge la versione 1.4.5 con due novità: il supporto alla generazione di immagini tramite AI e...
L’AI del futuro non sarà guidata solo da modelli migliori
Secondo il CEO di Oxylabs, il vero salto non è nei modelli ma nella qualità e freschezza dei dati. Per chi gestisce LLM on-premise, la sovranità...
Dal mercato di Shenzhen una RTX 5090 con 96 GB di VRAM: costa 8.200 dollari
Un report da Huaqiangbei conferma l'offerta di GPU GeForce RTX 5090 modificate con 96 GB di VRAM. Il costo totale si aggira sui 8.200 dollari, tra...
USA sblocca Mythos 5 di Anthropic per una cerchia ristretta di difensori informatici
Il Dipartimento del Commercio autorizza Anthropic a ripristinare l’accesso a Mythos 5, il modello di cybersecurity più potente dell’azienda, solo...
Meno sincronizzazioni CUDA in llama.cpp: guadagni prestazionali per l'inference on-prem
Un nuovo commit nel progetto llama.cpp reintroduce una gestione asincrona più aggressiva per i backend CUDA, riducendo le sincronizzazioni tra...
Cerchi notizie generali sull'AI?
< AI-RADAR MAIN