Guida Hardware AI On-Premise

Altro

USA sblocca Mythos 5 di Anthropic per una cerchia ristretta di difensori informatici

Il Dipartimento del Commercio autorizza Anthropic a ripristinare l’accesso a Mythos 5, il modello di cybersecurity più potente dell’azienda, solo...

2026-06-27 READ_MORE >

Frameworks

Meno sincronizzazioni CUDA in llama.cpp: guadagni prestazionali per l'inference on-prem

Un nuovo commit nel progetto llama.cpp reintroduce una gestione asincrona più aggressiva per i backend CUDA, riducendo le sincronizzazioni tra...

2026-06-27 READ_MORE >

Hardware

Chip AI: la strozzatura logistica minaccia i piani on-premise

La domanda di acceleratori per AI sta congestionando le spedizioni aeree e marittime, facendo lievitare i costi di trasporto. Per le aziende che...

2026-06-27 READ_MORE >

Market

SYM: utili in calo nel 2025 nonostante la quota di mercato record

Il produttore taiwanese di motocicli ha registrato un calo degli utili nel 2025, pur avendo raggiunto la quota di mercato più alta di sempre. Un...

2026-06-27 READ_MORE >

Hardware

JCET investe 1,1 miliardi: la svolta cinese per i chip AI passa dal packaging

L’espansione da 1,1 miliardi di dollari di JCET nel packaging avanzato indica la strategia cinese per superare le restrizioni sui semiconduttori e...

2026-06-27 READ_MORE >

LLM

Fine-tuning Qwen: perché i modelli ottimizzati faticano a convincere

Nonostante la popolarità del fine-tuning sui modelli Qwen, mancano riscontri concreti su versioni realmente superiori alla base. Un’indagine sulle...

2026-06-27 READ_MORE >

Frameworks

DeepSeek V4 Flash e MiniMax M3 su llama.cpp: a che punto è il supporto nativo?

La community attende l'integrazione ufficiale dei modelli DeepSeek V4 Flash e MiniMax M3 in llama.cpp. Le fork offrono soluzioni parziali, ma lo...

2026-06-27 READ_MORE >

LLM

DeepSeek-V4-Pro-DSpark: il nuovo LLM open source che guarda al deployment locale

DeepSeek pubblica su Hugging Face il modello V4-Pro-DSpark e il paper tecnico DSpark. Un rilascio che alimenta la strategia di chi punta su LLM...

2026-06-27 READ_MORE >

LLM

Ornith-1.0-35B Q3_K_M: 17 GB di VRAM e benchmark verde, la quantization estrema regge

Il modello Ornith-1.0-35B è stato quantizzato a Q3_K_M, scendendo a 16.8 GB su disco e ~17 GiB di VRAM caricata. Verificato con metriche KL...

2026-06-27 READ_MORE >

LLM

Distillare LLM in proprio per il theorem proving: quando lo stack on-premise batte il cloud

Un utente con fondi per hardware ma non per crediti cloud vuole distillare un LLM per theorem proving su Rocq, dove i modelli scarseggiano. La via...

2026-06-27 READ_MORE >

Hardware

Wiwynn e TE Connectivity raffreddano a liquido le sbarre DC a 800V per i datacenter AI

Al booth di Wiwynn abbiamo visto le nuove sbarre DC a 800V di TE Connectivity con raffreddamento a liquido integrato. Un segnale di come...

2026-06-27 READ_MORE >

LLM

Mythos 5 di Anthropic autorizzato a oltre 100 enti USA: svolta per l'AI sovrana?

L’amministrazione Trump ha concesso a più di 100 aziende e agenzie governative l’uso di Mythos 5 di Anthropic, estendendo i permessi anche ai...

2026-06-27 READ_MORE >

LLM

Anthropic può rilasciare Mythos a organizzazioni USA: il via libera della Casa Bianca

Dopo settimane di negoziati, la Casa Bianca ha autorizzato Anthropic a ripristinare l'accesso al suo modello più avanzato, Mythos, per un gruppo...

2026-06-27 READ_MORE >

Altro

La Corea del Sud addestra tutto l'esercito con i droni: l'AI sul campo impone l'inference locale

Seul punta a rendere i droni uno strumento universale per l’intero esercito, guidata dagli insegnamenti del conflitto ucraino. Una mossa che...

2026-06-26 READ_MORE >

Frameworks

llama.cpp: il tensor parallelism su Vulkan ora è alla portata di tutti

La pull request #25051 firmata da Piotr ‘pwilkin’ rende finalmente utilizzabile il parallelismo tensore su backend Vulkan in llama.cpp. Un passo...

2026-06-26 READ_MORE >

Altro

Nemotron-3-Super: 504K token di contesto perfetti su quattro RTX 3090

Il modello ibrido Mamba+MoE di NVIDIA, quantizzato a 71 GB, gira interamente su GPU consumer e mantiene un recupero esatto di informazioni fino a...

2026-06-26 READ_MORE >

Frameworks

Un veterano del software costruisce un harness locale per LLM e chiede alla community: cosa serve?

Un developer con 45 anni di esperienza in tooling enterprise sta per rilasciare un harness open source pensato per semplificare il deployment...

2026-06-26 READ_MORE >

Market

Ford riassume 350 ingegneri: l’AI da sola non garantiva la qualità

Il colosso dell’auto ammette di aver sovrastimato le capacità dell’intelligenza artificiale nel controllo qualità, richiamando centinaia di...

2026-06-26 READ_MORE >

Market

Microsoft ha costruito un supercomputer per aiutare OpenAI a violare il copyright, accusa il NYT

Il New York Times modifica la denuncia: Microsoft avrebbe costruito un supercalcolatore su misura per favorire le violazioni di copyright di...

2026-06-26 READ_MORE >

Market

Zettabyte chiede uno standard per la qualità del calcolo AI, mentre la domanda esplode

L'azienda Zettabyte sollecita un nuovo standard per valutare la qualità del calcolo nell'intelligenza artificiale, in un momento in cui la...

2026-06-26 READ_MORE >

Market

DrayTek scivola nei ricavi fino al 2026, la scommessa è su Wi-Fi 7 e cybersecurity

Il produttore taiwanese di apparati di rete affronta un calo del fatturato che si prolungherà fino al 2026. Per invertire la rotta punta sullo...

2026-06-26 READ_MORE >

Hardware

Intel prepara il supporto HDR per configurazioni DP MST su Linux

Il driver grafico Intel per il kernel Linux si prepara a colmare un vuoto: l'impossibilità di utilizzare l'HDR su connessioni DisplayPort...

2026-06-26 READ_MORE >

Altro

OpenAI frena il rilascio di GPT-5.6 su richiesta governativa: 'Non deve diventare la norma'

OpenAI ha limitato la distribuzione di GPT-5.6 su richiesta di un governo, scatenando un dibattito sulla sovranità digitale e l’accesso agli LLM....

2026-06-26 READ_MORE >

Market

OpenAI ingaggia l’ex capo di Uber India per guidare la sua espansione fuori dagli USA

La mossa rafforza la presenza di OpenAI in India, mercato chiave per dimensione e opportunità. L’arrivo di un manager con profonda esperienza...

2026-06-26 READ_MORE >

Altro

LLM on-premise: il workflow che vorresti aver scoperto prima

Un thread su Reddit chiede quale flusso di lavoro per LLM locali abbia fatto la differenza. Emerge che il valore non sta nei modelli ma nelle...

2026-06-26 READ_MORE >

Market

OpenAI sforna Jalapeño: custom chip con Broadcom, cresce la corsa contro la dipendenza da Nvidia

OpenAI entra nella mischia dei chip custom con Jalapeño, sviluppato con Broadcom per l'inference. Apple, Google e SpaceX avevano già aperto la...

2026-06-26 READ_MORE >

Hardware

Perché vendere la 5090 per cinque 5060 Ti da 16 GB? L’AI rig fai-da-te sotto la lente

Un utente valuta di cedere la propria RTX 5090 per acquistare cinque RTX 5060 Ti da 16 GB e costruire un rig aperto con cavi riser PCIe 4.0. La...

2026-06-26 READ_MORE >

Altro

Quando la Casa Bianca interviene sull'AI: il caso OpenAI e la lezione per chi fa impresa

La Casa Bianca ha chiesto a OpenAI di posticipare il lancio dei suoi modelli GPT-5.6, poco dopo che Anthropic ha dovuto ritirare i propri modelli...

2026-06-26 READ_MORE >

LLM

GPT-5.6 Sol: il nuovo modello OpenAI alza l'asticella per chi valuta l'on-premise

L'ultima preview di OpenAI mostra progressi in coding, scienza e sicurezza, ma resta un servizio cloud: per chi punta alla sovranità dei dati il...

2026-06-26 READ_MORE >

Hardware

OpenAI presenta Jalapeño: il chip custom che riduce la dipendenza da Nvidia

OpenAI ha annunciato Jalapeño, un chip custom per l'inference sviluppato con Broadcom, entrando nel club delle big tech che cercano di ridurre la...

2026-06-26 READ_MORE >

Hardware per LLM Locali