Hardware per LLM Locali
Benchmark, guide alle GPU e build workstation per la sovranità dei dati.
USA sblocca Mythos 5 di Anthropic per una cerchia ristretta di difensori informatici
Il Dipartimento del Commercio autorizza Anthropic a ripristinare l’accesso a Mythos 5, il modello di cybersecurity più potente dell’azienda, solo...
Meno sincronizzazioni CUDA in llama.cpp: guadagni prestazionali per l'inference on-prem
Un nuovo commit nel progetto llama.cpp reintroduce una gestione asincrona più aggressiva per i backend CUDA, riducendo le sincronizzazioni tra...
Chip AI: la strozzatura logistica minaccia i piani on-premise
La domanda di acceleratori per AI sta congestionando le spedizioni aeree e marittime, facendo lievitare i costi di trasporto. Per le aziende che...
SYM: utili in calo nel 2025 nonostante la quota di mercato record
Il produttore taiwanese di motocicli ha registrato un calo degli utili nel 2025, pur avendo raggiunto la quota di mercato più alta di sempre. Un...
JCET investe 1,1 miliardi: la svolta cinese per i chip AI passa dal packaging
L’espansione da 1,1 miliardi di dollari di JCET nel packaging avanzato indica la strategia cinese per superare le restrizioni sui semiconduttori e...
Fine-tuning Qwen: perché i modelli ottimizzati faticano a convincere
Nonostante la popolarità del fine-tuning sui modelli Qwen, mancano riscontri concreti su versioni realmente superiori alla base. Un’indagine sulle...
DeepSeek V4 Flash e MiniMax M3 su llama.cpp: a che punto è il supporto nativo?
La community attende l'integrazione ufficiale dei modelli DeepSeek V4 Flash e MiniMax M3 in llama.cpp. Le fork offrono soluzioni parziali, ma lo...
DeepSeek-V4-Pro-DSpark: il nuovo LLM open source che guarda al deployment locale
DeepSeek pubblica su Hugging Face il modello V4-Pro-DSpark e il paper tecnico DSpark. Un rilascio che alimenta la strategia di chi punta su LLM...
Ornith-1.0-35B Q3_K_M: 17 GB di VRAM e benchmark verde, la quantization estrema regge
Il modello Ornith-1.0-35B è stato quantizzato a Q3_K_M, scendendo a 16.8 GB su disco e ~17 GiB di VRAM caricata. Verificato con metriche KL...
Distillare LLM in proprio per il theorem proving: quando lo stack on-premise batte il cloud
Un utente con fondi per hardware ma non per crediti cloud vuole distillare un LLM per theorem proving su Rocq, dove i modelli scarseggiano. La via...
Wiwynn e TE Connectivity raffreddano a liquido le sbarre DC a 800V per i datacenter AI
Al booth di Wiwynn abbiamo visto le nuove sbarre DC a 800V di TE Connectivity con raffreddamento a liquido integrato. Un segnale di come...
Mythos 5 di Anthropic autorizzato a oltre 100 enti USA: svolta per l'AI sovrana?
L’amministrazione Trump ha concesso a più di 100 aziende e agenzie governative l’uso di Mythos 5 di Anthropic, estendendo i permessi anche ai...
Anthropic può rilasciare Mythos a organizzazioni USA: il via libera della Casa Bianca
Dopo settimane di negoziati, la Casa Bianca ha autorizzato Anthropic a ripristinare l'accesso al suo modello più avanzato, Mythos, per un gruppo...
La Corea del Sud addestra tutto l'esercito con i droni: l'AI sul campo impone l'inference locale
Seul punta a rendere i droni uno strumento universale per l’intero esercito, guidata dagli insegnamenti del conflitto ucraino. Una mossa che...
llama.cpp: il tensor parallelism su Vulkan ora è alla portata di tutti
La pull request #25051 firmata da Piotr ‘pwilkin’ rende finalmente utilizzabile il parallelismo tensore su backend Vulkan in llama.cpp. Un passo...
Nemotron-3-Super: 504K token di contesto perfetti su quattro RTX 3090
Il modello ibrido Mamba+MoE di NVIDIA, quantizzato a 71 GB, gira interamente su GPU consumer e mantiene un recupero esatto di informazioni fino a...
Un veterano del software costruisce un harness locale per LLM e chiede alla community: cosa serve?
Un developer con 45 anni di esperienza in tooling enterprise sta per rilasciare un harness open source pensato per semplificare il deployment...
Ford riassume 350 ingegneri: l’AI da sola non garantiva la qualità
Il colosso dell’auto ammette di aver sovrastimato le capacità dell’intelligenza artificiale nel controllo qualità, richiamando centinaia di...
Microsoft ha costruito un supercomputer per aiutare OpenAI a violare il copyright, accusa il NYT
Il New York Times modifica la denuncia: Microsoft avrebbe costruito un supercalcolatore su misura per favorire le violazioni di copyright di...
Zettabyte chiede uno standard per la qualità del calcolo AI, mentre la domanda esplode
L'azienda Zettabyte sollecita un nuovo standard per valutare la qualità del calcolo nell'intelligenza artificiale, in un momento in cui la...
DrayTek scivola nei ricavi fino al 2026, la scommessa è su Wi-Fi 7 e cybersecurity
Il produttore taiwanese di apparati di rete affronta un calo del fatturato che si prolungherà fino al 2026. Per invertire la rotta punta sullo...
Intel prepara il supporto HDR per configurazioni DP MST su Linux
Il driver grafico Intel per il kernel Linux si prepara a colmare un vuoto: l'impossibilità di utilizzare l'HDR su connessioni DisplayPort...
OpenAI frena il rilascio di GPT-5.6 su richiesta governativa: 'Non deve diventare la norma'
OpenAI ha limitato la distribuzione di GPT-5.6 su richiesta di un governo, scatenando un dibattito sulla sovranità digitale e l’accesso agli LLM....
OpenAI ingaggia l’ex capo di Uber India per guidare la sua espansione fuori dagli USA
La mossa rafforza la presenza di OpenAI in India, mercato chiave per dimensione e opportunità. L’arrivo di un manager con profonda esperienza...
LLM on-premise: il workflow che vorresti aver scoperto prima
Un thread su Reddit chiede quale flusso di lavoro per LLM locali abbia fatto la differenza. Emerge che il valore non sta nei modelli ma nelle...
OpenAI sforna Jalapeño: custom chip con Broadcom, cresce la corsa contro la dipendenza da Nvidia
OpenAI entra nella mischia dei chip custom con Jalapeño, sviluppato con Broadcom per l'inference. Apple, Google e SpaceX avevano già aperto la...
Perché vendere la 5090 per cinque 5060 Ti da 16 GB? L’AI rig fai-da-te sotto la lente
Un utente valuta di cedere la propria RTX 5090 per acquistare cinque RTX 5060 Ti da 16 GB e costruire un rig aperto con cavi riser PCIe 4.0. La...
Quando la Casa Bianca interviene sull'AI: il caso OpenAI e la lezione per chi fa impresa
La Casa Bianca ha chiesto a OpenAI di posticipare il lancio dei suoi modelli GPT-5.6, poco dopo che Anthropic ha dovuto ritirare i propri modelli...
GPT-5.6 Sol: il nuovo modello OpenAI alza l'asticella per chi valuta l'on-premise
L'ultima preview di OpenAI mostra progressi in coding, scienza e sicurezza, ma resta un servizio cloud: per chi punta alla sovranità dei dati il...
OpenAI presenta Jalapeño: il chip custom che riduce la dipendenza da Nvidia
OpenAI ha annunciato Jalapeño, un chip custom per l'inference sviluppato con Broadcom, entrando nel club delle big tech che cercano di ridurre la...
Cerchi notizie generali sull'AI?
< AI-RADAR MAIN