Topic / Trend Rising

AI On-Premise e Sovranità dei Dati

Si osserva una crescente tendenza all'implementazione di Large Language Models (LLM) e altre soluzioni AI on-premise o localmente. Ciò è motivato dalla necessità di un maggiore controllo sui dati, privacy, conformità e ottimizzazione dei costi, favorendo l'innovazione nell'hardware e nell'ottimizzazione del software locali.

Detected: 2026-04-22 · Updated: 2026-05-21

Articoli Correlati

2026-05-20 DigiTimes

LLM On-Premise: Sfide e Opportunità per il Controllo dei Dati Aziendali

L'adozione di Large Language Models (LLM) in azienda solleva questioni cruciali su sovranità dei dati, costi e performance. Questo articolo esplora i requisiti infrastrutturali e le considerazioni strategiche per il deployment on-premise di LLM, anal...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-20 LocalLLaMA

Qwen: in arrivo un nuovo LLM da 27 miliardi di parametri

Indiscrezioni suggeriscono che Qwen, un attore emergente nel panorama dei Large Language Models, si stia preparando a rilasciare un nuovo modello da 27 miliardi di parametri. L'annuncio ufficiale e la roadmap dettagliata sono attesi, ma la notizia so...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-20 LocalLLaMA

L'Attesa per i Nuovi LLM di Qwen: Implicazioni per il Deployment On-Premise

La community tech attende con interesse i prossimi Large Language Models di Qwen, in particolare le versioni da 27B e 122B parametri. Questa anticipazione evidenzia la crescente domanda di soluzioni LLM self-hosted, ponendo l'accento sulle sfide infr...

#Hardware #LLM On-Premise #DevOps
2026-05-20 The Next Web

Oltre il Cloud: Le Strategie On-Premise Riconquistano la Fiducia nell'AI

L'adozione di Large Language Models (LLM) sta spingendo le aziende a riconsiderare le strategie di deployment. Mentre il cloud ha dominato, un crescente interesse per le soluzioni on-premise emerge, spinto dalla necessità di sovranità dei dati, contr...

#Hardware #LLM On-Premise #DevOps
2026-05-20 LocalLLaMA

Gemma 4 MTP su `llama.cpp`: un'integrazione in divenire per LLM on-premise

Un nuovo pull request su `llama.cpp` introduce il supporto sperimentale per Gemma 4 MTP, segnando un passo avanti per il deployment locale di Large Language Models. Sebbene il progetto sia ancora in fase di sviluppo e richieda la compilazione manuale...

#Hardware #LLM On-Premise #DevOps
2026-05-20 ArXiv cs.AI

AI Documentale in Produzione: L'Architettura a Microservizi per OCR e LLM

Un'architettura a microservizi affronta le sfide di deployment degli LLM per l'analisi documentale. Il sistema, che gestisce migliaia di documenti multi-pagina all'ora, rivela che l'OCR domina la latenza end-to-end e la saturazione è dettata dalla ca...

#Hardware #LLM On-Premise #DevOps
2026-05-20 LocalLLaMA

LM Studio introduce il supporto per MTP Speculative Decoding

LM Studio, una piattaforma consolidata per l'esecuzione locale di Large Language Models, ha integrato il supporto per MTP Speculative Decoding. Questa novità, che richiede l'aggiornamento alla versione 0.4.14 Build 2 (Beta) e al motore llama.cpp 2.15...

#Hardware #LLM On-Premise #DevOps
2026-05-20 LocalLLaMA

VRAM e LLM on-premise: la soglia dei 48GB e le sfide del deployment locale

Un utente ha espresso l'intenzione di aggiornare la propria VRAM da 32GB a 48GB per carichi di lavoro LLM locali. Questa mossa evidenzia l'importanza della memoria video per il deployment on-premise di Large Language Models, dove la capacità hardware...

#Hardware #LLM On-Premise #DevOps
2026-05-19 The Next Web

Discord introduce la crittografia end-to-end per chiamate vocali e video

Discord ha attivato la crittografia end-to-end per tutte le chiamate vocali e video sulla sua piattaforma. Questa implementazione, ora predefinita, assicura che neppure l'azienda stessa possa accedere ai contenuti delle conversazioni dei suoi centina...

#LLM On-Premise #DevOps
2026-05-19 LocalLLaMA

LLM on-premise e sicurezza: il rischio `rm -rf /` e la soluzione sandbox

Un incidente nella comunità `r/LocalLLaMA` ha evidenziato i rischi di sicurezza nei deployment di LLM self-hosted. Un agente ha tentato di eseguire il comando `rm -rf /`, ma un sistema di blocco ha prevenuto il disastro. L'episodio sottolinea l'impor...

#Hardware #LLM On-Premise #DevOps
2026-05-19 LocalLLaMA

`llama.cpp` si aggiorna: ottimizzazioni MTP per l'inference locale di LLM

Un recente pull request per `llama.cpp` introduce miglioramenti significativi nelle prestazioni Multi-Threaded Processing (MTP). Questo aggiornamento è cruciale per le organizzazioni che implementano Large Language Models on-premise, consentendo un'i...

#Hardware #LLM On-Premise #DevOps
2026-05-19 LocalLLaMA

Agenti Secondari su Hardware Locale: Ottimizzazione LLM con VRAM Limitata

Un utente ha sviluppato una soluzione self-hosted per eseguire agenti secondari di Large Language Models (LLM) su hardware con VRAM limitata (10GB), superando le restrizioni delle implementazioni esistenti. Utilizzando un fork personalizzato e `llama...

#Hardware #LLM On-Premise #DevOps
2026-05-19 DigiTimes

AEM: materiali avanzati per semiconduttori e AI, un focus sull'on-premise

AEM, azienda specializzata in materiali, ha avviato la campionatura di film anti-deformazione e materiali PTFE, mirando ai settori dei semiconduttori e dell'intelligenza artificiale. Questa mossa sottolinea l'importanza dei materiali di base per la p...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-19 ArXiv cs.AI

AgentWall: Sicurezza e Controllo Runtime per Agenti AI Locali

AgentWall introduce un livello di sicurezza e osservabilità per gli agenti AI autonomi eseguiti in ambienti locali. Affronta il rischio di azioni non sicure o manipolate, intercettando le operazioni prima che raggiungano l'ambiente host. Il sistema v...

#LLM On-Premise #DevOps
2026-05-19 ServeTheHome

Dell Tech World 2026: L'AI Sovrana e On-Premise al Centro della Strategia

Al Dell Tech World 2026, l'azienda ha posto l'accento sull'intelligenza artificiale sovrana e sui deployment on-premise. Questa strategia, sviluppata in collaborazione con NVIDIA, mira a fornire nuovi ecosistemi AI per ambienti client e server, rispo...

#Hardware #LLM On-Premise #DevOps
2026-05-19 DigiTimes

Supply chain tech: carenze e capacità, un monito per l'AI on-premise

Il recente ritorno delle fotocamere digitali ha messo in luce criticità nella supply chain ottica, evidenziando una carenza di talenti e capacità produttive. Questo fenomeno, sebbene specifico, solleva interrogativi più ampi sulle vulnerabilità delle...

#Hardware #LLM On-Premise #DevOps
2026-05-18 The Next Web

Il costo degli LLM su cloud: 1,3 milioni di dollari per un mese di API OpenAI

Un caso studio emblematico evidenzia i costi significativi dell'inference LLM su larga scala tramite API cloud. Peter Steinberger, creatore di OpenClaw, ha sostenuto una spesa di 1,3 milioni di dollari in un solo mese per l'utilizzo delle API OpenAI,...

#Hardware #LLM On-Premise #DevOps
2026-05-18 OpenAI Blog

OpenAI e Dell: Codex arriva in azienda con deployment ibrido e on-premise

OpenAI e Dell hanno annunciato una partnership strategica per estendere la disponibilità di Codex, il modello di OpenAI per la generazione di codice, agli ambienti aziendali ibridi e on-premise. L'obiettivo è consentire alle imprese di implementare a...

#Hardware #LLM On-Premise #DevOps
2026-05-18 PyTorch Blog

ExecuTorch e MLX: l'accelerazione GPU per i modelli PyTorch su Apple Silicon

Il nuovo delegate MLX di ExecuTorch abilita l'Inference GPU-accelerata e ottimizzata per i modelli PyTorch sui Mac con Apple Silicon, sfruttando il framework MLX di Apple. Questa integrazione offre un throughput 3-6x superiore rispetto alle soluzioni...

#Hardware #LLM On-Premise #DevOps
2026-05-18 LocalLLaMA

Qwen 3.7 debutta su Qwen Chat: un nuovo modello per i deployment locali

Il rilascio di Qwen 3.7 su Qwen Chat segna un'ulteriore espansione nel panorama dei Large Language Models. Questa disponibilità offre nuove opportunità per le aziende che valutano strategie di deployment on-premise, ponendo l'accento sulla sovranità ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-18 LocalLLaMA

Nuovi modelli BitNet: efficienza per deployment on-premise

Sono stati rilasciati su Hugging Face i nuovi modelli BitCPM4-CANN da 1B, 3B e 8B di parametri, basati sull'architettura BitNet. Questi Large Language Models (LLM) a bassa precisione promettono un'efficienza notevole, riducendo i requisiti di VRAM e ...

#Hardware #LLM On-Premise #DevOps
2026-05-18 The Next Web

Polo AI da 4.000 acri nelle Filippine: tra sviluppo e sovranità dei dati

Stati Uniti e Filippine stanno accelerando la creazione di un vasto polo per l'intelligenza artificiale e le catene di approvvigionamento a New Clark City. Il progetto, esteso su 4.000 acri, solleva interrogativi cruciali sulla sovranità dei dati e i...

#Hardware #LLM On-Premise #DevOps
2026-05-18 LocalLLaMA

Qwen 3.6 27B su GPU da 24 GB: un'analisi dei backend locali

Un'analisi approfondita esplora le configurazioni ottimali per eseguire il modello Qwen 3.6 27B su una singola GPU con 24 GB di VRAM, come la RTX 3090. Lo studio confronta diversi backend, tra cui `llama.cpp` e `ik_llama.cpp`, evidenziando le scelte ...

#Hardware #LLM On-Premise #DevOps
2026-05-18 LocalLLaMA

Il Futuro degli LLM Open-Weight: Tra Attesa e Nuove Dinamiche di Rilascio

La comunità degli Large Language Models (LLM) è in fermento, in attesa di nuove versioni dopo i recenti rilasci. Si specula su un possibile cambiamento nelle politiche di distribuzione dei modelli open-weight, con implicazioni significative per le st...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-18 DigiTimes

Taiwan: incentivi fiscali per i centri di calcolo AI e le sfide on-premise

Le aziende taiwanesi stanno cercando incentivi fiscali per la costruzione di centri di calcolo dedicati all'intelligenza artificiale. Questa mossa evidenzia la crescente domanda di infrastrutture robuste per supportare carichi di lavoro AI, in partic...

#LLM On-Premise #Fine-Tuning #DevOps
2026-05-17 LocalLLaMA

Qwen3.5 e WebGL: rendering fotorealistico in tempo reale con LLM locali

Un'implementazione basata su Qwen3.5-122B UD-Q3_K_XL dimostra la capacità di generare rendering fotorealistici di volti umani in tempo reale tramite WebGL. Questo approccio evidenzia il potenziale degli LLM altamente quantizzati per carichi di lavoro...

#Hardware #LLM On-Premise #DevOps
2026-05-17 Phoronix

Linux 7.1-rc4: Nuova documentazione per sicurezza e AI nel kernel

La recente release di Linux 7.1-rc4 introduce importanti aggiornamenti nel kernel, con un focus particolare su correzioni e l'integrazione di nuova documentazione. Quest'ultima si concentra su temi cruciali come la sicurezza e l'intelligenza artifici...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-17 TechCrunch AI

Siri e la privacy: Apple punta sull'eliminazione automatica delle chat

Apple si prepara a presentare una nuova versione di Siri, con la privacy al centro della strategia. Tra le novità attese, spicca la potenziale introduzione di funzionalità per l'eliminazione automatica delle chat, un passo significativo per rafforzar...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-17 LocalLLaMA

La speranza di un Gemma da 124B: implicazioni per il deployment on-premise

Un post su Reddit ha acceso il dibattito sulla possibilità di avere LLM di grandi dimensioni, come un ipotetico Gemma da 124 miliardi di parametri, disponibili per il deployment self-hosted. Questa prospettiva solleva questioni cruciali riguardo ai r...

#Hardware #LLM On-Premise #DevOps
2026-05-17 LocalLLaMA

Quantization KV Cache per LLM on-premise: bilanciare VRAM e qualità

Un dibattito tra sviluppatori evidenzia la sfida di ottimizzare l'uso della VRAM per i Large Language Models (LLM) in deployment on-premise. La questione centrale riguarda la quantization del KV cache (Q4_0 vs Q8_0) e il suo impatto sulla qualità del...

#Hardware #LLM On-Premise #DevOps
2026-05-17 The Next Web

LLM On-Premise: Controllo, Costi e Sovranità dei Dati nell'Era dell'AI

L'adozione di Large Language Models (LLM) on-premise sta guadagnando terreno tra le aziende, spinte dalla necessità di maggiore controllo sui dati, compliance normativa e ottimizzazione del Total Cost of Ownership (TCO). Questo approccio self-hosted ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-17 LocalLLaMA

llama.cpp: Nuove Vette di Performance con Dual GPU e KV Cache Quantizzato

Un nuovo fork di llama.cpp risolve un problema di lunga data con il tensor parallelism, permettendo l'uso di KV cache quantizzati su configurazioni dual GPU. Questo porta a un incremento di oltre il 40% nelle prestazioni per l'inference di LLM, come ...

#Hardware #LLM On-Premise #DevOps
2026-05-17 Tom's Hardware

Costi LLM: OpenClaw spende 1,3 milioni di dollari in un mese per API OpenAI

Il caso OpenClaw evidenzia i costi elevati dell'utilizzo intensivo di Large Language Models tramite API cloud. In un solo mese, il progetto ha sostenuto una spesa di 1,3 milioni di dollari per 603 miliardi di token e 7,6 milioni di richieste, gestite...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-17 LocalLLaMA

Ottimizzazione LLM on-premise: Llama.cpp e MTP su RTX 3090

Un'analisi pratica rivela come l'implementazione di Multi-GPU Tensor Parallelism (MTP) in llama.cpp possa migliorare significativamente i tempi di completamento per carichi di lavoro LLM con contesti ampi su una singola GPU NVIDIA RTX 3090. Nonostant...

#Hardware #LLM On-Premise #DevOps
2026-05-17 LocalLLaMA

G4-Meromero-31B-Uncensored-Heretic: un LLM per compiti creativi

È stato rilasciato G4-Meromero-31B-Uncensored-Heretic, un LLM basato su Gemma 4 31B e ottimizzato per compiti creativi. Il modello, disponibile nei formati Safetensors e GGUF, presenta un basso tasso di rifiuto (15/100) e un KLD di 0.0100, suggerendo...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-16 LocalLLaMA

llama.cpp: la versione b9180 rafforza l'inference LLM on-premise

La community di `llama.cpp` celebra il rilascio della versione `b9180`, un aggiornamento che introduce una nuova funzionalità identificata come "MTP". Questo sviluppo è particolarmente rilevante per gli specialisti che gestiscono Large Language Model...

#Hardware #LLM On-Premise #DevOps
2026-05-16 LocalLLaMA

Supporto MTP integrato in llama.cpp: un passo avanti per l'inference locale

Il progetto Open Source llama.cpp ha integrato il supporto per MTP (Media Transfer Protocol) attraverso la Pull Request #22673. Questo sviluppo rafforza la capacità del Framework di eseguire Large Language Models in modo efficiente su un'ampia gamma ...

#Hardware #LLM On-Premise #DevOps
2026-05-16 OpenAI Blog

Malta e OpenAI: un partenariato per l'accesso all'AI e la sovranità dei dati

Malta e OpenAI hanno siglato una collaborazione per estendere l'accesso all'intelligenza artificiale a tutti i cittadini. L'iniziativa prevede la fornitura di abbonamenti a ChatGPT Plus e programmi di formazione, con l'obiettivo di sviluppare compete...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-16 Wired AI

LLM per l'Intimità Digitale: Sovranità dei Dati e Deployment On-Premise

L'emergere di Large Language Models (LLM) come compagni per interazioni intime e personalizzate solleva questioni cruciali sulla sovranità dei dati e sul controllo. Questo scenario evidenzia la necessità per le aziende di valutare attentamente le opz...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-15 LocalLLaMA

Agenti AI e Orchestrazione: La Sfida del Deployment Locale

L'interesse per gli agenti AI autonomi cresce, spingendo le organizzazioni a esplorare soluzioni di orchestrazione per carichi di lavoro complessi. Un recente spunto dalla community evidenzia la necessità di strumenti aggiuntivi per sfruttare al megl...

#Hardware #LLM On-Premise #DevOps
2026-05-15 LocalLLaMA

Ottimizzare l'Inference LLM: il 'Sweet Spot' di efficienza per 4x RTX 3090

Un'analisi dettagliata esplora l'efficienza energetica di una configurazione on-premise con quattro GPU NVIDIA RTX 3090 per l'inference di Large Language Models. I test rivelano un punto di massima efficienza a 220W per GPU, bilanciando throughput e ...

#Hardware #LLM On-Premise #DevOps
2026-05-15 404 Media

Piattaforme Dati e Sovranità: Il Caso Palantir e le Implicazioni On-Premise

Un'indagine giornalistica rivela l'uso della piattaforma Palantir da parte di ICE per l'identificazione di individui, sollevando interrogativi sulla veridicità delle dichiarazioni ufficiali. L'episodio evidenzia l'importanza cruciale della sovranità ...

#Hardware #LLM On-Premise #DevOps
2026-05-15 LocalLLaMA

Multi-Tensor Parallelism in llama.cpp: LLM più grandi su GPU distribuite

Il progetto open source llama.cpp ha integrato il Multi-Tensor Parallelism (MTP), una funzionalità che consente di eseguire Large Language Models di grandi dimensioni, come quelli da 70B o 120B parametri, distribuendo i loro tensor su più GPU. Questa...

#Hardware #LLM On-Premise #DevOps
2026-05-15 TechCrunch AI

Osaurus porta l'AI ibrida su Mac, tra modelli locali e cloud

Osaurus è una nuova applicazione per Mac che integra modelli di intelligenza artificiale sia locali che basati su cloud. La soluzione mira a offrire agli utenti il meglio di entrambi i mondi, garantendo che dati sensibili come memoria, file e strumen...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-15 Tom's Hardware

L'AI al limite: sfide e opportunità del deployment su hardware locale

Il deployment di modelli di intelligenza artificiale, inclusi i Large Language Models (LLM), non è più confinato ai data center cloud. Cresce l'interesse per l'esecuzione di carichi di lavoro AI su hardware locale o edge, spinto da esigenze di sovran...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-15 DigiTimes

La Spinta all'On-Premise per i Large Language Models: Controllo e TCO

Le aziende valutano sempre più il deployment on-premise di LLM per ragioni di sovranità dei dati, controllo sui costi operativi e ottimizzazione delle performance. Questa transizione richiede un'attenta analisi dell'infrastruttura hardware e software...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-15 LocalLLaMA

Un LLM on-premise si auto-corregge: il caso Qwen3.627B e `rm -rf`

Un utente ha raccontato come il suo agente di coding, basato sul modello Qwen3.627B e in esecuzione su un sistema locale, abbia autonomamente eseguito il comando `rm -rf` per liberare spazio su disco. L'azione, sebbene rischiosa, ha risolto un proble...

#Hardware #LLM On-Premise #DevOps
2026-05-15 LocalLLaMA

GPU moddate dalla Cina: la ricerca di VRAM extra per LLM on-premise

Nel panorama dell'AI on-premise, emerge un interesse crescente per le GPU modificate provenienti dalla Cina, come le varianti della RTX 4090 con 48GB di VRAM. Nonostante l'attrattiva di una maggiore memoria per i Large Language Models, la carenza di ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-15 LocalLLaMA

MiniMax M2.7: Un LLM "Uncensored" per Deployment On-Premise

Il modello MiniMax M2.7, etichettato come "ultra uncensored heretic", è stato rilasciato da llmfan46. Disponibile nei formati BF16 e GGUF, presenta un tasso di rifiuto del 4% e un valore di divergenza KL di 0.0452. La sua disponibilità in GGUF lo ren...

#Hardware #LLM On-Premise #DevOps
2026-05-14 LocalLLaMA

Quantization del KV-cache per LLM: uno studio compara FP8 e TurboQuant

Un recente studio ha esaminato diverse tecniche di quantization per il KV-cache degli LLM, confrontando FP8 e le varianti di TurboQuant. I risultati indicano che FP8 offre un raddoppio della capacità del KV-cache con minima perdita di accuratezza e b...

#Hardware #LLM On-Premise #DevOps
2026-05-14 LocalLLaMA

MLX e la Quantization: ottimizzare Nemotron-8B per Apple Silicon

Un developer ha convertito il modello di embedding `nvidia/llama-embed-nemotron-8b` in diverse versioni quantizzate (da `fp16` a `2-bit`) utilizzando il framework MLX di Apple. Questa iniziativa mira a ottimizzare l'esecuzione del modello su hardware...

#Hardware #LLM On-Premise #DevOps
2026-05-14 LocalLLaMA

VS Code: la "Agents window" abilita LLM locali, ma con dipendenze cloud

La nuova "Agents window" di VS Code introduce il supporto per l'esecuzione di Large Language Models (LLM) in locale, offrendo un potenziale per maggiore controllo sui dati. Tuttavia, questa funzionalità richiede ancora una connessione a Internet e un...

#LLM On-Premise #DevOps
2026-05-14 MIT Technology Review

Sovranità dei dati e dell'AI: le aziende riprendono il controllo

Le imprese stanno riconsiderando il loro approccio all'AI generativa, passando da un modello di "capacità subito, controllo dopo" a una strategia che privilegia la sovranità dei dati e dei modelli. La crescente preoccupazione per la perdita di propri...

#Hardware #LLM On-Premise #DevOps
2026-05-14 DigiTimes

Semiconduttori: la forza lavoro in Asia e le sfide per l'AI on-premise

Le recenti tensioni lavorative in Samsung mettono in luce le diverse dinamiche della forza lavoro nel settore dei semiconduttori tra Taiwan e Corea del Sud. Queste differenze influenzano la stabilità della catena di fornitura globale, con ripercussio...

#Hardware #LLM On-Premise #DevOps
2026-05-14 LocalLLaMA

Qwen su LLaMA.cpp: MTP e TurboQuant accelerano l'Inference locale

Una recente implementazione ha introdotto la Multi-Token Prediction (MTP) per i modelli Qwen su LLaMA.cpp, integrando TurboQuant. Questo sviluppo ha portato a un aumento del 40% nelle performance di inference, raggiungendo 34 token/s su un MacBook Pr...

#Hardware #LLM On-Premise #DevOps
2026-05-14 LocalLLaMA

AI on-premise: un setup con due RTX 3090 sfida le performance cloud

Un utente ha dimostrato la crescente fattibilità dei Large Language Models (LLM) eseguiti localmente, ottenendo prestazioni notevoli con un setup "budget" basato su due GPU Nvidia RTX 3090 e 48 GB di VRAM. Il progetto "club-3090" ha permesso di super...

#Hardware #LLM On-Premise #DevOps
2026-05-14 DigiTimes

Taiwan punta al mercato spot per l'energia verde: impatto sull'AI on-premise

Taiwan sta pianificando l'introduzione di un mercato spot per l'energia verde entro il 2027. L'obiettivo è gestire l'eccesso di produzione da fonti rinnovabili. Questa iniziativa, sebbene focalizzata sul settore energetico, può avere implicazioni sig...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-13 LocalLLaMA

LLM MoE su hardware datato: 24 tok/s con una GTX 1080 e 8 GB VRAM

Un recente esperimento dimostra la capacità di eseguire Large Language Models (LLM) basati su architettura Mixture of Experts (MoE) su hardware consumer datato, come una GTX 1080 con soli 8 GB di VRAM. Utilizzando ottimizzazioni software come `llama....

#Hardware #LLM On-Premise #DevOps
2026-05-13 LocalLLaMA

MI50s e Qwen 3.6 27B: Performance LLM On-Premise su Hardware Datato

Un recente benchmark dimostra come le GPU AMD MI50s del 2018 possano gestire l'Inference del modello Qwen 3.6 27B con prestazioni notevoli. I test, condotti senza Quantization e con Tensor Parallelism, evidenziano un throughput di 52.8 token al secon...

#Hardware #LLM On-Premise #DevOps
2026-05-13 LocalLLaMA

llama.cpp: Docker e modelli MTP per l'inference LLM on-premise

Nuove immagini Docker per llama.cpp semplificano il deployment di modelli Multi-Token Prediction (MTP) su infrastrutture locali. La community ha rilasciato versioni compatibili con diverse architetture hardware, da CUDA a ROCm, affrontando le sfide d...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-13 LocalLLaMA

Ovis2.6-80B-A3B: L'efficienza MoE per LLM multimodali on-premise

AIDC-AI presenta Ovis2.6-80B-A3B, un MLLM con architettura Mixture-of-Experts (MoE) che combina 80 miliardi di parametri totali con soli ~3 miliardi attivi in inference. Questa configurazione promette prestazioni multimodali superiori, costi di servi...

#Hardware #LLM On-Premise #DevOps
2026-05-13 The Next Web

La dipendenza europea dal cloud: implicazioni per la sovranità AI e dei dati

L'Europa affronta una crescente dipendenza da fornitori esterni di servizi cloud e semiconduttori, un fattore che espone la sua sovranità in ambito AI e dei dati. Questa situazione genera rischi politici significativi, evidenziando la necessità di st...

#Hardware #LLM On-Premise #DevOps
2026-05-13 LocalLLaMA

LLM Locali: Oltre la Teoria, Applicazioni Pratiche per l'Enterprise

Un'analisi approfondita rivela come i Large Language Models (LLM) self-hosted stiano trovando applicazioni concrete e di valore in contesti aziendali. Dalla gestione della memoria semantica con modelli di embedding a complessi workflow di automazione...

#Hardware #LLM On-Premise #DevOps
2026-05-13 DigiTimes

Investimenti industriali e il ruolo strategico dell'AI on-premise

L'espansione da 250 milioni di dollari di Tesla per la produzione di batterie a Berlino evidenzia la crescita degli investimenti nel settore manifatturiero. Questo scenario solleva interrogativi cruciali sul deployment di soluzioni AI per l'ottimizza...

#Hardware #LLM On-Premise #DevOps
2026-05-13 DigiTimes

Dinamiche di mercato negli LLM on-premise: sovranità dei dati e TCO

Il panorama dei Large Language Models (LLM) sta assistendo a un crescente interesse per i deployment on-premise. Le aziende cercano maggiore controllo sui dati e ottimizzazione del Total Cost of Ownership (TCO), spingendo verso soluzioni locali che b...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-12 LocalLLaMA

vLLM su AMD per LLM on-premise: efficienza per l'uso singolo?

L'adozione di Large Language Models (LLM) in ambienti self-hosted pone interrogativi sulla scelta del framework di inference. Un utente con GPU AMD si interroga sull'effettiva convenienza di vLLM, noto per il suo throughput elevato in scenari multi-u...

#Hardware #LLM On-Premise #DevOps
2026-05-12 Tom's Hardware

La sfida del PC silenzioso: implicazioni per l'hardware AI on-premise

La gestione del rumore nei sistemi informatici ad alte prestazioni, come quelli impiegati per i carichi di lavoro AI, rappresenta una sfida complessa. Componenti quali case, ventole e sistemi di raffreddamento a liquido All-in-One (AIO) sono cruciali...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-12 LocalLLaMA

LLM on-premise: ottimizzare i consumi GPU senza intaccare le performance

Un caso studio su Reddit dimostra come sia possibile ridurre il consumo energetico di una GPU RTX 4090 fino al 40% del suo limite massimo durante l'Inference di LLM con `llama.cpp`, senza sacrificare le performance. Questa ottimizzazione, ottenuta tr...

#Hardware #LLM On-Premise #DevOps
2026-05-02 LocalLLaMA

Qualità e Controllo: Le Nuove Regole di r/LocalLLaMA Migliorano il Dibattito

La community r/LocalLLaMA ha condotto un'analisi a una settimana dall'introduzione di nuove regole di moderazione. I risultati preliminari indicano un netto miglioramento nella qualità dei contenuti, con una significativa riduzione di spam e auto-pro...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-02 LocalLLaMA

Qwen 3.6-27B su RTX 6000 Pro: un LLM locale per lo sviluppo quotidiano

Un utente ha condiviso la sua esperienza nell'utilizzo di Qwen 3.6-27B, un Large Language Model quantizzato, come strumento di sviluppo quotidiano, eseguendolo localmente su una GPU RTX 6000 Pro. L'esperimento evidenzia i vantaggi del deployment on-p...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-01 The Next Web

Dalla Crisi di Hormuz alla Sovranità AI: Lezioni per i Deployment On-Premise

La chiusura dello Stretto di Hormuz e il conseguente impatto sui prezzi energetici hanno evidenziato la vulnerabilità delle catene di approvvigionamento globali. Questo evento sottolinea l'importanza della sovranità strategica e della resilienza, pri...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-01 MIT Technology Review

Fabbriche di AI e Sovranità del Dato: La Nuova Frontiera On-Premise

Le aziende stanno riprendendo il controllo dei propri dati per personalizzare l'AI, bilanciando proprietà e flusso sicuro di informazioni di qualità. Le "fabbriche di AI" emergono come soluzione per scalabilità, sostenibilità e governance, rendendo i...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-01 LocalLLaMA

Rilasciato Gemma-4-31B-it-DFlash: un nuovo LLM per deployment locali

È stato annunciato il rilascio di Gemma-4-31B-it-DFlash, una nuova variante del modello Gemma di Google, ottimizzata per la lingua italiana. La sua disponibilità su Hugging Face e l'integrazione in sospeso con il framework `llama.cpp` suggeriscono un...

#Hardware #LLM On-Premise #DevOps
2026-05-01 Tom's Hardware

Deployment LLM: il ritorno dell'on-premise tra controllo e sovranità dei dati

L'annuncio di nuove edizioni di hardware iconico, come il Commodore 64C, offre uno spunto per riflettere sul "ritorno" di approcci consolidati nel panorama tecnicico. Nel contesto dei Large Language Models, questo si traduce in una crescente attenzio...

#Hardware #LLM On-Premise #Fine-Tuning
2026-05-01 Phoronix

Intel potenzia il supporto driver per Crescent Island e l'AI enterprise

Intel sta sviluppando attivamente il supporto driver Linux per Crescent Island, la sua prossima scheda grafica Xe3P ottimizzata per l'inference AI in ambito enterprise. Con 160GB di VRAM, Crescent Island mira a soddisfare le esigenze di carichi di la...

#Hardware #LLM On-Premise #DevOps
2026-05-01 LocalLLaMA

NVIDIA Gemma 4-26B-A4B-NVFP4: Ottimizzazione e Performance On-Premise

NVIDIA ha rilasciato una versione quantizzata a 4 bit del modello Gemma 2B, denominata Gemma 4-26B-A4B-NVFP4, ottimizzata per l'inference su hardware locale. Con una dimensione di 18.8GB, il modello è stato testato su GPU con 32GB di VRAM, dimostrand...

#Hardware #LLM On-Premise #DevOps
2026-04-30 LocalLLaMA

AMD Halo Box: Un'occhiata al sistema demo con Ryzen 395 e 128GB di RAM

Un'unità dimostrativa AMD, denominata "Halo Box", è emersa online, mostrando un sistema equipaggiato con un processore Ryzen 395 e 128GB di memoria RAM. Questo dispositivo, che esegue Ubuntu e presenta una striscia luminosa programmabile, offre uno s...

#Hardware #LLM On-Premise #DevOps
2026-04-30 LocalLLaMA

Qwen3.6-27B su RTX 3090: contesto a 218K token e stabilità migliorata

Un team di sviluppatori ha raggiunto risultati significativi nell'esecuzione del Large Language Model Qwen3.6-27B su una singola GPU NVIDIA RTX 3090. L'ottimizzazione ha permesso di estendere la finestra di contesto fino a circa 218.000 token, garant...

#Hardware #LLM On-Premise #DevOps
2026-04-30 LocalLLaMA

AMD annuncia il "Ryzen 395 Box": una soluzione per LLM on-premise?

Durante l'AMD AI Dev Day, l'azienda ha svelato il "Ryzen 395 Box", un dispositivo che potrebbe mirare al deployment locale di Large Language Models. Previsto per giugno, il prodotto non ha ancora un prezzo ufficiale, ma si specula su una possibile co...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-30 TechCrunch AI

AI e sanità: le sfide normative per i deployment on-premise

BioticsAI, guidata dal CEO Robhy Bustami, opera nel settore sanitario, un ambiente altamente regolamentato. L'azienda affronta le complessità burocratiche e normative per implementare soluzioni AI. Questa discussione evidenzia le implicazioni per i d...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-30 LocalLLaMA

LLM locali: usi pratici e il valore del monitoraggio on-premise

Un utente Reddit ha condiviso un esempio concreto di utilizzo di LLM locali per generare sintesi da un sistema di sorveglianza. L'esperienza evidenzia come, anche in un contesto self-hosted, il consumo di token possa aumentare rapidamente. La gestion...

#Hardware #LLM On-Premise #DevOps
2026-04-29 LocalLLaMA

Modelli LLM Densi: La Sfida dell'Inference On-Premise per le Aziende

Il panorama dei Large Language Models (LLM) sta assistendo a una crescente preferenza per architetture più dense, come quelle proposte da Mistral AI. Questa tendenza, sebbene promettente per le capacità dei modelli, pone nuove sfide significative per...

#Hardware #LLM On-Premise #DevOps
2026-04-29 LocalLLaMA

Un supercluster DGX Spark da 16 unità: potenziale e sfide on-premise

Un utente ha condiviso i dettagli di un ambizioso progetto: assemblare un cluster di 16 unità DGX Spark in un laboratorio domestico, equipaggiato con 2 TB di memoria unificata e una rete ad alta velocità. L'iniziativa solleva interrogativi sulle pote...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-29 LocalLLaMA

llama.cpp: NVFP4 nativo accelera l'elaborazione dei prompt su Blackwell

Un recente benchmark su llama.cpp rivela che il supporto nativo per NVFP4 migliora significativamente le prestazioni di elaborazione dei prompt (fino al 68%) per il modello Qwen3.6-27B-NVFP4 su una GPU NVIDIA RTX 5090. La velocità di generazione dei ...

#Hardware #LLM On-Premise #DevOps
2026-04-29 LocalLLaMA

Qwen3.6 27B su doppia RTX 5060 Ti 16GB: analisi delle prestazioni on-premise

Un'analisi dettagliata esplora le capacità del modello Qwen3.6 27B su una configurazione locale basata su due GPU NVIDIA RTX 5060 Ti da 16GB. I test evidenziano prestazioni di circa 60-66 token al secondo e la gestione di un contesto esteso fino a 20...

#Hardware #LLM On-Premise #DevOps
2026-04-29 LocalLLaMA

Bolle AI e Prezzi GPU: Il Dilemma dell'Framework Locale

Il rapido sviluppo dell'intelligenza artificiale ha alimentato un'intensa domanda di GPU, ma un'ipotetica "bolla AI" potrebbe alterare radicalmente il mercato. L'articolo esplora due scenari contrapposti: un aumento dei prezzi delle GPU consumer per ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-29 LocalLLaMA

Qwen 3.6 e Gemma 4: l'efficienza degli LLM on-premise su singola GPU

L'esecuzione locale di Large Language Models come Qwen 3.6 e Gemma 4 sta dimostrando la sua efficacia in scenari lavorativi complessi. Un utente ha evidenziato come questi modelli, se supportati da hardware adeguato come una singola NVIDIA RTX 3090, ...

#Hardware #LLM On-Premise #DevOps
2026-04-29 LocalLLaMA

AMD e il potenziale dell'AI locale: un "computer" per l'inference domestica

La crescente capacità dell'hardware consumer, con attori come AMD, sta rendendo sempre più accessibile l'esecuzione di carichi di lavoro AI, inclusi i Large Language Models, direttamente su sistemi locali. Questo sviluppo apre nuove prospettive per l...

#Hardware #LLM On-Premise #DevOps
2026-04-29 LocalLLaMA

Hipfire: Validazione estesa delle architetture AMD per LLM on-premise

Il progetto Hipfire annuncia progressi significativi nella validazione delle architetture GPU AMD, dalle generazioni RDNA 1 fino a RDNA 4, inclusi i nuovi chip Strix Halo e R9700. L'iniziativa mira a ottimizzare le performance per i Large Language Mo...

#Hardware #LLM On-Premise #DevOps
2026-04-29 LocalLLaMA

Gemma 26B su sistemi locali: un'analisi delle implicazioni on-premise

Un utente della community LocalLLaMA ha condiviso l'esperienza di esecuzione del modello Gemma 26B su un sistema locale, identificato come "pi". Questo scenario evidenzia l'interesse crescente per il deployment di Large Language Models (LLM) direttam...

#Hardware #LLM On-Premise #DevOps
2026-04-29 DigiTimes

Espansione Globale e Supply Chain: Impatti sull'Framework AI On-Premise

L'espansione settoriale in regioni chiave, come quella dell'industria dei PCB in Thailandia, evidenzia la crescente importanza delle strategie di supply chain. Questo scenario offre spunti per le decisioni di deployment AI on-premise, dove la disponi...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-28 Anthropic News

Claude per il Lavoro Creativo: Implicazioni per il Deployment On-Premise

L'impiego di LLM come Claude per il lavoro creativo apre nuove prospettive, ma solleva questioni cruciali per le aziende che valutano soluzioni on-premise. L'articolo esplora i requisiti infrastrutturali, le considerazioni su sovranità dei dati e i t...

#Hardware #LLM On-Premise #DevOps
2026-04-28 Phoronix

AMD Lemonade SDK 10.3: un server AI locale 10 volte più compatto

AMD ha rilasciato la versione 10.3 del suo SDK Lemonade, un server AI locale open source. L'aggiornamento riduce le dimensioni del pacchetto di dieci volte grazie all'eliminazione di Electron, rendendolo più efficiente per i deployment on-premise. Le...

#Hardware #LLM On-Premise #DevOps
2026-04-28 LocalLLaMA

La saggezza della community: navigare il deployment di LLM on-premise

L'ecosistema dei Large Language Models (LLM) locali è in costante crescita, spinto dalla necessità di sovranità dei dati e controllo. Questo articolo esplora le considerazioni chiave per il deployment on-premise, dalle specifiche hardware alle strate...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-28 LocalLLaMA

LLM On-Premise: La Dualità di r/LocalLLaMA tra Controllo e Complessità

La community r/LocalLLaMA incarna la duplice natura dei Large Language Models (LLM) eseguiti in locale. Se da un lato offre controllo totale su dati e infrastruttura, garantendo sovranità e privacy, dall'altro presenta sfide significative legate all'...

#Hardware #LLM On-Premise #DevOps
2026-04-28 DigiTimes

Deployment On-Premise per LLM: Sfide, Opportunità e Sovranità dei Dati

L'adozione di Large Language Models (LLM) in ambito aziendale solleva questioni cruciali relative al deployment. Questo articolo esplora le considerazioni chiave per le organizzazioni che valutano soluzioni on-premise, analizzando i trade-off tra con...

#Hardware #LLM On-Premise #DevOps
2026-04-27 DigiTimes

Navigazione AI e Sovranità dei Dati: Le Implicazioni per le Aziende

L'analisi della navigazione basata su intelligenza artificiale evidenzia l'importanza cruciale del controllo sui dati. Per le aziende che adottano soluzioni AI, la gestione on-premise dei modelli e dei dati diventa un fattore determinante per garanti...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-27 ServeTheHome

Cluster AI da 8x NVIDIA GB10: Efficienza Energetica e Scaling On-Premise

Un nuovo cluster AI basato su otto unità NVIDIA GB10 dimostra come sia possibile ottenere capacità di scaling significative con un consumo energetico relativamente contenuto. Questa architettura evidenzia il potenziale delle soluzioni on-premise per ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-26 The Next Web

Sequoia e i Mac Mini: un impulso all'AI on-premise oltre gli investimenti

Sequoia Capital ha distribuito 200 Mac Mini personalizzati ai partecipanti dell'evento "AI at the Frontier". L'iniziativa, promossa da Alfred Lin, uno dei responsabili di Sequoia, mira a stimolare progetti AI che esulano dai tradizionali schemi di in...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-21 Tom's Hardware

Intel espande l'overclocking ai Core Ultra 200K Plus: implicazioni on-premise

Intel ha annunciato l'intenzione di estendere le capacità di overclocking a una gamma più ampia di processori per piattaforme future, inclusi i modelli Core Ultra 200K Plus. Questa mossa mira a democratizzare funzionalità tradizionalmente riservate a...

#Hardware #LLM On-Premise #DevOps
2026-04-21 The Register AI

Monitoraggio CPU: L'Eredità di Task Manager e le Sfide On-Premise

Il misuratore CPU del Task Manager, basato su semplici chiamate kernel, rappresenta un'epoca passata. Oggi, per i deployment on-premise di Large Language Models, è indispensabile un monitoraggio hardware granulare che vada oltre la CPU, includendo VR...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-21 DigiTimes

Dinamiche Geopolitiche e Autonomia Digitale: Il Ruolo del Self-Hosted AI

Le recenti misure geopolitiche e l'affermazione di obiettivi economici indipendenti, come riportato da DIGITIMES, sottolineano l'importanza della sovranità e del controllo. Questo contesto si riflette nel settore tecnicico, dove le aziende valutano s...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-21 DigiTimes

Collaborazione strategica per potenziare i deployment LLM on-premise

Esperti del settore sollecitano una maggiore collaborazione tra aziende, istituzioni e governi per accelerare lo sviluppo e l'adozione di infrastrutture LLM self-hosted. L'obiettivo è rafforzare la sovranità dei dati, ottimizzare il TCO e garantire u...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-21 Phoronix

AMD GAIA: agenti AI portatili per deployment locali

AMD potenzia GAIA, la sua soluzione software cross-platform basata su Lemonade SDK, per l'esecuzione di agenti AI locali su hardware AMD (CPU, GPU, NPU). L'ultimo aggiornamento introduce la portabilità degli agenti AI personalizzati, facilitando l'im...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-20 The Next Web

OpenAI Codex per Mac: la funzione Chronicle tra privacy e server remoti

OpenAI ha introdotto Chronicle, una funzione in anteprima di ricerca per Codex su Mac. Questa cattura periodicamente screenshot, li invia ai server di OpenAI per l'elaborazione e salva riassunti testuali locali non crittografati. L'obiettivo è fornir...

#LLM On-Premise #Fine-Tuning #DevOps
2026-04-20 The Next Web

Gestione Fornitori: Rischi di Terze Parti e Sovranità dei Dati nell'Era AI

Nel 2026, la gestione efficace dei fornitori si conferma un pilastro strategico per le aziende, con rischi di terze parti in costante aumento. Questo scenario evidenzia la necessità di un controllo rigoroso sui dati e sulle infrastrutture, un princip...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-20 404 Media

Controllo e Sovranità: Dal Giornalismo Indie al Deployment AI On-Premise

L'esperienza di Maddy Myers, caporedattrice di Mothership, nel fondare una pubblicazione indipendente focalizzata su genere e videogiochi, sottolinea il valore del controllo sulla propria piattaforma e sui contenuti. Questo principio di "possedere il...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-20 DigiTimes

Materiali ad alte prestazioni: un pilastro per l'AI on-premise

Le aziende tessili taiwanesi si espandono nei settori aerospaziale e dei droni, sfruttando materiali avanzati. Questa tendenza evidenzia l'importanza critica di tali innovazioni per lo sviluppo di hardware robusto e performante, fondamentale per le i...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-20 The Register AI

L'inflazione delle risorse AI: un costo strutturale per i deployment on-premise

L'aumento della domanda di risorse computazionali per l'intelligenza artificiale, in particolare per i Large Language Models, rappresenta un costo strutturale che impatta profondamente le strategie di deployment. Le organizzazioni che valutano soluzi...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-20 DigiTimes

Navigare la Volatilità: Strategie On-Premise per LLM tra Costi e Sovranità

In un panorama tecnicico ed economico in continua evoluzione, le aziende cercano stabilità e controllo per i propri carichi di lavoro AI. Questo articolo esplora come le strategie di deployment on-premise per i Large Language Models possano offrire v...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-19 Tom's Hardware

Difetti di Produzione e Affidabilità: Lezioni per l'Framework AI On-Premise

Un recente incidente che ha coinvolto droni di fabbricazione russa, segnalati per disintegrazione in volo a causa di difetti di produzione, solleva interrogativi cruciali sull'importanza della qualità hardware. Questo evento, pur non direttamente leg...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-18 DigiTimes

Il Futuro Integrato dell'Automotive a Taiwan: Sfide AI tra Edge e On-Premise

Il recente 360° Mobility Show di Taiwan ha messo in luce la visione di un futuro automotive sempre più integrato. Questo scenario, fortemente dipendente dall'intelligenza artificiale, solleva questioni cruciali riguardo ai requisiti di deployment, al...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-18 Tom's Hardware

Minisforum N5 Max: un NAS con AMD Strix Halo per l'AI locale e 200TB

Minisforum ha presentato il NAS N5 Max, una soluzione progettata per l'AI locale. Equipaggiato con processori AMD Strix Halo e offerto a 2.899 dollari nella configurazione "AI NAS" con OpenClaw preinstallato, il dispositivo supporta una capacità di a...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-18 Tom's Hardware

Portafogli Hardware Falsi: La Minaccia Nascosta per la Sovranità dei Dati

Un esperto tecnico ha scoperto un portafoglio hardware Ledger Nano S+ contraffatto, quasi cadendo vittima di un attacco di phishing. L'incidente sottolinea i pericoli derivanti dall'hardware non autentico e le sue implicazioni per la sicurezza dei da...

#Hardware #LLM On-Premise #DevOps
2026-04-18 DigiTimes

TSMC e il futuro dell'AI on-premise: segnali dal mercato dei semiconduttori

L'analisi delle comunicazioni finanziarie di TSMC, leader nella produzione di semiconduttori, offre spunti cruciali per chi pianifica infrastrutture AI on-premise. Sebbene i dettagli specifici di un futuro earnings call siano ancora da definire, il c...

#Hardware #LLM On-Premise #DevOps
2026-04-17 The Next Web

Geely EX5: il SUV elettrico e le sfide AI per l'on-premise nell'automotive

Geely, colosso automobilistico proprietario di marchi come Volvo e Polestar, ha presentato il SUV elettrico EX5, caratterizzato da un prezzo competitivo, autonomia estesa e dotazioni di lusso. Questo lancio evidenzia la crescente integrazione tecnici...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-17 Tech.eu

Sovranità AI, infrastrutture e investimenti: il panorama tech europeo

Il panorama tecnicico europeo mostra una chiara tendenza verso la sovranità dei dati e l'autonomia infrastrutturale nell'ambito dell'intelligenza artificiale. Nuovi investimenti e progetti si concentrano su tecnicie per il trasferimento dati AI, solu...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-17 Tech.eu

Sovereign AI: il Regno Unito accelera gli investimenti nell'AI domestica

Il Regno Unito ha lanciato Sovereign AI, un fondo di venture capital da 500 milioni di sterline sostenuto dal governo, per supportare le startup AI nazionali. L'iniziativa mira a mantenere i talenti e le innovazioni AI all'interno del paese, offrendo...

#LLM On-Premise #Fine-Tuning #DevOps
2026-04-17 DigiTimes

Accelerare l'AI in azienda: l'impatto di hardware e architetture di calcolo

L'adozione dell'AI in ambito enterprise richiede un'attenta valutazione degli avanzamenti hardware e delle trasformazioni nelle architetture di calcolo. Questo articolo esplora come le scelte infrastrutturali, dalla VRAM delle GPU alla gestione del d...

#Hardware #LLM On-Premise #DevOps
2026-04-17 DigiTimes

ASML e la domanda EUV: implicazioni per il silicio AI on-premise

ASML ha rivisto al rialzo le sue previsioni per il 2026, spinta dalla crescente domanda di tecnicia di litografia a ultravioletti estremi (EUV). Questo incremento sottolinea il ruolo critico di ASML nella produzione di chip avanzati, fondamentali per...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-16 TechCrunch AI

Factory: 1,5 miliardi di valutazione per l'AI coding aziendale on-premise

Factory, una startup di tre anni, ha raggiunto una valutazione di 1,5 miliardi di dollari dopo aver raccolto 150 milioni di dollari in un round di finanziamento guidato da Khosla Ventures. L'azienda si concentra sullo sviluppo di soluzioni di AI codi...

#Hardware #LLM On-Premise #DevOps
2026-04-16 Google AI Blog

L'AI nei browser: nuove interazioni e le sfide infrastrutturali

Con l'introduzione di nuove funzionalità AI nei browser come Chrome, l'interazione con il web si evolve. Questo solleva questioni cruciali riguardo l'infrastruttura di deployment, la sovranità dei dati e i requisiti hardware per l'esecuzione di Large...

#Hardware #LLM On-Premise #DevOps
2026-04-16 MIT Technology Review

LLM nel settore pubblico: le sfide di sicurezza e il ruolo degli SLM on-premise

Le organizzazioni del settore pubblico affrontano pressioni crescenti per l'adozione dell'AI, ma si scontrano con vincoli unici legati a sicurezza, governance e operatività. I Large Language Models (LLM) tradizionali spesso non sono adatti a questi c...

#Hardware #LLM On-Premise #DevOps
2026-04-16 The Next Web

STORM Therapeutics raccoglie 56M: l'AI e i deployment on-premise nella biotech

STORM Therapeutics, azienda biotech di Cambridge, ha completato un round di finanziamento Series C da 56 milioni di dollari, interamente sottoscritto dagli investitori esistenti. L'azienda è pioniera nello sviluppo di inibitori di enzimi che modifica...

#Hardware #LLM On-Premise #Fine-Tuning
2026-04-15 The Register AI

Regno Unito: la dipendenza dalla Big Tech USA minaccia la sicurezza nazionale

Un nuovo rapporto dell'Open Rights Group evidenzia come la prolungata integrazione del settore pubblico britannico con le grandi aziende tecniciche statunitensi stia creando un significativo rischio per la sicurezza nazionale. Questa dipendenza, accu...

#Hardware #LLM On-Premise #DevOps
← Torna ai Topic