🗄️ Archivio Notizie

Cronologia completa dei segnali AI, ordinati per data.
Total Articles: 14299

Questo archivio e la memoria storica di AI-Radar: lanci di modelli, novita sui framework, cambiamenti infrastrutturali e segnali di mercato raccolti in una timeline ricercabile. Serve per confrontare come sono evolute le narrative, capire quali tecnologie hanno mantenuto trazione e prendere decisioni con contesto storico invece che seguire solo l'hype del momento. Per orientarti piu velocemente puoi passare alle sezioni dedicate LLM, Frameworks, Hardware e alla pillar Trends.

💡 Cerchi qualcosa di specifico? Usa la Barra di Ricerca in alto per una ricerca dettagliata.

May 18 2026
LLM

Il Futuro degli LLM Open-Weight: Tra Attesa e Nuove Dinamiche di Rilascio

La comunità degli Large Language Models (LLM) è in fermento, in attesa di nuove versioni dopo i recenti rilasci. Si specula su un possibile cambiamento nelle politiche di distribuzione dei modelli open-weight, con implicazioni significative per le strategie di deployment on-premise e la sovranità dei dati. L'analisi suggerisce che la fine di maggio e l'inizio di giugno potrebbero essere periodi chiave per l'introduzione di innovazioni.

May 18 2026
Altro

Sistemi AI Vocali: Nuove Vulnerabilità agli Attacchi Audio Nascosti

Una nuova ricerca rivela che i sistemi AI vocali, inclusi i Large Audio-Language Models (LALMs), sono suscettibili ad attacchi “AudioHijack”. Questi attacchi sfruttano suoni impercettibili incorporati nell'audio per forzare i modelli a eseguire comandi non autorizzati, con tassi di successo elevati. La tecnica, testata su 13 modelli open source e servizi commerciali, evidenzia gravi lacune nella sicurezza dei deployment AI, specialmente dove la sovranità dei dati e la compliance sono critiche.

May 18 2026
LLM

LLM e Sviluppo Software: L'Accessibilità per i Non Esperti con Claude

Un recente esperimento ha esplorato come i Large Language Models, in particolare Claude, possano democratizzare lo sviluppo software, rendendolo accessibile anche a chi non possiede competenze di programmazione avanzate. L'iniziativa ha visto la creazione di un database per la gestione di piccole problematiche, evidenziando il potenziale degli LLM come strumenti di co-creazione per progetti software.

May 18 2026
Market

Samsung: bonus disparitari e la crisi di talenti nel settore dei chip

Trascrizioni interne di Samsung rivelano bonus significativamente diversi tra il personale addetto alla memoria (fino al 607%) e quello ai chip logici (fino al 50%). Questa disparità, secondo i sindacati, sta creando una crisi di ritenzione dei talenti che l'azienda non può permettersi, con potenziali ripercussioni sulla catena di fornitura di componenti critici per l'infrastruttura AI, influenzando i costi e la disponibilità per i deployment on-premise.

May 18 2026
Market

Samsung e la Stabilità Lavorativa: Implicazioni per la Pipeline di Fornitura Tech

Una recente ingiunzione del tribunale ha scongiurato uno sciopero imminente presso Samsung, consentendo la ripresa dei colloqui con i sindacati. L'evento, sebbene risolto, evidenzia la fragilità delle catene di fornitura globali e le potenziali ripercussioni sulla disponibilità di componenti hardware essenziali per i deployment di Large Language Models (LLM) on-premise, influenzando il Total Cost of Ownership (TCO) e la pianificazione strategica delle infrastrutture AI.

May 18 2026
Market

Cosmico raccoglie 12M€ e acquisisce Flatmates, puntando sul "future of work" e l'AI

La holding milanese Cosmico ha chiuso un round di finanziamento da 12 milioni di euro, combinando equity e debito, guidato da P101 SGR. Contestualmente, ha completato l'acquisizione di Flatmates, agenzia specializzata nella creator economy con un modello Talent-as-a-Service. L'operazione rafforza la strategia di Cosmico nel "future of work", che include l'integrazione di soluzioni AI per la progettazione dei team e l'espansione in nuovi segmenti di mercato, con ulteriori acquisizioni già pianificate.

May 18 2026
Market

Indagine Reuters: Flussi Miliardari da Nobitex su Tron e BNB Chain

Un'indagine Reuters ha rivelato flussi per 2,3 miliardi di dollari dall'exchange iraniano Nobitex verso le blockchain Tron e BNB Chain dal 2023. Le piattaforme sono legate ai primi sostenitori di World Liberty Financial, sebbene nessuna accusa di consapevolezza sia stata mossa contro WLF. La vicenda evidenzia le sfide di compliance nel settore delle criptovalute.

May 18 2026
Altro

La sicurezza guiderà l'adozione degli 800V nei data center AI, secondo Texas Instruments

Texas Instruments sottolinea come la sicurezza rappresenterà il fattore determinante nell'adozione della tecnicia a 800V nei data center dedicati all'intelligenza artificiale. Questa tensione più elevata è cruciale per gestire le crescenti esigenze energetiche dei carichi di lavoro AI, ma richiede un'attenta valutazione dei rischi e delle soluzioni di protezione. La capacità di garantire operazioni sicure influenzerà anche la scelta dei fornitori.

May 18 2026
Hardware

L'ingegneria amatoriale riporta in vita la PlayStation 2 in formato portatile

Un appassionato ha ingegnerizzato una PlayStation 2 per integrarla in un dispositivo portatile. Il progetto, che include una scheda madre personalizzata, combina funzionalità moderne con il silicio originale della console, dimostrando la complessità e la dedizione richieste dalla personalizzazione hardware.

May 18 2026
Market

A2Z punta sugli autobus autonomi, evitando la corsa ai robotaxi

L'azienda sudcoreana A2Z si sta distinguendo nel settore della guida autonoma concentrandosi sullo sviluppo di autobus a guida autonoma. Questa strategia mira a evitare la competizione diretta con giganti come Waymo e Baidu Apollo Go, che dominano il segmento dei robotaxi. La scelta di un mercato di nicchia evidenzia le sfide infrastrutturali e di deployment che caratterizzano l'intero ecosistema dei veicoli autonomi, con un focus crescente sulle soluzioni edge e on-premise.

May 18 2026
Market

Commonwealth Bank nomina Mary-Anne Williams Chief AI Scientist

Commonwealth Bank of Australia ha nominato la Professoressa Mary-Anne Williams come sua prima Chief AI Scientist. Questa mossa strategica rafforza l'impegno della banca nello sviluppo di capacità AI all'avanguardia, con la Prof. Williams che guiderà un team di scienziati e definirà la visione per l'integrazione dell'intelligenza artificiale nelle operazioni critiche.

May 18 2026
Frameworks

AMD Lemonade SDK: macOS raggiunge la General Availability con ROCm 7.13

AMD ha annunciato che il suo SDK Lemonade per l'intelligenza artificiale locale è ora in General Availability per macOS. Il progetto open source, sviluppato dagli ingegneri AMD, integra ROCm 7.13 e mira a ottimizzare l'esecuzione di Large Language Models su GPU e NPU, offrendo soluzioni per deployment on-premise e rafforzando l'ecosistema AI dell'azienda.

May 18 2026
Market

La crescente domanda di MLCC per i server AI evidenzia sfide nella supply chain

Prosperity Dielectrics rileva un'intensa ricerca di MLCC da parte dei clienti di server AI, segnalando una pressione sulla catena di approvvigionamento di componenti critici. Questo trend sottolinea l'espansione dell'infrastruttura AI e le potenziali implicazioni per i costi e i tempi di deployment delle soluzioni on-premise, dove la stabilità dell'alimentazione è fondamentale per le GPU ad alte prestazioni.

May 18 2026
Market

Pan Jit: la crescita dei ricavi AI e le sfide della supply chain

I ricavi di Pan Jit legati all'intelligenza artificiale hanno raggiunto l'11% del totale, con tempi di consegna degli ordini che si estendono a sei mesi. Questo scenario evidenzia la forte domanda di infrastrutture AI e le crescenti sfide nella supply chain, con implicazioni significative per le aziende che pianificano deployment on-premise e la gestione del TCO.

May 18 2026
Altro

Esecuzione di LLM on-premise su GPU consumer: il caso Qwen 3.6 su Nvidia RTX A4000

Un utente ha dimostrato l'efficacia del deployment on-premise di Large Language Models come Qwen 3.6 27B e 35B MoE, utilizzando quattro Nvidia RTX A4000 da 16GB VRAM ciascuna. L'implementazione, basata su Llama.cpp e Multi-GPU Tensor Parallelism (MTP), evidenzia come hardware non di ultima generazione possa offrire performance competitive per carichi di lavoro di inference, con un'analisi implicita del TCO e della sovranità dei dati.

May 18 2026
Market

Apple e l'App Store in India: l'Alta Corte di Delhi impone cooperazione procedurale

L'Alta Corte di Delhi ha ordinato ad Apple di fornire dati finanziari alla Competition Commission of India (CCI) nell'ambito di un'indagine antitrust sull'App Store. La decisione, pubblicata sabato, stabilisce anche che la CCI non potrà emettere una decisione finale prima del 15 luglio. Apple è stata esplicitamente invitata a cooperare pienamente con l'autorità di regolamentazione indiana, segnando un passo significativo nella crescente pressione normativa sulle grandi aziende tecniciche.

May 18 2026
Market

HSBC finanzia l'espansione globale del clean-tech cinese, inclusi i data center

HSBC, la principale banca europea, ha annunciato una linea di credito da 4 miliardi di dollari per sostenere l'espansione internazionale delle aziende cinesi di tecnicie pulite. L'iniziativa, denominata "Sustainability and Transition Credit Facility", mira a supportare esportatori di soluzioni solari, batterie, veicoli elettrici e data center, rispondendo a una domanda globale in crescita, accelerata anche da contesti geopolitici.

May 18 2026
Altro

Anthropic e Mythos: la sicurezza informatica finanziaria sotto la lente degli LLM

Anthropic si prepara a presentare al Financial Stability Board (FSB) le vulnerabilità di cybersecurity identificate dal suo modello Mythos. L'invito, esteso dal Governatore della Bank of England Andrew Bailey, sottolinea la crescente preoccupazione delle istituzioni finanziarie globali riguardo ai rischi informatici e al ruolo che i Large Language Models possono giocare nella loro identificazione e mitigazione, evidenziando l'importanza di strategie di deployment sicure.

May 18 2026
Market

Asus punta ai server AI in Corea del Sud: il vantaggio di produzione e memoria

Asus sta espandendo il proprio business nel settore dei server in Corea del Sud, sfruttando la sua consolidata esperienza manifatturiera e una catena di approvvigionamento privilegiata per i componenti di memoria. Questa mossa strategica mira a capitalizzare la crescente domanda di infrastrutture per l'intelligenza artificiale, offrendo soluzioni hardware cruciali per i deployment on-premise e ibridi.

May 18 2026
Altro

Taiwan: incentivi fiscali per i centri di calcolo AI e le sfide on-premise

Le aziende taiwanesi stanno cercando incentivi fiscali per la costruzione di centri di calcolo dedicati all'intelligenza artificiale. Questa mossa evidenzia la crescente domanda di infrastrutture robuste per supportare carichi di lavoro AI, in particolare per i Large Language Models (LLM). La decisione sottolinea l'importanza strategica di investimenti in hardware e infrastrutture locali, con implicazioni dirette per la sovranità dei dati e il Total Cost of Ownership (TCO) dei deployment on-premise.

May 18 2026
Market

LawX di Berlino ottiene 7,5 milioni di euro per l'AI legale nel backoffice

La startup berlinese LawX ha chiuso un round di finanziamento seed da 7,5 milioni di euro, guidato da Motive Partners. Fondata nel 2025, l'azienda si concentra sullo sviluppo di soluzioni AI per le operazioni di backoffice nel settore legale, come la gestione dei casi, la fatturazione e la gestione documentale, distinguendosi dagli approcci più comuni nel mercato dell'AI legale.

May 18 2026
Altro

Samsung e l'AI: bilanciare produzione di chip e strategie di deployment LLM on-premise

Mentre Samsung, gigante tecnicico globale, affronta dinamiche interne, il settore si interroga sulle strategie di deployment dei Large Language Models. Per aziende della sua statura, la scelta tra soluzioni cloud e on-premise per l'AI generativa implica considerazioni critiche su hardware, TCO, sovranità dei dati e controllo infrastrutturale, aspetti centrali per chi gestisce carichi di lavoro AI complessi.

May 18 2026
Frameworks

SmallCode: L'agente di coding locale che eccelle con modelli da 4B

SmallCode è un agente di coding progettato per LLM locali di piccole dimensioni, superando i limiti degli strumenti esistenti che dipendono da modelli cloud. Con un modello Gemma da 4 miliardi di parametri, raggiunge un'efficienza dell'87% nei benchmark, superando agenti che usano modelli da 14B. La sua architettura innovativa, basata su strumenti composti e gestione intelligente del contesto, permette di ottenere prestazioni elevate mantenendo il controllo sui dati e riducendo la dipendenza dal cloud.

May 18 2026
Market

Greenpixie raccoglie 4,7 milioni per ottimizzare l'efficienza energetica di AI e cloud

La startup britannica Greenpixie ha completato un round di finanziamento pre-Series A da 4,7 milioni di sterline per supportare le grandi imprese nella riduzione degli sprechi energetici legati all'AI e all'infrastruttura cloud. La sua tecnicia proprietaria mira a fornire "sustainability intelligence", permettendo alle aziende di ottimizzare l'uso delle risorse, eliminare sprechi e selezionare opzioni a basso impatto ambientale, generando significativi risparmi economici e di carbonio.

May 18 2026
Market

LawX raccoglie 7,5 milioni di euro per un sistema operativo legale basato su AI

LawX, legaltech berlinese, ha ottenuto 7,5 milioni di euro in un round di finanziamento seed guidato da Motive Partners. L'azienda sta sviluppando una piattaforma basata su intelligenza artificiale per studi legali e notai, focalizzata sull'automazione dei processi operativi. L'obiettivo è affrontare le crescenti sfide del settore legale, caratterizzato da sistemi legacy frammentati e carenza di personale, posizionandosi come un sistema operativo end-to-end per il lavoro legale in Europa.

May 18 2026
Market

L'AI ridefinisce l'industria dei chip: TSMC affronta nuovi concorrenti

L'avvento dell'intelligenza artificiale sta trasformando radicalmente il settore dei semiconduttori, spostando il focus verso hardware specializzato per LLM e carichi di lavoro AI. Questo cambiamento non solo stimola l'innovazione tecnicica, ma introduce anche nuovi attori competitivi nel panorama dominato da TSMC. L'articolo esplora le implicazioni di questa dinamica per le strategie di deployment on-premise, il TCO e la sovranità dei dati per le aziende.

May 18 2026
Market

Taiwan e la spinta alla catena di fornitura AI con TEEMA Science Park 3.0

Le aziende ICT taiwanesi stanno accelerando l'espansione della catena di fornitura globale per l'intelligenza artificiale, un'iniziativa strategica legata al progetto TEEMA Science Park 3.0. Questo sforzo mira a rafforzare la posizione di Taiwan come hub cruciale per l'hardware e i componenti essenziali per i deployment di Large Language Models e altre applicazioni AI, influenzando disponibilità e TCO per le infrastrutture on-premise.

May 18 2026
Altro

L'AI a supporto del kernel Linux: Kroah-Hartman svela bug con strumenti on-premise

Greg Kroah-Hartman, figura chiave nello sviluppo del kernel Linux, sta impiegando nuovi strumenti di fuzzing basati sull'intelligenza artificiale per identificare bug. Questi sistemi, denominati "gkh_clanker_t1000" e "gkh_clanker_2000", operano su un Framework Desktop equipaggiato con processori AMD Ryzen AI Max, evidenziando un approccio on-premise alla sicurezza e allo sviluppo del software critico.

May 18 2026
LLM

Bilanciare fluidità e fedeltà: la sfida dei LLM nella traduzione letteraria

Uno studio approfondisce il delicato equilibrio tra fluidità e fedeltà nelle traduzioni letterarie, confrontando output umani con quelli di Large Language Models come Google Translate e TranslateGemma. La ricerca rivela una correlazione negativa tra i due attributi, evidenziando come la lunghezza del segmento influenzi la valutazione automatica e suggerendo un trade-off intrinseco, con implicazioni per lo sviluppo e il deployment di LLM in contesti aziendali.

May 18 2026
LLM

OP-Mix: Ottimizzare il Data Mixing per LLM con un Approccio Continuo e Efficiente

Un nuovo algoritmo, OP-Mix, rivoluziona il data mixing per i Large Language Models, operando sull'intero ciclo di vita del training. Eliminando la necessità di modelli proxy e sfruttando gli adapter a basso rango, OP-Mix riduce drasticamente i requisiti di calcolo. Offre miglioramenti significativi nella perplexity durante il pretraining e eguaglia le performance di metodi più costosi nel continual learning, con un risparmio di compute fino al 95%. Questo approccio unificato promette efficienza e flessibilità per lo sviluppo di LLM.

May 18 2026
Frameworks

TeamTR: Ottimizzare il Fine-Tuning per la Coordinazione di LLM Multi-Agente

Un nuovo studio identifica una criticità strutturale nel fine-tuning sequenziale dei sistemi LLM multi-agente, denominata "compounding occupancy shift", che ne compromette le prestazioni. Per affrontare questo problema, è stato proposto TeamTR, un framework basato su trust-region che migliora la coordinazione e le performance. I risultati sperimentali mostrano un incremento medio del 7.1% rispetto ai baseline, offrendo una soluzione più robusta per i deployment di LLM complessi.

May 18 2026
Altro

AgentStop: Ottimizzare l'efficienza degli agenti LLM su dispositivi locali

Un nuovo studio introduce AgentStop, un supervisore leggero progettato per migliorare l'efficienza energetica degli agenti LLM eseguiti localmente su dispositivi consumer. Prevedendo e terminando precocemente le operazioni con bassa probabilità di successo, AgentStop riduce il consumo energetico della GPU del 15-20% con un impatto minimo sulle prestazioni. Questa soluzione affronta le sfide di privacy e costi dei deployment cloud, promuovendo agenti AI più sostenibili e self-hosted.

May 18 2026
LLM

Valutare la Theory of Mind negli LLM: l'interazione è la chiave

Un nuovo studio evidenzia come i benchmark tradizionali per la Theory of Mind (ToM) negli LLM non riflettano le prestazioni reali nelle interazioni dinamiche uomo-AI. La ricerca propone un paradigma di valutazione interattivo, dimostrando che i miglioramenti su test statici non sempre si traducono in benefici concreti per compiti orientati all'obiettivo o all'esperienza, sottolineando la necessità di approcci più realistici per lo sviluppo di LLM socialmente consapevoli.

May 18 2026
Frameworks

DeepSlide: Oltre le Diapositive, Verso una Presentazione Efficace con l'AI

DeepSlide è un sistema multi-agente con intervento umano che rivoluziona la preparazione delle presentazioni. A differenza dei generatori tradizionali che si concentrano solo sull'aspetto visivo, DeepSlide ottimizza l'intero processo di delivery, dalla pianificazione narrativa alla sincronizzazione tra slide e script. Integra un planner logico, un retriever di contenuti e un rendering sequenziale, migliorando significativamente il flusso narrativo e la precisione del ritmo.

May 18 2026
Market

Le case automobilistiche occidentali localizzano l'E/E: opportunità per l'elettronica di Taiwan

La decisione delle case automobilistiche occidentali di localizzare l'approvvigionamento dei componenti elettronici ed elettrici (E/E) sta creando nuove opportunità per le aziende taiwanesi. Questo spostamento strategico, motivato da esigenze di resilienza della supply chain e controllo tecnicico, riflette una tendenza più ampia verso la sovranità e la gestione diretta delle infrastrutture critiche, un tema centrale anche nel deployment di soluzioni AI on-premise.

May 18 2026
Altro

Valutare il Deployment di LLM On-Premise: Sfide e Opportunità per le Aziende

L'adozione di Large Language Models (LLM) pone le aziende di fronte a scelte strategiche di deployment. Questo articolo esplora le complessità e le opportunità del self-hosting, analizzando i requisiti hardware, le implicazioni per la sovranità dei dati e il Total Cost of Ownership (TCO). Un'analisi approfondita è cruciale per bilanciare controllo, sicurezza e performance in ambienti on-premise.

May 18 2026
Altro

Taiwan e l'espansione dei droni: gli USA puntano sull'Edge Computing

Taiwan invia la sua più grande delegazione di droni di sempre a Xponential 2026, mentre gli Stati Uniti mostrano un crescente interesse per l'edge computing. Questa tecnicia è cruciale per l'elaborazione dati in loco, specialmente per applicazioni critiche come quelle dei droni, dove sovranità dei dati, bassa latenza e controllo operativo sono fattori determinanti per i deployment on-premise.

May 18 2026
Market

Getac: la domanda di PC rugged per droni e difesa spinge la crescita, nonostante le sfide della supply chain

Getac, produttore di PC rugged, sta beneficiando di una forte domanda nei settori dei droni e della difesa. Nonostante le difficoltà nella supply chain globale per i componenti di questi sistemi specializzati, l'azienda, guidata dal presidente James Hwang, registra una crescita. Questo scenario evidenzia la crescente importanza di soluzioni hardware robuste per applicazioni critiche e deployment edge, dove la resilienza e la sovranità dei dati sono fondamentali.

May 18 2026
LLM

Gemma-4-Gembrain-31B-it-uncensored-heretic: il nuovo LLM per logica e creatività

È stato rilasciato Gemma-4-Gembrain-31B-it-uncensored-heretic, un nuovo Large Language Model basato su Gemma 4 31B. Frutto di un merge di diversi fine-tuning, il modello mira a potenziare il pensiero logico e la prosa creativa. Disponibile in formati Safetensors e GGUF, è ottimizzato per deployment on-premise, offrendo controllo e sovranità dei dati, con metriche specifiche come un KLD di 0.0186 e un tasso di rifiuto di 13/100.

May 18 2026
Hardware

Nvidia GB300 e l'accelerazione dei server AI: la fase Vera Rubin al via nel terzo trimestre

Il processore Nvidia GB300 sta catalizzando una crescita significativa nel mercato dei server AI, alimentando la domanda di infrastrutture dedicate. Questa espansione è ulteriormente supportata dall'imminente avvio della fase "Vera Rubin", previsto per il terzo trimestre, che promette di portare nuove capacità e disponibilità nel panorama dell'intelligenza artificiale.

May 18 2026
Altro

Ennoconn e Kontron: la strategia per l'AI fisica e l'obiettivo ROE 2030

Ennoconn ha delineato la sua strategia di integrazione con Kontron, puntando con decisione sull'AI fisica per raggiungere un Return on Equity (ROE) del 20% entro il 2030. Questa mossa strategica evidenzia un crescente interesse verso soluzioni di intelligenza artificiale deployate su hardware dedicato, spesso in ambienti on-premise o edge, con implicazioni significative per la sovranità dei dati, la latenza e il Total Cost of Ownership (TCO) per le aziende.

May 18 2026
Hardware

Lotes: Connettori per server e AI trainano ricavi record, puntando alla quota di mercato

Lotes ha raggiunto ricavi record, trainati dalla crescente domanda di connettori per server e applicazioni AI. L'azienda sta mantenendo una strategia di prezzi competitivi per espandere la propria quota di mercato in un segmento infrastrutturale critico per i deployment di Large Language Models (LLM) e carichi di lavoro di intelligenza artificiale.

May 18 2026
Market

Il passaggio edge-cloud ridefinisce il mercato dei chip: nuove opportunità per i fornitori taiwanesi

Il settore dell'intelligenza artificiale sta assistendo a un significativo spostamento dei carichi di lavoro verso l'edge, lontano dai data center cloud centralizzati. Questa tendenza, nota come "edge-cloud shift", apre nuove e importanti opportunità di crescita per i fornitori di silicio, in particolare per le aziende taiwanesi, storicamente leader nella produzione di chip. La mossa è guidata da esigenze di sovranità dei dati, latenza ridotta e ottimizzazione del TCO per i deployment di LLM e altre applicazioni AI.

May 18 2026
Market

TSMC sotto pressione: Samsung, Intel e Apple cercano alternative per la produzione AI

La crescente domanda di chip per l'intelligenza artificiale sta mettendo sotto pressione TSMC, leader nella produzione di semiconduttori. Questo scenario spinge giganti tecnicici come Samsung, Intel e Apple a esplorare attivamente fonderie alternative per assicurarsi le forniture necessarie. La ricerca di diversificazione evidenzia le sfide della supply chain e le implicazioni per i deployment AI, in particolare per chi valuta soluzioni self-hosted che richiedono hardware specifico e disponibile.

May 18 2026
Market

Chip AI: il vertice USA-Cina non scioglie i nodi, ma allenta le tensioni

Il recente vertice tra Stati Uniti e Cina ha mostrato una distensione nelle relazioni commerciali generali, ma non ha risolto lo stallo sui chip per l'intelligenza artificiale. Questa incertezza nella catena di approvvigionamento globale ha implicazioni dirette per le aziende che pianificano deployment di Large Language Models (LLM) on-premise, influenzando la disponibilità di hardware critico e le strategie di Total Cost of Ownership (TCO). La competizione strategica sul silicio avanzato rimane un fattore chiave per il settore tech.

May 18 2026
Market

Tata Electronics e ASML: una partnership strategica per la produzione di chip in India

Tata Electronics, azienda indiana, ha stretto una partnership con ASML, leader nelle apparecchiature per la litografia, per supportare l'avvio del suo primo impianto di produzione di wafer da 300mm. Questa collaborazione è cruciale per l'espansione della capacità produttiva di semiconduttori in India, un passo fondamentale per la filiera globale e per la disponibilità di hardware essenziale per l'AI, influenzando le strategie di deployment on-premise e la sovranità tecnicica.

May 18 2026
Altro

Palo Alto Networks rafforza la sicurezza AI e delle identità con Idira e nuove integrazioni

Palo Alto Networks ha annunciato l'integrazione di CyberArk, Koi e Portkey e il lancio di Idira, una nuova soluzione progettata per potenziare la sicurezza basata sull'intelligenza artificiale e la gestione delle identità. Questa mossa strategica mira a fornire alle aziende strumenti più robusti per proteggere i loro ambienti IT in un panorama di minacce in continua evoluzione, con un'attenzione particolare alle sfide poste dai carichi di lavoro AI.

May 18 2026
Hardware

L'Evoluzione dei Mini PC per l'Inference LLM On-Premise: Il Fattore Dimensionale

L'interesse per l'esecuzione di Large Language Models (LLM) in locale sta spingendo lo sviluppo di hardware compatto. Un recente riferimento a una "size chart" per i mini PC Strix Halo, con un aggiornamento previsto per maggio 2026, evidenzia come le dimensioni e il form factor siano cruciali per i deployment on-premise e all'edge, influenzando TCO, gestione dei dati e flessibilità operativa.

May 17 2026
Market

Semiconduttori in India: gestione energetica AI e localizzazione della supply chain

L'India sta espandendo le proprie ambizioni nel settore dei semiconduttori, focalizzandosi sulla gestione energetica per l'intelligenza artificiale e sulla localizzazione della supply chain. Questo sviluppo strategico mira a rafforzare l'autonomia tecnicica del paese, con implicazioni significative per la sovranità dei dati e il Total Cost of Ownership (TCO) dei deployment di LLM on-premise, offrendo maggiore controllo e resilienza infrastrutturale.

May 17 2026
Altro

Whetron intensifica l'impegno nell'AI per la sicurezza veicolare e i sistemi di rilevamento intelligenti

Whetron sta espandendo la sua presenza nel settore dell'intelligenza artificiale applicata alla sicurezza dei veicoli e ai sistemi di rilevamento avanzati. Questa mossa riflette la crescente importanza dell'AI per l'elaborazione dei dati in tempo reale e le decisioni critiche a bordo veicolo, evidenziando la necessità di soluzioni AI robuste e performanti direttamente all'edge, con implicazioni significative per il deployment on-premise e la sovranità dei dati.

May 17 2026
Hardware

Substrati avanzati: Nan Ya PCB accelera la produzione per i chip AI

Nan Ya PCB, un attore chiave nella produzione di circuiti stampati, sta incrementando la sua capacità produttiva. Questa mossa risponde alla crescente domanda di substrati avanzati, essenziali per i chip AI di nuova generazione. L'espansione sottolinea la pressione sulla supply chain dell'hardware AI e le sue implicazioni per le strategie di deployment on-premise e cloud, influenzando la disponibilità e il TCO delle infrastrutture dedicate all'intelligenza artificiale.

May 17 2026
Altro

Hyundai e Kia: al via il primo progetto pilota su larga scala per la guida autonoma in Corea del Sud

Hyundai e Kia si preparano a lanciare il primo progetto pilota su larga scala per la guida autonoma in Corea del Sud. L'iniziativa segna un passo significativo nello sviluppo e nell'adozione di tecnicie AI avanzate nel settore automobilistico, sollevando questioni cruciali legate all'infrastruttura di deployment, alla sovranità dei dati e ai requisiti hardware per l'elaborazione in tempo reale.

May 17 2026
Market

Costi dell'AI locale: Apple Silicon a confronto con i servizi cloud come OpenRouter

L'analisi dei costi per l'inference di LLM rivela un confronto complesso tra soluzioni locali, come quelle basate su Apple Silicon, e i servizi cloud offerti da piattaforme come OpenRouter. Sebbene l'AI locale sia attualmente più onerosa, fattori come la privacy, l'utilizzo di hardware esistente e la sostenibilità economica dei provider cloud, spesso supportati da capitali di investimento, possono ribaltare la prospettiva a lungo termine.

May 17 2026
Market

Alcolase raccoglie 1,5 milioni di euro per affrontare l'intolleranza all'alcol con la biotecnicia

La startup danese Alcolase ha ottenuto un finanziamento di 1,5 milioni di euro per sviluppare una tecnicia enzimatica innovativa. L'obiettivo è scomporre l'alcol nello stomaco prima che venga assorbito, offrendo una soluzione a circa 540 milioni di persone in Asia orientale affette da deficit di ALDH2. L'investimento supporterà studi in vivo, lo sviluppo tecnicico e l'espansione commerciale, a partire da Singapore e Corea del Sud.

May 17 2026
LLM

Qwen3.5 e WebGL: rendering fotorealistico in tempo reale con LLM locali

Un'implementazione basata su Qwen3.5-122B UD-Q3_K_XL dimostra la capacità di generare rendering fotorealistici di volti umani in tempo reale tramite WebGL. Questo approccio evidenzia il potenziale degli LLM altamente quantizzati per carichi di lavoro on-premise o edge, consentendo elaborazioni complesse direttamente sul dispositivo client e riducendo la dipendenza dal cloud. La soluzione offre vantaggi in termini di latenza, sovranità dei dati e TCO.

May 17 2026
Altro

Linux 7.1-rc4: Nuova documentazione per sicurezza e AI nel kernel

La recente release di Linux 7.1-rc4 introduce importanti aggiornamenti nel kernel, con un focus particolare su correzioni e l'integrazione di nuova documentazione. Quest'ultima si concentra su temi cruciali come la sicurezza e l'intelligenza artificiale, elementi fondamentali per i deployment on-premise. L'aggiornamento sottolinea l'evoluzione del sistema operativo nel supportare carichi di lavoro AI, offrendo basi più solide per architetture locali e la gestione della sovranità dei dati.

May 17 2026
Altro

Siri e la privacy: Apple punta sull'eliminazione automatica delle chat

Apple si prepara a presentare una nuova versione di Siri, con la privacy al centro della strategia. Tra le novità attese, spicca la potenziale introduzione di funzionalità per l'eliminazione automatica delle chat, un passo significativo per rafforzare il controllo degli utenti sui propri dati. Questa mossa riflette una crescente attenzione del settore alla sovranità dei dati e alle configurazioni self-hosted, dove la gestione locale delle informazioni diventa cruciale.

May 17 2026
Market

Processo Musk-OpenAI: la fiducia al centro del dibattito

Nelle fasi conclusive del processo tra Elon Musk e OpenAI, la questione della fiducia nel CEO Sam Altman è emersa come un tema centrale. Questo dibattito evidenzia l'importanza della trasparenza e della governance nel settore AI, influenzando le decisioni strategiche delle aziende riguardo l'adozione e il deployment di Large Language Models, specialmente per chi valuta soluzioni on-premise.

May 17 2026
Hardware

Tata Electronics e ASML: un polo per i chip in India da 11 miliardi di dollari

Tata Electronics ha annunciato un investimento di 11 miliardi di dollari per la costruzione di un impianto di produzione di semiconduttori a Dholera, in India, con la collaborazione di ASML. Questo progetto mira a rafforzare l'autonomia indiana nel settore dei chip, cruciale per l'ecosistema tecnicico globale e per la disponibilità di hardware per i deployment on-premise di carichi di lavoro AI e LLM.

May 17 2026
LLM

OpenAI unifica ChatGPT e Codex: Brockman alla guida della strategia di prodotto

OpenAI, sotto la guida di Greg Brockman per la strategia di prodotto, intende integrare le capacità di ChatGPT e Codex in un'unica esperienza utente. Questa mossa strategica mira a semplificare l'interazione con i Large Language Models, offrendo un accesso più coeso a funzionalità che spaziano dalla conversazione alla generazione di codice. L'iniziativa potrebbe influenzare le future architetture di deployment per le aziende che valutano soluzioni LLM self-hosted.

May 17 2026
Market

Aumenti di prezzo per Tesla Model Y: un riflesso sulle dinamiche di mercato

Tesla ha nuovamente ritoccato al rialzo i prezzi della Model Y negli Stati Uniti, con incrementi fino a 1.000 dollari per alcune versioni. Questo movimento, sebbene specifico per il settore automobilistico, evidenzia dinamiche di mercato più ampie che possono influenzare anche le decisioni strategiche e i costi di deployment per l'infrastruttura AI, in particolare per le soluzioni on-premise.

May 17 2026
Market

Le aziende tech filippine più finanziate: un decennio di innovazione

Un'analisi delle principali aziende tecniciche delle Filippine che hanno attratto i maggiori investimenti nell'ultimo decennio. Queste realtà emergenti sono posizionate per influenzare significativamente l'evoluzione del panorama tecnicico nazionale, delineando le future direzioni dell'innovazione e del mercato locale.

May 17 2026
Market

Riunione privata all'HQ di Uber: il futuro dell'Iran e il ruolo della tecnicia

Un incontro privato di figure di spicco della diaspora iraniana si terrà presso la sede di Uber per discutere di tecnicia e del futuro dell'Iran. L'evento, rivelato da 404 Media, vedrà la partecipazione di venture capitalist, CEO del settore tech e il figlio dell'ex leader iraniano, evidenziando il potenziale impatto delle discussioni private sulle strategie tecniciche future.

May 17 2026
Market

L'intelligenza artificiale ridefinisce il mercato del lavoro: emergono nuove figure professionali

L'avanzata dell'intelligenza artificiale sta trasformando radicalmente il panorama occupazionale, introducendo nuove figure professionali e modificando le strutture organizzative aziendali. Questo fenomeno non riguarda solo l'automazione, ma la creazione di ruoli inediti e la riqualificazione di professioni esistenti, richiedendo nuove competenze e strategie di deployment per gli LLM, specialmente in contesti self-hosted.

May 17 2026
Altro

Siri in iOS 27: controllo sulla cronologia chat e implicazioni per la sovranità dei dati

Apple introdurrà una funzione di eliminazione automatica per le cronologie chat nell'app Siri standalone di iOS 27. Gli utenti potranno configurare la conservazione dei dati per periodi definiti o indefinitamente. Questa novità, sebbene rivolta al consumatore, solleva questioni rilevanti per le aziende che gestiscono LLM, evidenziando l'importanza della sovranità e del controllo sui dati in contesti enterprise.

May 17 2026
LLM

Soderbergh e l'AI di Meta nel documentario su Lennon: un caso studio controverso

Il nuovo documentario di Steven Soderbergh, "John Lennon: The Last Interview", presentato al 79° Festival di Cannes, ha suscitato dibattito per l'uso dell'intelligenza artificiale di Meta. Basato su un'intervista inedita del 1980, il film ha ricevuto critiche negative, ma il regista suggerisce che la reazione fosse intenzionale, sollevando interrogativi sull'applicazione dell'AI nell'arte e nella conservazione storica.

May 17 2026
LLM

La speranza di un Gemma da 124B: implicazioni per il deployment on-premise

Un post su Reddit ha acceso il dibattito sulla possibilità di avere LLM di grandi dimensioni, come un ipotetico Gemma da 124 miliardi di parametri, disponibili per il deployment self-hosted. Questa prospettiva solleva questioni cruciali riguardo ai requisiti hardware, alle sfide di Inference e ai trade-off tra controllo dei dati e costi infrastrutturali per le aziende che valutano soluzioni on-premise.

May 17 2026
LLM

OpenAI: Greg Brockman unifica ChatGPT e Codex per una piattaforma "agentica"

Greg Brockman, presidente e co-fondatore di OpenAI, assume la guida della strategia di prodotto, consolidando ChatGPT, Codex e l'API per sviluppatori in un'unica organizzazione. Questa mossa mira a creare una piattaforma "agentica" unificata, ottimizzando lo sviluppo e il deployment di Large Language Models. La riorganizzazione sottolinea l'importanza di un approccio integrato per l'evoluzione dei sistemi AI, con implicazioni significative per le strategie di adozione e gestione dei modelli da parte delle aziende che valutano soluzioni self-hosted.

May 17 2026
Altro

La percezione dell'AI: una sfida per l'adozione e il deployment aziendale

La crescente cautela pubblica verso l'intelligenza artificiale solleva interrogativi cruciali per le aziende che valutano strategie di deployment. Questa percezione influenza le decisioni su controllo, sovranità dei dati e TCO, spingendo verso soluzioni on-premise o ibride per garantire trasparenza e fiducia, elementi fondamentali per un'adozione responsabile e sostenibile degli LLM.

May 17 2026
Hardware

Canonical rilascia ISO Ubuntu 'Concept' per la CPU AI CIX P1

Canonical ha iniziato a rilasciare ISO "Concept" di Ubuntu specificamente ottimizzate per la CPU CIX P1, una piattaforma dedicata all'intelligenza artificiale. Queste distribuzioni mirano a fornire un supporto hardware all'avanguardia che non è ancora integrato nel kernel Linux principale, un approccio fondamentale per le aziende che cercano di massimizzare le performance e il controllo nei loro deployment AI on-premise.

May 17 2026
Altro

La corsa alle competenze AI nell'automotive: implicazioni per l'infrastruttura

Il settore automotive si trova al centro di una crescente "corsa alle competenze AI", che evidenzia la necessità di infrastrutture robuste e strategie di deployment ben definite. Le aziende devono bilanciare l'acquisizione di talenti con la costruzione di capacità computazionali adeguate, valutando attentamente le opzioni on-premise e cloud per garantire sovranità dei dati e controllo sui propri carichi di lavoro AI.

May 17 2026
Frameworks

llama.cpp: Ottimizzazione Cruciale Migliora la Velocità di Elaborazione dei Prompt

Un recente aggiornamento per `llama.cpp` promette un significativo incremento nella velocità di elaborazione dei prompt. La modifica, introdotta tramite una Pull Request, mira a evitare la copia dei logit durante la fase di decodifica in ambienti multi-thread, un'ottimizzazione che si traduce in maggiore efficienza per i deployment di Large Language Models on-premise e locali, con impatti positivi su latenza e Throughput.

May 17 2026
LLM

Quantization KV Cache per LLM on-premise: bilanciare VRAM e qualità

Un dibattito tra sviluppatori evidenzia la sfida di ottimizzare l'uso della VRAM per i Large Language Models (LLM) in deployment on-premise. La questione centrale riguarda la quantization del KV cache (Q4_0 vs Q8_0) e il suo impatto sulla qualità del modello, specialmente con finestre di contesto estese. La necessità di ridurre il fabbisogno di VRAM si scontra con il timore di compromettere le performance, un dilemma comune per chi gestisce infrastrutture locali.

May 17 2026
Altro

LLM On-Premise: Controllo, Costi e Sovranità dei Dati nell'Era dell'AI

L'adozione di Large Language Models (LLM) on-premise sta guadagnando terreno tra le aziende, spinte dalla necessità di maggiore controllo sui dati, compliance normativa e ottimizzazione del Total Cost of Ownership (TCO). Questo approccio self-hosted offre un'alternativa strategica alle soluzioni cloud, richiedendo un'attenta valutazione dei requisiti hardware, delle tecniche di ottimizzazione e delle implicazioni per la sovranità dei dati.

May 17 2026
Market

ASML equipaggerà il primo impianto di chip commerciale indiano da 11 miliardi di dollari

ASML, leader mondiale nelle apparecchiature per la litografia, fornirà la tecnicia essenziale per il primo impianto di produzione di chip commerciale dell'India. Situato a Dholera, il progetto da 11 miliardi di dollari mira a produrre 50.000 wafer al mese, segnando un passo cruciale per l'India verso l'autosufficienza nel settore dei semiconduttori e la riduzione della dipendenza dalle catene di approvvigionamento globali. L'iniziativa ha profonde implicazioni per la sovranità tecnicica e la sicurezza economica del paese.

May 17 2026
Altro

L'infrastruttura IT come pilastro per le performance aziendali e l'AI

Ogni azienda solida poggia su fondamenta robuste. L'infrastruttura IT, in particolare quella dedicata ai carichi di lavoro di Large Language Models (LLM), si rivela cruciale per sostenere la crescita, garantire efficienza operativa e massimizzare la produttività. Per le organizzazioni che valutano deployment on-premise, la scelta infrastrutturale è strategica per la sovranità dei dati e il Total Cost of Ownership (TCO).

May 17 2026
Altro

Iniezione di Prompt: quando i bot di LinkedIn parlano in Old English

Un utente ha sfruttato una tecnica di iniezione di prompt per manipolare i bot di reclutamento di LinkedIn, inducendoli a rispondere in prosa antica e a rivolgersi a lui come "My Lord". L'episodio evidenzia le vulnerabilità degli LLM e le sfide di sicurezza per le aziende che implementano soluzioni basate sull'intelligenza artificiale, sottolineando l'importanza di strategie di mitigazione robuste.

May 17 2026
LLM

ArXiv introduce un divieto di un anno per i paper generati da IA non verificati

ArXiv, il noto repository open-access per preprint scientifici, ha annunciato una nuova politica. Gli autori che sottoporranno articoli con evidenti segni di generazione automatica tramite intelligenza artificiale, senza adeguata revisione umana, saranno banditi per un anno. La misura, comunicata da Thomas Dietterich, mira a preservare l'integrità della ricerca distribuita sulla piattaforma da oltre trent'anni.

May 17 2026
Hardware

Mikron trasforma i wafer di silicio in opere d'arte da collezione

Mikron, produttore russo di semiconduttori, ha lanciato una linea di souvenir insoliti: wafer di silicio incorniciati, contenenti fino a 120.000 processori di test. Disponibili in dodici design diversi e venduti a circa 170 dollari l'uno, questi oggetti d'arte da parete sono accompagnati da fiale di aria di camera bianca a 2 dollari. Un'iniziativa che celebra la microelettronica in una forma inaspettata, trasformando il cuore della tecnicia in un pezzo da collezione.

May 17 2026
Market

Negoziati cruciali per Samsung: sciopero in fabbrica di chip minaccia la catena di fornitura

Samsung Electronics e il suo principale sindacato riprendono i negoziati in quella che il Primo Ministro sudcoreano ha definito "l'ultima possibilità" per evitare uno sciopero di 18 giorni. La potenziale interruzione nella produzione del più grande produttore mondiale di chip di memoria potrebbe avere ripercussioni significative sulla catena di fornitura globale, influenzando la disponibilità di hardware essenziale per i deployment AI on-premise.

May 17 2026
Market

Cerebras debutta sul Nasdaq con un'IPO da 5,55 miliardi di dollari, la più grande dal 2020

Cerebras Systems ha concluso il suo primo giorno di quotazione sul Nasdaq con una capitalizzazione di mercato di circa 95 miliardi di dollari, raccogliendo 5,55 miliardi. Si tratta della più grande IPO tecnicica statunitense dal 2020, evidenziando il crescente interesse del mercato per le aziende di hardware AI.

May 17 2026
Hardware

Un layer open source porta Reflex e Anti-Lag 2 su GPU AMD e Intel con Linux

Il progetto open source `low_latency_layer` introduce un layer Vulkan implicito che estende la compatibilità di tecnicie come AMD Anti-Lag 2 e NVIDIA Reflex 2. Questa soluzione, agnostica all'hardware e progettata per Linux, consente a schede grafiche AMD e Intel di sfruttare queste funzionalità di riduzione della latenza, superando le tradizionali limitazioni legate al produttore. Rappresenta un passo verso una maggiore flessibilità nell'utilizzo dell'hardware grafico in ambienti self-hosted.

May 17 2026
Market

Destinus punta a una quotazione da 5 miliardi di euro con un nuovo round di finanziamento

La startup olandese Destinus, attiva nel settore della difesa con la produzione di missili da crociera e droni autonomi, sta negoziando per raccogliere circa 200 milioni di euro. L'operazione precede una potenziale offerta pubblica iniziale (IPO), con l'azienda che mira a una valutazione superiore ai 5 miliardi di euro, basata su previsioni di ricavi annuali di circa 500 milioni di euro.

May 17 2026
LLM

Valutazione delle tecniche di "abliteration" per LLM: un'analisi su Qwen3.6-27B

Un'analisi approfondita ha confrontato cinque varianti "abliterated" del modello Qwen3.6-27B, impiegando 85 ore di GPU su una singola RTX 5090. Lo studio ha esaminato benchmark di capacità, sicurezza e modifiche a livello di pesi, rivelando come le diverse tecniche influenzino le performance e la rimozione dei contenuti indesiderati. Heretic e Huihui emergono per la migliore preservazione delle capacità, mentre altre mostrano compromessi significativi.

May 17 2026
Market

L'Offensiva Cinese nel Mercato Canadese dei Veicoli Elettrici

Il mercato canadese dei veicoli elettrici si prepara ad accogliere l'arrivo di modelli cinesi, con quasi 400 concessionari già in competizione per la loro distribuzione. Un dirigente del settore automobilistico canadese, Michael MacGillivray, ha espresso grande apprezzamento per la qualità dei materiali e la tecnicia osservata durante una recente visita al Salone dell'Auto di Pechino.

May 17 2026
Hardware

LineShine: il supercomputer cinese da 1.54 exaflops con 2.4 milioni di core Armv9

La Cina ha svelato LineShine, un supercomputer da 1.54 exaflops basato esclusivamente su CPU, equipaggiato con 2.4 milioni di core Armv9 progettati da Huawei. Questa architettura CPU-only rappresenta una risposta strategica alle restrizioni sulle GPU imposte dagli Stati Uniti, evidenziando un percorso alternativo per raggiungere elevate capacità di calcolo e rafforzare la sovranità tecnicica in settori critici come l'HPC e l'AI.

May 17 2026
Hardware

llama.cpp: Nuove Vette di Performance con Dual GPU e KV Cache Quantizzato

Un nuovo fork di llama.cpp risolve un problema di lunga data con il tensor parallelism, permettendo l'uso di KV cache quantizzati su configurazioni dual GPU. Questo porta a un incremento di oltre il 40% nelle prestazioni per l'inference di LLM, come dimostrato con un modello Qwen da 27B su hardware consumer. La soluzione è cruciale per chi cerca efficienza on-premise e un TCO ottimizzato.

May 17 2026
Market

Costi LLM: OpenClaw spende 1,3 milioni di dollari in un mese per API OpenAI

Il caso OpenClaw evidenzia i costi elevati dell'utilizzo intensivo di Large Language Models tramite API cloud. In un solo mese, il progetto ha sostenuto una spesa di 1,3 milioni di dollari per 603 miliardi di token e 7,6 milioni di richieste, gestite da 100 agenti di codifica. Questo episodio sottolinea l'importanza di valutare attentamente le strategie di deployment, confrontando i modelli basati su cloud con le alternative self-hosted per ottimizzare il TCO e la sovranità dei dati.

May 17 2026
LLM

Deepseek V4 e la finestra di contesto da 1M: limiti e opportunità pratiche

Un'analisi approfondita della finestra di contesto da 1 milione di token di Deepseek V4 rivela prestazioni solide fino a 150.000 token, ma una significativa degradazione della precisione e un'elevata latenza oltre i 300.000. I test su codebase reali evidenziano la necessità di tecniche di prompt engineering avanzate e di un layer di validazione per l'uso in produzione, sottolineando i compromessi critici per le aziende che valutano deployment on-premise di LLM con ampie finestre di contesto.

May 17 2026
Altro

Lightroom CC su Linux: un developer e Claude Code aprono nuove vie con Wine

Un developer open source, con il supporto di Claude Code, è riuscito a far funzionare Adobe Lightroom CC su Linux tramite Wine. Questo risultato evidenzia il potenziale delle soluzioni di compatibilità e dell'assistenza AI nel superare le barriere tra sistemi operativi proprietari e ambienti open source, offrendo nuove prospettive per il deployment di software professionali.

May 17 2026
Altro

La sovranità digitale nell'era dell'AI: implicazioni per i deployment on-premise

La recente dichiarazione di sovranità di Taiwan, sebbene di natura politica, solleva questioni più ampie sulla sovranità nell'era digitale. Per le aziende che adottano l'intelligenza artificiale, la sovranità dei dati e il controllo sull'infrastruttura diventano fattori critici. Questo articolo esplora come i deployment on-premise di Large Language Models (LLM) offrano soluzioni per affrontare le sfide di compliance, sicurezza e controllo strategico, analizzando i trade-off e le considerazioni infrastrutturali.

May 17 2026
Altro

Chatbot AI locale in valigia: Nvidia Jetson e Gemma 4 E4B per risposte in 200ms

Un innovatore ha realizzato "Suitcase Eyes", un chatbot AI portatile e completamente locale, integrato in una valigia. Alimentato da Nvidia Jetson e basato sul modello Gemma 4 E4B, il sistema offre risposte rapide con una latenza di soli 200 millisecondi, dimostrando il potenziale del deployment AI on-premise e all'edge per applicazioni che richiedono controllo dei dati e bassa latenza.

May 17 2026
Altro

Jensen Huang (Nvidia): 'Le GPU non sono armi nucleari', critica le restrizioni globali

Jensen Huang, CEO di Nvidia, ha criticato l'analogia che paragona le GPU ad armi nucleari, sostenendo che i governi dovrebbero consentire la vendita di queste tecnicie anche a paesi considerati 'avversari'. La dichiarazione, rilasciata durante un evento a Stanford, sottolinea la visione di Nvidia sulla diffusione globale delle GPU come strumenti di progresso tecnicico, piuttosto che come strumenti di conflitto, e solleva interrogativi sulle politiche di controllo delle esportazioni e il loro impatto sull'innovazione e la sovranità tecnicica.

May 17 2026
Altro

Ottimizzazione LLM on-premise: Llama.cpp e MTP su RTX 3090

Un'analisi pratica rivela come l'implementazione di Multi-GPU Tensor Parallelism (MTP) in llama.cpp possa migliorare significativamente i tempi di completamento per carichi di lavoro LLM con contesti ampi su una singola GPU NVIDIA RTX 3090. Nonostante un rallentamento nel prompt processing, la generazione di token più rapida porta a un risparmio di tempo complessivo del 41% per task che richiedono l'elaborazione di 85.000 token, evidenziando i trade-off nelle strategie di deployment on-premise.

May 17 2026
Frameworks

FluidX3D 3.7: Nuovi orizzonti per la fluidodinamica computazionale con OpenCL

FluidX3D, il software di fluidodinamica computazionale (CFD) accelerato da CPU e GPU tramite OpenCL, ha raggiunto la versione 3.7. Questo aggiornamento introduce significativi miglioramenti prestazionali, consolidando la sua posizione come strumento chiave per simulazioni complesse che sfruttano l'hardware locale. La capacità di ottimizzare le risorse computazionali on-premise è fondamentale per gli specialisti che cercano controllo e sovranità dei dati.

May 17 2026
Frameworks

Ottimizzazione dell'Inference LLM: Test del Supporto MTP di llama.cpp su RTX 5090

Un recente test ha esplorato il supporto Multi-Token Pre-fill (MTP) di `llama.cpp` su una GPU NVIDIA RTX 5090 con 32 GB di VRAM. L'analisi, condotta con modelli Qwen3.6 quantizzati, ha mirato a isolare l'impatto dell'MTP sull'efficienza dell'inference, un aspetto cruciale per i deployment on-premise di Large Language Models. La metodologia ha confrontato l'MTP abilitato e disabilitato, utilizzando prompt di diversa lunghezza per valutare le prestazioni.

May 17 2026
LLM

G4-Meromero-31B-Uncensored-Heretic: un LLM per compiti creativi

È stato rilasciato G4-Meromero-31B-Uncensored-Heretic, un LLM basato su Gemma 4 31B e ottimizzato per compiti creativi. Il modello, disponibile nei formati Safetensors e GGUF, presenta un basso tasso di rifiuto (15/100) e un KLD di 0.0100, suggerendo una maggiore flessibilità nella generazione di contenuti. La sua disponibilità in formati diversi lo rende adatto a vari scenari di deployment, inclusi quelli on-premise.

May 16 2026
Hardware

Adlink e l'AI Fisica: focus su robotica, sanità e semiconduttori

Adlink sta puntando sull'Intelligenza Artificiale fisica, integrando l'AI direttamente in sistemi tangibili per settori critici come la robotica, la sanità e i semiconduttori. Questo approccio richiede soluzioni edge e on-premise per garantire bassa latenza, sovranità dei dati e affidabilità, ponendo nuove sfide e opportunità per l'infrastruttura hardware e il deployment.

May 16 2026
Market

Aziende ottiche nel mercato degli smart snow goggles: nuove dinamiche nella supply chain

Le aziende ottiche stanno entrando nella supply chain degli smart snow goggles, un mercato caratterizzato da margini elevati. Questa mossa evidenzia l'evoluzione dei dispositivi “smart” e le crescenti esigenze tecniciche, inclusa la potenziale integrazione di capacità di intelligenza artificiale all'edge. L'espansione in settori ad alto valore aggiunto solleva interrogativi sulle implicazioni per la gestione dei dati, la sovranità e la complessità della catena di fornitura per l'hardware AI.

May 16 2026
Market

I produttori taiwanesi di chip colmano i vuoti nell'offerta di HBM

Il mercato globale dei semiconduttori vede i produttori taiwanesi di chip, come Nanya, intensificare la produzione di High Bandwidth Memory (HBM). Questa mossa mira a colmare le lacune nell'offerta lasciate da un maggiore focus coreano su altre aree, garantendo una fornitura cruciale per le GPU di nuova generazione e i deployment AI on-premise, dove la disponibilità e il TCO dell'hardware sono fattori determinanti.

← Precedente Page 42 / 143 Successiva →