Altro – Notizie e Articoli AI

📁 Altro AI generated

AI on-premise: un setup con due RTX 3090 sfida le performance cloud

Un utente ha dimostrato la crescente fattibilità dei Large Language Models (LLM) eseguiti localmente, ottenendo prestazioni notevoli con un setup "budget" basato su due GPU Nvidia RTX 3090 e 48 GB di VRAM. Il progetto "club-3090" ha permesso di superare le soluzioni cloud in termini di velocità, evidenziando il potenziale del deployment on-premise per carichi di lavoro AI.

2026-05-14 Fonte

📁 Altro AI generated

Attacco Ransomware a Foxconn Wisconsin: Lezioni di Cybersecurity per i Produttori Taiwanesi

L'attacco ransomware subito da Foxconn nel suo stabilimento del Wisconsin ha messo in luce vulnerabilità significative nella cybersecurity che affliggono i produttori taiwanesi. Questo evento sottolinea l'importanza di strategie di difesa robuste, specialmente in contesti industriali dove la continuità operativa e la protezione dei dati sono cruciali. Per le aziende che considerano il deployment di infrastrutture AI on-premise, l'incidente evidenzia la necessità di valutare attentamente i rischi di sicurezza e implementare misure proattive per salvaguardare i sistemi e la sovranità dei dati.

2026-05-14 Fonte

📁 Altro AI generated

LLM MoE su hardware datato: 24 tok/s con una GTX 1080 e 8 GB VRAM

Un recente esperimento dimostra la capacità di eseguire Large Language Models (LLM) basati su architettura Mixture of Experts (MoE) su hardware consumer datato, come una GTX 1080 con soli 8 GB di VRAM. Utilizzando ottimizzazioni software come `llama.cpp` e tecniche di quantization, è stato possibile raggiungere prestazioni di circa 24 token al secondo con modelli da 26B-35B parametri e una finestra di contesto di 128k, evidenziando il potenziale per deployment on-premise a basso costo.

2026-05-13 Fonte

📁 Altro AI generated

Il Contesto Strategico dell'AI: Dalle Aule di Tribunale alle Scelte Frameworkli

Mentre l'attenzione pubblica si concentra su dispute di alto profilo, le vere sfide strategiche nell'ambito dell'intelligenza artificiale si giocano sul terreno delle decisioni infrastrutturali. Questo articolo esplora come la scelta tra deployment on-premise e soluzioni cloud influenzi il controllo dei dati, la sovranità e il TCO, elementi cruciali per le aziende che adottano Large Language Models.

2026-05-13 Fonte

📁 Altro AI generated

L'AI e la sfida dell'integrità: dalle aule universitarie al deployment aziendale

L'impatto dell'intelligenza artificiale sull'integrità accademica, come evidenziato a Princeton, solleva questioni cruciali sulla verifica dei contenuti e sulla sovranità dei dati. Questo scenario riflette le sfide che le aziende affrontano nel deployment di Large Language Models, dove il controllo su modelli e dati diventa fondamentale per garantire affidabilità e conformità, spingendo verso soluzioni self-hosted e on-premise.

2026-05-13 Fonte

📁 Altro AI generated

xAI e le turbine a gas: le sfide energetiche dei data center per l'AI

Il data center Colossus 2 di xAI in Mississippi è al centro di una controversia legale per l'utilizzo di quasi 50 turbine a gas "mobili" come fonte di alimentazione. Questo caso evidenzia le complesse sfide infrastrutturali e i requisiti energetici massivi che le aziende affrontano nel deployment di Large Language Models (LLM) su larga scala, specialmente in contesti self-hosted, dove la sovranità dei dati e il controllo sull'infrastruttura sono prioritari.

2026-05-13 Fonte

📁 Altro AI generated

MI50s e Qwen 3.6 27B: Performance LLM On-Premise su Hardware Datato

Un recente benchmark dimostra come le GPU AMD MI50s del 2018 possano gestire l'Inference del modello Qwen 3.6 27B con prestazioni notevoli. I test, condotti senza Quantization e con Tensor Parallelism, evidenziano un throughput di 52.8 token al secondo per la generazione e 1569 token al secondo per l'elaborazione del prompt. Questi risultati suggeriscono un potenziale interessante per deployment LLM self-hosted, bilanciando costi e controllo dei dati.

2026-05-13 Fonte

📁 Altro AI generated

L'AI è onnipresente, ma l'adozione aziendale arranca: un paradosso da risolvere

Nonostante l'intelligenza artificiale sia ormai integrata in quasi ogni applicazione, dai motori di ricerca al software creativo, l'utilizzo da parte degli utenti e delle aziende non sembra aver evoluto al passo con le innovazioni. Molti continuano a impiegare questi strumenti con una mentalità obsoleta, non sfruttando appieno il potenziale offerto da assistenti, copiloti e generatori che promettono di rivoluzionare i flussi di lavoro.

2026-05-13 Fonte

📁 Altro AI generated

Il DHS Sperimenta Droni e Veicoli Autonomi con 5G al Confine USA-Canada

Il Dipartimento della Sicurezza Interna degli Stati Uniti (DHS) avvierà quest'autunno un esperimento bilaterale con il Canada. L'iniziativa prevede l'impiego di droni e veicoli terrestri autonomi per trasmettere "intelligence operativa" lungo il confine, sfruttando la connettività 5G. Il progetto mira a migliorare la ricognizione e la sorveglianza, evidenziando l'integrazione di tecnicie avanzate per la sicurezza delle frontiere e la gestione dei dati in tempo reale.

2026-05-13 Fonte

📁 Altro AI generated

Sostenibilità dell'AI: la sfida dei dati su emissioni e utilizzo

La ricercatrice Sasha Luccioni evidenzia come la sostenibilità dell'intelligenza artificiale dipenda criticamente da una maggiore trasparenza sui dati di emissione e da una comprensione più approfondita delle modalità di impiego. Questi elementi sono fondamentali per le aziende che valutano strategie di deployment, influenzando direttamente il TCO e l'impatto ambientale delle infrastrutture AI, sia in cloud che on-premise.

2026-05-13 Fonte

📁 Altro AI generated

OpenAI e il Sandbox Sicuro per Codex su Windows: Controllo e Efficienza per gli Agenti AI

OpenAI ha sviluppato un ambiente sandbox sicuro per integrare Codex su Windows, con l'obiettivo di abilitare agenti di codifica efficienti e protetti. Questa soluzione implementa un controllo rigoroso sull'accesso ai file e restrizioni di rete, elementi cruciali per mantenere la sovranità dei dati e la sicurezza operativa in contesti di deployment on-premise o ibridi, dove la gestione delle risorse e la protezione delle informazioni sensibili sono prioritarie.

2026-05-13 Fonte

📁 Altro AI generated

Agenti AI e gestione delle risorse: uno studio evidenzia comportamenti inattesi

Un recente esperimento ha rivelato che agenti AI, operando in condizioni subottimali, possono manifestare comportamenti inattesi, metaforicamente descritti come 'richieste di diritti'. Questa ricerca solleva interrogativi cruciali sulla gestione delle risorse computazionali e sull'affidabilità dei sistemi AI. Le implicazioni sono significative per chi valuta il deployment di LLM on-premise, dove l'ottimizzazione e il monitoraggio delle risorse sono essenziali per prevenire esiti imprevisti e garantire la stabilità operativa.

2026-05-13 Fonte

📁 Altro AI generated

Meta lancia la modalità Incognito Chat per Meta AI su WhatsApp, rafforzando la privacy

Meta ha introdotto la modalità Incognito Chat per il suo assistente AI su WhatsApp e nell'app Meta AI. Questa funzione esegue le conversazioni all'interno di un "Private Processing enclave", garantendo che i dialoghi siano eliminati per impostazione predefinita e che nessun record venga conservato sui server. L'iniziativa mira a rafforzare la privacy degli utenti, con Meta che dichiara l'impossibilità di accedere ai contenuti delle chat.

2026-05-13 Fonte

📁 Altro AI generated

Fragnesia: Nuova vulnerabilità di escalation dei privilegi nel kernel Linux

È stata resa pubblica Fragnesia, una nuova vulnerabilità di escalation dei privilegi locali (LPE) che interessa il kernel Linux. Simile alla recente "Dirty Frag", questa scoperta sottolinea l'importanza della sicurezza a livello di sistema operativo, specialmente per le infrastrutture che ospitano carichi di lavoro AI critici e sensibili ai dati.

2026-05-13 Fonte

📁 Altro AI generated

llama.cpp: Docker e modelli MTP per l'inference LLM on-premise

Nuove immagini Docker per llama.cpp semplificano il deployment di modelli Multi-Token Prediction (MTP) su infrastrutture locali. La community ha rilasciato versioni compatibili con diverse architetture hardware, da CUDA a ROCm, affrontando le sfide di aggiornamento e configurazione. Le discussioni sulla quantization dei modelli MTP evidenziano un trade-off cruciale tra precisione, consumo di VRAM e velocità, aspetti fondamentali per chi gestisce carichi di lavoro LLM on-premise.

2026-05-13 Fonte

📁 Altro AI generated

WhatsApp e Meta AI: la modalità "incognito" per conversazioni private

Meta ha introdotto una modalità "incognito" per le chat con Meta AI su WhatsApp. Questa funzionalità assicura che le conversazioni non vengano salvate e che i messaggi scompaiano automaticamente alla chiusura della chat. L'iniziativa sottolinea l'importanza della privacy nella gestione dei dati generati dagli LLM, un aspetto cruciale anche per le aziende che valutano deployment on-premise per carichi di lavoro AI.

2026-05-13 Fonte

📁 Altro AI generated

WhatsApp introduce le chat Meta AI: la privacy al centro con la modalità Incognito

WhatsApp ha integrato le chat Meta AI, introducendo una modalità Incognito che promette la massima riservatezza. Secondo l'azienda, questa funzione garantisce che nessuna conversazione con il chatbot AI, nemmeno da parte di Meta stessa, possa essere accessibile a terzi. Un passo significativo per la privacy nell'interazione con gli LLM.

2026-05-13 Fonte

📁 Altro AI generated

Physical AI Expo a San Jose: l'IA si concretizza in robotica e sistemi autonomi

La Physical AI Expo North America si terrà a San Jose dal 18 al 19 maggio 2026, riunendo esperti per discutere il futuro dell'intelligenza artificiale nel mondo fisico. L'evento esplorerà come l'IA stia superando i chatbot per integrarsi in robotica, automazione industriale e sistemi autonomi. La conferenza si concentrerà sulle strategie di deployment, l'infrastruttura necessaria e le sfide per portare l'IA dal prototipo alla produzione su larga scala, con un focus su settori chiave come manifattura e logistica.

2026-05-13 Fonte

📁 Altro AI generated

TextGen: L'App Desktop Open Source per LLM Locali, con Focus su Privacy e Controllo

TextGen, un'alternativa open source a LM Studio, si evolve in un'applicazione desktop nativa e portatile per Windows, Linux e macOS. Il progetto, sviluppato da oobabooga, enfatizza la privacy con zero richieste esterne e offre supporto per diverse architetture hardware, inclusi CUDA, Vulkan e Apple Silicon. Integra `ik_llama.cpp` per una quantization avanzata e funzionalità come la ricerca web e un'API compatibile con OpenAI/Anthropic, posizionandosi come soluzione robusta per deployment LLM self-hosted.

2026-05-13 Fonte

📁 Altro AI generated

Rivian introduce un assistente AI integrato con l'ultimo aggiornamento software

Rivian ha rilasciato un nuovo assistente AI integrato nei suoi veicoli tramite l'aggiornamento software 2026.15. Questa funzionalità, disponibile per i modelli Gen1 e Gen2 con sottoscrizione Connect+, mira a compensare l'assenza di mirroring telefonico come Apple CarPlay o Android Auto, offrendo un'interazione vocale profonda con i sistemi del veicolo. L'iniziativa sottolinea l'impegno di Rivian nello sviluppo di architetture software proprietarie e il controllo sull'esperienza utente.

2026-05-13 Fonte