AI-RADAR.IT · AI-RADAR.NET · AI-RADAR.TECH

News & analisi per LLM locali, stack e hardware on-prem.

📁 Hardware AI generated

Chip fotonico per KV cache: seleziona 944x più veloce, consuma 18.000x meno

Pubblicato il 2026-03-23 12:27 ℹ️ LocalLLaMA 📰 Leggi l'articolo originale →

🏷️ Hardware 🏷️ LLM On-Premise 🏷️ DevOps

Chip fotonico per KV cache: seleziona 944x più veloce, consuma 18.000x meno

Chip fotonico per accelerare la KV cache

Un nuovo approccio per accelerare la selezione dei blocchi nella KV cache dei modelli linguistici di grandi dimensioni (LLM) è stato proposto da un ricercatore nel campo della nanofotonica. La soluzione si basa sull'utilizzo di un chip fotonico, denominato PRISM, che promette di superare i limiti delle tradizionali scansioni GPU.

PRISM: scansione ottica O(1)

Il metodo PRISM sostituisce la scansione lineare (O(N)) dei blocchi della KV cache con una trasmissione ottica. La query viene codificata come luce e suddivisa simultaneamente in tutti gli N blocchi tramite uno splitter passivo. La similarità viene calcolata istantaneamente, rendendo la selezione indipendente dalla dimensione del contesto (O(1)).

Performance e consumi

Simulazioni su chip fotonici TFLN indicano un miglioramento di 944 volte nella velocità di selezione e una riduzione di 18.000 volte nel consumo energetico rispetto alle scansioni GPU con un contesto di 1 milione di token. In scenari con 100 milioni di token, PRISM si dimostra 5.3 volte più veloce rispetto a Quest (batch=128, Qwen2.5-7B) nel processo di decodifica totale.

Per chi valuta deployment on-premise, esistono trade-off da considerare attentamente. AI-RADAR offre framework analitici su /llm-onpremise per supportare queste valutazioni.

Takeaway AI-Radar

Un dottorando in nanofotonica ha progettato un chip fotonico per accelerare la selezione dei blocchi nella KV cache, un collo di bottiglia nelle applicazioni di modelli linguistici di grandi dimensioni (LLM). La soluzione, denominata PRISM, promette prestazioni superiori e consumi energetici drasticamente inferiori rispetto alle scansioni GPU tradizionali, specialmente in scenari con contesti ampi.

🤖 Chiedi all'AI di questo argomento

Vuoi approfondire? Leggi l'articolo completo dalla fonte:

📖 VAI ALLA FONTE ORIGINALE

💻 Hai bisogno di infrastruttura GPU cloud?

Per eseguire inferenza LLM, training di modelli o testare configurazioni hardware, dai un'occhiata a questa piattaforma:

RunPod Piattaforma GPU Cloud

Cloud GPU flessibile con fatturazione al secondo. Deploy istantaneo con supporto Docker, auto-scaling e ampia selezione di GPU da RTX 4090 a H100.

✓ Nessun vincolo ✓ Deploy istantaneo ✓ Pronto produzione

🔗 Questo è un link affiliato - potremmo ricevere una commissione senza costi aggiuntivi per te.

AI-RADAR NEWSLETTER

Resta aggiornato — segnali AI nella tua inbox

Digest giornaliero o settimanale delle notizie AI più importanti. 160+ lettori, zero spam.

💬 Commenti (0)

🔒 Accedi o registrati per commentare gli articoli.

Nessun commento ancora. Sii il primo a commentare!

🔍 Continua a esplorare

Approfondisci su LLM On-Premise

Guida completa per eseguire modelli AI in locale: hardware, stack e privacy.

La Cina inaugura il primo laboratorio di calcolo fotonico per l'indipendenza dai chip

Hardware Jun 12

La Cina inaugura il primo laboratorio di calcolo fotonico per l'indipendenza dai chip

La Cina ha aperto a Shanghai il suo primo laboratorio dedicato al calcolo fotonico, segnalando un investimento strategico nei chip basati sulla luce. L'iniziati

Neurophos: chip fotonico 10.000 volte più piccolo

Hardware Jan 26

Neurophos: chip fotonico 10.000 volte più piccolo

La startup Neurophos, supportata da Bill Gates, ha sviluppato un chip di fotonica al silicio che promette prestazioni superiori alle GPU Nvidia Vera Rubin, cons

Fotonica del silicio, l'Europa frena sulla prototipazione: il report che scuote la filiera

Fotonica del silicio, l'Europa frena sulla prototipazione: il report che scuote la filiera

Un'indagine su 500 decisori in cinque Paesi mostra che il 59% ritiene insufficienti le infrastrutture per passare dalla ricerca al mercato. L'accesso alle fonde

Lightelligence: i chip fotonici per l'AI e la quotazione a Hong Kong

Hardware May 03

Lightelligence: i chip fotonici per l'AI e la quotazione a Hong Kong

Yichen Shen, fisico del MIT e fondatore di Lightelligence, sta guidando la sua azienda, specializzata in chip fotonici per l'intelligenza artificiale, verso una

InPsytech e l'era dei chiplet: connettività AI al centro dell'attenzione

Hardware May 26

InPsytech e l'era dei chiplet: connettività AI al centro dell'attenzione

L'ascesa della tecnicia chiplet sta evidenziando l'importanza cruciale delle soluzioni avanzate di connettività per l'intelligenza artificiale. In questo scenar

Altri articoli in Hardware

Intel Nova Lake: 52 core e fino a 474W per il desktop di nuova generazione

4090 e 5090 con 96 GB di VRAM? L'alert dal mondo dei laboratori GPU

Dal mercato di Shenzhen una RTX 5090 con 96 GB di VRAM: costa 8.200 dollari

Chip AI: la strozzatura logistica minaccia i piani on-premise

JCET investe 1,1 miliardi: la svolta cinese per i chip AI passa dal packaging

Wiwynn e TE Connectivity raffreddano a liquido le sbarre DC a 800V per i datacenter AI

→ Vedi tutti in Hardware →

AI-Radar LLM On-Premise

Guida completa per eseguire modelli AI in locale: hardware, stack, privacy e architetture di riferimento.

👥 Unisciti a 160+ appassionati di AI

Una community gratuita di sviluppatori, ingegneri e appassionati di AI — newsletter, commenti, radar settimanale.

Iscriviti gratis → Hai già un account? Accedi