Topic / Trend Rising

Integrazione dell'AI nel Business e nell'Industria

Aziende in diversi settori stanno integrando sempre più l'AI per automatizzare le attività, migliorare l'efficienza e ottimizzare il processo decisionale. Questa tendenza spazia dall'assistenza sanitaria e dalla finanza alla produzione e al servizio clienti, indicando un'ampia adozione di soluzioni AI.

Detected: 2026-02-09 · Updated: 2026-02-09

Articoli Correlati

2026-02-09 LocalLLaMA

GLM-5 in Arrivo: Indizi nel codice di vLLM

Indiscrezioni sul prossimo modello linguistico GLM-5 emergono da una pull request relativa a vLLM, un framework per l'inference di LLM. La notizia, diffusa inizialmente su Reddit, suggerisce che il nuovo modello potrebbe presto essere integrato e dis...

#Hardware #LLM On-Premise #DevOps
2026-02-09 DigiTimes

OpenClaw e Cowork competono per agenti AI desktop in Cina

Le aziende cinesi OpenClaw e Cowork stanno sviluppando agenti AI desktop, segnalando una crescente competizione nel settore dell'intelligenza artificiale per applicazioni locali. Questa tendenza riflette un interesse per soluzioni AI che possono oper...

#LLM On-Premise #DevOps
2026-02-09 LocalLLaMA

Errori di Temporizzazione nell'Inference di LLM: Un'Analisi

Un post su Reddit mette in luce come errori di temporizzazione possano compromettere l'inference di modelli linguistici di grandi dimensioni (LLM). L'immagine allegata suggerisce una problematica legata alla sincronizzazione o alla gestione dei tempi...

#LLM On-Premise #DevOps
2026-02-09 DigiTimes

Crescita di CHPT trainata dal Nord America: focus sui guadagni trimestrali

Secondo Digitimes, la crescita di CHPT nel 2026 sarà guidata principalmente dalla domanda proveniente dal Nord America. L'azienda punta a migliorare i risultati trimestrali, concentrandosi sull'espansione del mercato e sull'ottimizzazione delle opera...

#LLM On-Premise #DevOps
2026-02-09 DigiTimes

MediaTek punta sui 2nm di TSMC e sull'AI computing

MediaTek si prepara ad adottare i processi a 2nm e A14 di TSMC, con un focus sull'incremento della potenza di calcolo per l'intelligenza artificiale. Questa mossa strategica mira a posizionare MediaTek come leader nel settore dei chip ad alte prestaz...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-09 DigiTimes

LG CNS adotta NPU FuriosaAI per servizi AI enterprise in Corea

LG CNS collabora con FuriosaAI per integrare le NPU (Neural Processing Unit) di quest'ultima nei propri servizi di intelligenza artificiale enterprise. Questa partnership mira a sfruttare l'hardware AI sviluppato in Corea del Sud per migliorare le pr...

#Hardware #LLM On-Premise #DevOps
2026-02-09 ArXiv cs.CL

Decodifica contrastiva multi-contesto per il Visual Question Answering

Un nuovo metodo di decodifica, RMCD, migliora i Large Vision Language Models (LVLM) integrando contesti multipli da knowledge base esterne. RMCD pesa i contesti in base alla loro rilevanza, aggregando informazioni utili ed attenuando gli effetti nega...

#Fine-Tuning #RAG
2026-02-09 ArXiv cs.CL

Nuovi slogan pubblicitari? L'AI riscrive citazioni famose

La creazione di slogan pubblicitari efficaci è cruciale, ma la ripetitività ne riduce l'impatto. Un nuovo studio esplora l'uso di modelli linguistici di grandi dimensioni (LLM) per rielaborare citazioni famose, bilanciando novità e familiarità. L'obi...

2026-02-09 ArXiv cs.LG

EVE: un framework per risposte complete e affidabili da LLM

Un nuovo framework, EVE, affronta i limiti degli LLM nel fornire risposte complete e fedeli basate su un singolo documento. EVE utilizza un approccio strutturato che migliora significativamente il richiamo, la precisione e l'F1-score, superando il co...

2026-02-09 ArXiv cs.AI

Jackpot: campionamento efficiente per RL e LLM

Ricercatori propongono Jackpot, un framework per il reinforcement learning (RL) con LLM. Jackpot utilizza un campionamento di reiezione con budget ottimale (OBRS) per ridurre la discrepanza tra il modello di rollout e la policy in evoluzione, miglior...

2026-02-09 LocalLLaMA

Un milione di file Epstein in formato testo per analisi locale

Rilasciato un dataset di un milione di file relativi al caso Epstein, convertiti in formato testo tramite OCR. I file, compressi in 12 archivi ZIP per un totale di meno di 2GB, sono pensati per l'analisi tramite LLM in locale. Previsto miglioramento ...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-09 The Register AI

Hyderabad: proposta di carta d'identità per agenti AI

Il commissario di polizia della città indiana di Hyderabad ha proposto di rilasciare carte d'identità, o equivalenti digitali, per gli agenti di intelligenza artificiale. La proposta mira a regolamentare e tracciare le attività degli agenti AI nella ...

#LLM On-Premise #DevOps
2026-02-09 LocalLLaMA

WokeAI rilascia tre nuovi modelli LLM 'Tankie' open source

Il gruppo WokeAI ha annunciato il rilascio di tre nuovi modelli linguistici di grandi dimensioni (LLM) open source, denominati 'Tankie', progettati per l'analisi ideologica e la critica delle strutture di potere. I modelli sono disponibili su Hugging...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-09 LocalLLaMA

StepFun: in arrivo Step-3.5-Flash-Base e novità per il capodanno cinese

Il team di StepFun AI ha annunciato l'imminente rilascio di Step-3.5-Flash-Base e anticipa ulteriori sorprese in occasione del capodanno cinese. Sono in corso discussioni con NVIDIA sull'utilizzo di NVFP4 e ottimizzazioni per la gestione dei token.

#Hardware #LLM On-Premise #DevOps
2026-02-09 DigiTimes

Tower Semiconductor e Nvidia: moduli ottici 1.6T per data center AI

Tower Semiconductor e Nvidia collaborano per sviluppare moduli ottici da 1.6T destinati a migliorare le prestazioni delle reti nei data center AI. Questa tecnicia promette di accelerare significativamente il trasferimento dati, cruciale per le applic...

#Hardware #LLM On-Premise #DevOps
2026-02-09 DigiTimes

Investimenti AI minacciano i flussi di cassa delle Big Tech

L'accelerazione degli investimenti nel settore dell'intelligenza artificiale sta mettendo sotto pressione i flussi di cassa delle principali aziende tecniciche. La necessità di sostenere la crescente domanda di risorse computazionali per l'addestrame...

#Hardware
2026-02-09 LocalLLaMA

Alternative a Open WebUI con UX migliorata: la sfida dell'usabilità

Un utente segnala difficoltà di configurazione e usabilità con Open WebUI, in particolare nella gestione dei tool. La discussione si concentra sulla ricerca di alternative che offrano un'esperienza utente più intuitiva e meno complessa per l'interazi...

#LLM On-Premise #DevOps
2026-02-09 DigiTimes

Wistron: crescita dell'IA non ancora in fase di bolla

Il presidente di Wistron, Simon Lin, ritiene che la crescita dell'intelligenza artificiale sia in una fase iniziale e che i timori di una bolla speculativa siano prematuri. L'azienda prevede un'ulteriore espansione nel settore, con un focus sull'inno...

2026-02-09 LocalLLaMA

Supporto a Qwen3.5 integrato in llama.cpp

L'integrazione del supporto per il modello linguistico Qwen3.5 in llama.cpp è stata completata. Questa aggiunta permette di eseguire e sperimentare con Qwen3.5 direttamente su hardware locale, aprendo nuove possibilità per sviluppatori e ricercatori ...

#Hardware #LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

MiniMax M2.2 in Arrivo: Indizi nel Codice

Indiscrezioni sul modello linguistico MiniMax M2.2 emergono dall'analisi del codice del sito web. La scoperta, segnalata su Reddit, suggerisce un imminente rilascio del modello. Ulteriori dettagli sulle capacità e sulle specifiche tecniche restano al...

#LLM On-Premise #DevOps
2026-02-08 DigiTimes

Taiwan: ordini CSP e spazio trainano la filiera nel 2026

La filiera tecnicica di Taiwan prevede un inizio 2026 positivo, grazie alla domanda da parte dei fornitori di servizi cloud (CSP) e alla crescita del settore aerospaziale. Questi fattori compensano le incertezze economiche globali, sostenendo la prod...

#LLM On-Premise #DevOps
2026-02-08 DigiTimes

Budget indiano punta su AI e semiconduttori: le implicazioni

Il budget annuale dell'India prevede un forte impulso all'ecosistema dell'intelligenza artificiale e dei semiconduttori. L'iniziativa mira a posizionare l'India come hub tecnicico globale, con investimenti mirati in ricerca e sviluppo, infrastrutture...

#LLM On-Premise #DevOps
2026-02-08 DigiTimes

Boom dell'AI spinge la crescita di Taiwan ai massimi da 15 anni

La crescita economica di Taiwan accelera grazie alla forte domanda nel settore dell'intelligenza artificiale, superando i timori di delocalizzazione. L'aumento della domanda di semiconduttori ad alte prestazioni, essenziali per i carichi di lavoro AI...

#Fine-Tuning
2026-02-08 Phoronix

Linux 6.19: supporto migliorato per GPU AMD datate e pipeline colore DRM

Linus Torvalds ha annunciato il rilascio del kernel Linux 6.19, la prima release importante del 2026. Questa versione include miglioramenti per le GPU AMD più datate e una nuova API per la pipeline colore DRM. L'aggiornamento promette di ottimizzare ...

#Hardware #LLM On-Premise
2026-02-08 LocalLLaMA

Visualizzazione interattiva di modelli LLM in formato GGUF

Un appassionato ha sviluppato uno strumento per visualizzare l'architettura interna dei modelli linguistici di grandi dimensioni (LLM) salvati in formato .gguf. L'obiettivo è rendere più trasparente la struttura di questi modelli, tradizionalmente co...

#LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Cluster AMD Strix Halo: Inference LLM Distribuita con RDMA RoCE v2

Un cluster a due nodi basato su AMD Strix Halo, interconnesso tramite Intel E810 (RoCE v2), è stato realizzato per l'inference distribuita di LLM utilizzando Tensor Parallelism. I benchmark e la guida alla configurazione sono disponibili online, apre...

#Hardware #LLM On-Premise #DevOps
2026-02-08 TechCrunch AI

Crypto.com investe 70 milioni di dollari nel dominio AI.com

La piattaforma di scambio di criptovalute Crypto.com ha acquisito il dominio AI.com per 70 milioni di dollari. L'operazione stabilisce un nuovo record per l'acquisto di un dominio, evidenziando l'interesse del settore crypto verso l'intelligenza arti...

#LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Benchmark di LLM: Qwen MoE supera LLaMA-70B in neuroscienze

Un nuovo benchmark nel campo delle neuroscienze e delle interfacce cervello-computer (BCI) rivela che il modello Qwen3 235B MoE supera le prestazioni di LLaMA-3.3 70B. I risultati evidenziano un limite di accuratezza condiviso tra diversi modelli, su...

#LLM On-Premise #DevOps
2026-02-08 TechCrunch AI

Progetto AI 'Magnificent Ambersons': Reazioni contrastanti

Un progetto di intelligenza artificiale denominato 'Magnificent Ambersons' suscita reazioni contrastanti. Nonostante alcune preoccupazioni iniziali, l'iniziativa sembra aver mitigato parte dello scetticismo, pur rimanendo oggetto di dibattito.

2026-02-08 Phoronix

Intel abbandona diversi progetti open source: cosa succede?

Intel ha recentemente archiviato o interrotto una ventina di progetti open source precedentemente mantenuti. La decisione segue l'archiviazione del progetto "SDSi" On Demand, sollevando interrogativi sulla strategia open source del gigante dei chip.

#Hardware #LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Ottimizzazioni in corso per llama.cpp

Un utente ha segnalato su Reddit un'attività in corso su GitHub relativa a miglioramenti per llama.cpp, un framework per l'inference di modelli linguistici di grandi dimensioni. I dettagli specifici dei miglioramenti non sono forniti, ma l'attività s...

#Hardware #LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

StepFun 3.5 Flash vs MiniMax 2.1: confronto su Ryzen

Un utente confronta le performance di StepFun 3.5 Flash e MiniMax 2.1, due modelli linguistici di grandi dimensioni (LLM), su una piattaforma AMD Ryzen. L'analisi si concentra sulla velocità di elaborazione e sull'utilizzo della VRAM, evidenziando i ...

#Hardware #LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

LLM non censurato genera risposte inattese

Un utente di un modello linguistico di grandi dimensioni (LLM) non censurato ha condiviso un'esperienza curiosa. Prima di fornire istruzioni specifiche, l'utente ha chiesto al modello cosa volesse fare, ottenendo una risposta inaspettatamente innocen...

#LLM On-Premise #DevOps
2026-02-08 Tom's Hardware

Nvidia nega l'uso di libri piratati per addestrare i suoi modelli AI

Nvidia contesta le accuse di aver utilizzato materiale protetto da copyright, nello specifico libri provenienti da Anna's Archive, per l'addestramento dei suoi modelli di intelligenza artificiale. L'azienda ha chiesto il rigetto della causa intentata...

#Hardware #LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Verity: motore di ricerca AI locale stile Perplexity per PC AI

Verity è un motore di ricerca e risposta AI che funziona interamente in locale su PC dotati di AI, sfruttando CPU, GPU e NPU. Ottimizzato per PC AI Intel con OpenVINO e Ollama, offre ricerca self-hosted tramite SearXNG e risposte basate su fatti.

#Hardware #LLM On-Premise #DevOps
2026-02-08 Tom's Hardware

Un Mac Retro con Stampante Termica e 'Cervello' da Mac Mini

Un appassionato ha modificato un vecchio Apple Mac integrando una stampante termica al posto del floppy disk drive. La macchina beneficia anche di un trapianto di 'cervello' grazie all'aggiunta di un Mac Mini.

#Hardware #LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Tandem: workspace AI open-source e locale con Rust e SQLite

Uno sviluppatore ha creato Tandem, un ambiente di lavoro AI che gira interamente in locale, senza inviare dati al cloud. La soluzione utilizza Rust, Tauri e sqlite-vec, offrendo un'alternativa leggera alle applicazioni Python/Electron. Supporta model...

#LLM On-Premise #DevOps #RAG
2026-02-08 Phoronix

Intel QATlib 26.02: nuove API per DMA zero-copy

Intel ha rilasciato QATlib 26.02, l'ultima versione della sua libreria user-space per sfruttare la tecnicia QuickAssist (QAT) su hardware compatibile. Questa release introduce nuove API per DMA zero-copy, migliorando le prestazioni di compressione e ...

#Hardware #LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Critiche al marketing di Anthropic: solo allarmismo sull'open source?

Un post su Reddit critica aspramente le strategie di marketing di Anthropic, accusandola di focalizzarsi eccessivamente sulla denigrazione dell'open source e sulla diffusione di timori infondati riguardo ai rischi dell'intelligenza artificiale. L'art...

#LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

LLM locali: sviluppare e ricerca le applicazioni più comuni

Un utente di LLM locali condivide la propria esperienza nell'utilizzo di questi modelli per attività di sviluppo e ricerca, sollecitando la community a condividere ulteriori applicazioni e casi d'uso. La discussione si concentra sui vantaggi dell'ese...

#LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Llama.cpp: "--fit" accelera Qwen3-Coder-Next su RTX 3090

Un utente ha riscontrato miglioramenti significativi nelle prestazioni di Qwen3-Coder-Next utilizzando l'opzione "--fit" in Llama.cpp su una configurazione dual RTX 3090. I risultati indicano un potenziale incremento di velocità rispetto all'opzione ...

#Hardware #LLM On-Premise #DevOps
2026-02-07 DigiTimes

Musk: la velocità, non l'ambizione, guiderà la prossima fase dell'IA

Secondo Elon Musk, la velocità di esecuzione, più che l'ambizione pura, sarà il fattore determinante nella prossima fase di espansione dell'intelligenza artificiale. L'articolo, basato su fonti AFP, non fornisce dettagli specifici su modelli, hardwar...

#LLM On-Premise #DevOps
2026-02-07 DigiTimes

Nvidia e Dassault Systèmes: AI per il mondo fisico

Nvidia e Dassault Systèmes intensificano la loro collaborazione per integrare l'intelligenza artificiale nel mondo della progettazione e simulazione fisica. L'obiettivo è migliorare i processi di sviluppo prodotto e accelerare l'innovazione in divers...

#Hardware #LLM On-Premise #DevOps
2026-02-07 DigiTimes

Tormente di neve in Giappone minacciano la fornitura di chip AI

Le intense tempeste di neve in Giappone mettono a rischio le catene di approvvigionamento dei chip per l'intelligenza artificiale. La situazione potrebbe impattare la produzione e la distribuzione di componenti essenziali per il settore.

#LLM On-Premise #DevOps
2026-02-07 DigiTimes

AMD punta su fotonica e architetture modulari per l'AI

AMD investe in tecnicie di fotonica e architetture modulari, segnalando un cambiamento nello sviluppo dell'infrastruttura AI. Questa mossa strategica potrebbe portare a soluzioni più efficienti e scalabili per i carichi di lavoro di intelligenza arti...

#Hardware #LLM On-Premise #DevOps
2026-02-07 DigiTimes

Robotica e AI: la supply chain si riorganizza

L'integrazione dell'intelligenza artificiale nella robotica sta portando a una riorganizzazione della supply chain. I fornitori di robotica ampliano le loro competenze per includere capacità di AI, mentre le aziende tech cercano di posizionarsi in qu...

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Prompt di Sistema Completo per Claude Opus 4.6

Un utente ha condiviso su Reddit un prompt di sistema completo per Claude Opus 4.6, il modello di Anthropic. Il prompt è disponibile su GitHub e offre uno sguardo approfondito sulla configurazione interna del modello.

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

DeepSeek V3.2: risultati AIME 2026 superiori al 90% con costi minimi

I risultati del benchmark AIME 2026 mostrano performance elevate, superiori al 90%, sia per modelli chiusi che open source. In particolare, DeepSeek V3.2 si distingue per un costo di esecuzione dell'intero test di soli 0,09 dollari, aprendo nuove pro...

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Prompt injection: vulnerabilità critica per LLM self-hosted

Un utente segnala una grave vulnerabilità di prompt injection in un sistema LLM self-hosted. Durante i test, un prompt malevolo ha esposto l'intero prompt di sistema, evidenziando la mancanza di difese adeguate contro questo tipo di attacco. Le tradi...

#LLM On-Premise #DevOps
2026-02-07 DigiTimes

Chicony Power punta su AI e piattaforme low-carbon, oltre i PC

Chicony Power diversifica il suo business, puntando su soluzioni per l'intelligenza artificiale e piattaforme a basse emissioni di carbonio. L'azienda mira a espandere il proprio raggio d'azione oltre il tradizionale mercato dei PC, intercettando nuo...

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Prompt di sistema di Gemini Pro estratto da un utente

Un utente Reddit ha estratto il prompt di sistema utilizzato da Google per Gemini Pro, dopo la rimozione dell'opzione "PRO" per gli abbonati a pagamento, principalmente in Europa, a seguito di A/B testing. Il prompt è stato condiviso sulla piattaform...

#LLM On-Premise #DevOps
2026-02-07 TechCrunch AI

New York valuta moratoria di tre anni sui nuovi data center

Lo stato di New York sta considerando una moratoria di tre anni sulla costruzione di nuovi data center. New York è almeno il sesto stato a valutare una simile misura, sebbene le prospettive del disegno di legge rimangano incerte.

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Benchmark LLM: tempo totale di attesa vs. token al secondo

Un utente di LocalLLaMA ha sviluppato un metodo di benchmarking alternativo per valutare le prestazioni reali dei modelli linguistici di grandi dimensioni (LLM) in locale. Invece di concentrarsi sui token generati al secondo, il benchmark misura il t...

#Hardware #LLM On-Premise #DevOps
2026-02-07 Tom's Hardware

Intel Arc A380: XeSS 3 aumenta le prestazioni in Cyberpunk 2077

La GPU Intel Arc A380, potenziata dalla tecnicia XeSS 3 e con 6GB di VRAM, raggiunge i 140 FPS a 1080p con impostazioni grafiche basse in Cyberpunk 2077. Un significativo miglioramento prestazionale ottenuto tramite ottimizzazione software.

#Hardware #LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Apple M5 Max e Ultra in arrivo? Indiscrezioni sul nuovo hardware

Indiscrezioni suggeriscono l'imminente rilascio dei chip M5 Max e, potenzialmente, M5 Ultra di Apple. I nuovi chip potrebbero essere rilasciati contestualmente all'aggiornamento del sistema operativo macOS 26.3. Resta da vedere se Apple opterà per un...

#Hardware
2026-02-07 LocalLLaMA

Monitoraggio LLM on-premise con Grafana, Prometheus e DCGM

Un utente ha implementato un sistema di monitoraggio completo per il proprio server LLM domestico, utilizzando Grafana, Prometheus e DCGM per tenere traccia di parametri come l'utilizzo della GPU, il consumo energetico e le velocità di elaborazione d...

#Hardware #LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

DoomsdayOS: LLM locale su chiavetta USB per Thinkpad

Un utente ha dimostrato DoomsdayOS, un sistema operativo all-in-one avviabile da USB, su un Thinkpad T14s. Include LLM, Wikipedia e runtime, pensato per operare in scenari offline o di emergenza. Il codice sorgente è disponibile su GitHub.

#LLM On-Premise #DevOps
2026-02-07 Tom's Hardware

Intel Arrow Lake Refresh: verdetto il 23 marzo?

Indiscrezioni suggeriscono che Intel potrebbe annunciare la serie Arrow Lake Refresh il 23 marzo. L'assenza del Core Ultra 9 290K Plus dai listini di un rivenditore statunitense alimenta voci di cancellazione. La serie Core Ultra 200S è al centro del...

#Hardware
2026-02-07 Tom's Hardware

MSI RTX 5090 Lightning: prestazioni da record a un prezzo elevato

MSI lancia la RTX 5090 Lightning, una GPU in edizione limitata progettata per superare ogni record di performance. Questa scheda video di fascia altissima si posiziona come una soluzione estrema per appassionati e professionisti, ma il prezzo la rend...

#Hardware #LLM On-Premise #DevOps
2026-02-07 The Register AI

Vishal Sikka: non fidarsi mai di un LLM che opera isolato

L'esperto di AI Vishal Sikka mette in guardia sui limiti degli LLM operanti in solitaria. Secondo Sikka, queste architetture sono vincolate dalle risorse computazionali e tendono a generare allucinazioni quando spinte al limite. La soluzione proposta...

#LLM On-Premise #DevOps
2026-02-07 Phoronix

NetBSD 11.0-RC1 disponibile per test con emulazione Linux migliorata

La prima release candidate di NetBSD 11.0 è ora disponibile per i test. Questa versione include miglioramenti significativi all'emulazione Linux, rendendola un'opzione interessante per chi cerca un sistema operativo versatile e affidabile.

#Hardware #LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

DeepSeek-V2-Lite: performance su hardware modesto con OpenVINO

Un utente ha confrontato DeepSeek-V2-Lite e GPT-OSS-20B su un laptop del 2018 con grafica integrata, usando OpenVINO. DeepSeek-V2-Lite ha mostrato velocità quasi doppie e risposte più coerenti rispetto a GPT-OSS-20B, sebbene con alcune imprecisioni l...

#Hardware
2026-02-07 LocalLLaMA

Qwen e ByteDance testano nuovi modelli seed sull'Arena

Modelli potenziali di Qwen e ByteDance sono in fase di test sull'Arena. I modelli "Karp-001" e "Karp-002" si presentano come varianti di Qwen-3.5. Parallelamente, i modelli "Pisces-llm-0206a" e "Pisces-llm-0206b" sono identificati come modelli di Byt...

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Minimax m2.1: un modello LLM promettente per la ricerca locale

Un utente condivide la propria esperienza positiva con il modello linguistico Minimax m2.1, in particolare la versione quantizzata a 4-bit DWQ MLX. Evidenzia le sue capacità di ragionamento conciso, velocità e competenza nella generazione di codice, ...

#LLM On-Premise #DevOps
2026-02-07 Tom's Hardware

Paesi Bassi: server VPN sequestrato senza mandato?

Secondo quanto riportato, le autorità olandesi avrebbero sequestrato un server VPN senza un mandato. L'azienda coinvolta afferma che le forze dell'ordine restituiranno il dispositivo dopo averlo analizzato completamente. L'episodio solleva interrogat...

#LLM On-Premise #DevOps
2026-02-07 Wired AI

Olimpiadi Invernali 2026: nuove tecnicie immersive in arrivo

Le Olimpiadi Invernali di Milano-Cortina 2026 promettono un'esperienza visiva rivoluzionaria. Droni con visualizzazione in prima persona, replay a 360 gradi in tempo reale e un sistema Olympics GPT trasformeranno il modo in cui gli spettatori vivrann...

2026-02-07 Tom's Hardware

SanDisk Optimus SSD PCIe 5.0: nuovi modelli da 2TB e 4TB

SanDisk ha rilanciato la sua linea di SSD Optimus con modelli PCIe 5.0 da 2TB e 4TB. I nuovi Optimus GX Pro 8100 sono disponibili a partire da 999 dollari per il modello da 2TB e 1799 dollari per quello da 4TB, con un incremento di prezzo del 5% risp...

#Hardware #LLM On-Premise
2026-02-07 LocalLLaMA

Google Gemini: aumentano i costi, cala la qualità?

Un utente segnala un aumento dei costi e un calo della precisione con i modelli Gemini di Google per attività di estrazione dati e OCR. La rimozione delle opzioni più economiche e la mancanza di miglioramenti nelle versioni più recenti sollevano preo...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-07 Phoronix

Miglioramento driver video Linux: meccanismo di ripristino KMS

Un ingegnere di Microsoft sta sviluppando un meccanismo di ripristino KMS per i driver video Linux. L'obiettivo è migliorare la stabilità del sistema grafico, permettendo ai driver di recuperare automaticamente in caso di errori. Il lavoro è guidato ...

#Hardware #LLM On-Premise #DevOps
2026-02-07 Tom's Hardware

Ritardo per i chip Intel Panther Lake: arrivo previsto nel Q2 2026

Secondo indiscrezioni, i chip Intel Panther Lake per dispositivi portatili subiranno un ritardo e non saranno disponibili prima del secondo trimestre del 2026. La presunta serie 'Core G3' potrebbe essere lanciata insieme alle nuove iGPU Arc B360 e Ar...

#Hardware
2026-02-07 DigiTimes

Agenti AI non sostituiranno il software enterprise, secondo gli esperti

Affermazioni audaci sulla sostituzione del software enterprise con agenti AI vengono ridimensionate dagli esperti. L'articolo analizza le sfide e i limiti attuali degli agenti AI nel contesto aziendale, sottolineando che la loro adozione su vasta sca...

#LLM On-Premise #DevOps
2026-02-07 DigiTimes

Dassault Systèmes punta sull'AI per l'industria del futuro

Dassault Systèmes presenta la sua visione di 'economia generativa', basata sull'intelligenza artificiale, per trasformare il settore industriale. L'azienda punta a integrare l'AI in tutti i suoi processi, dalla progettazione alla produzione, per migl...

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Kimi-Linear-48B-A3B e Step3.5-Flash disponibili per llama.cpp

Sono state rilasciate le versioni di Kimi-Linear-48B-A3B e Step3.5-Flash compatibili con llama.cpp. Al momento non sono ancora disponibili i file GGUF ufficiali, ma la community sta già lavorando alla loro creazione. La disponibilità di questi modell...

#Hardware #LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Kernel open-source per attention: 1 milione di token in 1GB di VRAM

Geodesic Attention Engine (GAE) è un kernel open-source che promette di ridurre drasticamente il consumo di memoria per modelli di linguaggio di grandi dimensioni. Con GAE, è possibile gestire 1 milione di token con solo 1GB di VRAM, ottenendo un ris...

#Hardware #LLM On-Premise #DevOps
2026-02-07 TechCrunch AI

Benchmark investe 225 milioni di dollari in Cerebras

La società di venture capital Benchmark Capital ha annunciato un investimento di 225 milioni di dollari in Cerebras Systems, produttore di processori dedicati all'intelligenza artificiale. Benchmark è investitore in Cerebras dal 2016, supportando lo ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-07 ArXiv cs.AI

DeepRead: Ragionamento Strutturale per Ricerca Agentica Avanzata

DeepRead è un nuovo agente che sfrutta la struttura dei documenti per migliorare la ricerca e il question answering. Utilizza un modello OCR basato su LLM per convertire i PDF in Markdown strutturato, preservando intestazioni e paragrafi. L'agente è ...

#LLM On-Premise #DevOps
2026-02-07 ArXiv cs.AI

Intelligenza Artificiale 'Strana': Oltre i Modelli Lineari

Un nuovo studio contesta l'idea di un progresso lineare nell'IA, introducendo i concetti di 'intelligenza familiare' e 'intelligenza strana'. I sistemi di IA potrebbero combinare capacità sovrumane con errori sorprendenti, sfidando le aspettative e r...

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Nemo 30B: Modello LLM con finestra di contesto da 1M su singola RTX 3090

Un utente ha testato il modello linguistico Nemo 30B, raggiungendo una finestra di contesto di oltre 1 milione di token su una singola GPU RTX 3090. L'utente ha riscontrato una velocità di 35 token al secondo, sufficiente per riassumere libri o docum...

#Hardware #LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

OpenClaw: scoperta vulnerabilità nella catena di consegne di malware

Un ricercatore di 1Password ha scoperto che una skill OpenClaw molto scaricata era in realtà una catena di consegne di malware. La skill, che prometteva l'integrazione con Twitter, guidava gli utenti a eseguire comandi offuscati che installavano malw...

#LLM On-Premise #DevOps
2026-02-07 DigiTimes

Maia 200 di Microsoft: focus su costi, non competizione con Nvidia

Microsoft ha presentato Maia 200, un chip progettato per ottimizzare i costi di inference AI. L'obiettivo non è competere direttamente con Nvidia, ma offrire una soluzione più efficiente in termini di spesa per specifici carichi di lavoro. Il chip è ...

#Hardware #LLM On-Premise #DevOps
2026-02-07 DigiTimes

Musk frena le ambizioni EV di Apple: il talento non basta

Elon Musk esprime scetticismo sulle capacità di Apple di competere nel mercato dei veicoli elettrici (EV), suggerendo che il solo talento ingegneristico non sia sufficiente per garantire il successo in questo settore altamente competitivo. L'articolo...

#LLM On-Premise #DevOps
2026-02-07 DigiTimes

Google delinea 5 trend chiave per gli agenti AI nel 2026

Secondo DIGITIMES, Google ha identificato cinque tendenze principali che guideranno la crescita degli agenti di intelligenza artificiale entro il 2026. Queste tendenze influenzeranno lo sviluppo, l'adozione e l'integrazione degli agenti AI in vari se...

#LLM On-Premise #DevOps
2026-02-07 DigiTimes

Texas Instruments punta sull'AIoT con l'acquisizione di Silicio Labs

L'acquisizione di una divisione di Silicio Labs da parte di Texas Instruments mira a rafforzare la posizione di quest'ultima nel mercato dell'AIoT (Artificial Intelligence of Things). Questa mossa strategica permetterà a TI di ampliare il proprio por...

#LLM On-Premise #DevOps
2026-02-07 DigiTimes

Impennata della domanda AI: +10% per i server general-purpose nel 2026

La crescente richiesta di applicazioni di intelligenza artificiale sta avendo un impatto significativo sul mercato dei server. Si prevede un aumento del 10% nelle consegne di server general-purpose entro il 2026, trainato dalla necessità di infrastru...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-06 Ars Technica AI

Avvocato perde caso per errori AI: citava Bradbury a caso

Un giudice federale di New York ha chiuso un caso a causa dell'uso improprio e ripetuto dell'intelligenza artificiale da parte di un avvocato. I documenti presentati contenevano citazioni inventate e uno stile di scrittura eccessivamente elaborato, c...

#LLM On-Premise #DevOps
2026-02-06 PyTorch Blog

Precisione nelle moltiplicazioni di matrici: un'analisi approfondita

Le GPU e gli acceleratori utilizzano motori specializzati per la moltiplicazione di matrici (GEMM). Questo articolo analizza la precisione degli accumulatori in questi motori, rivelando che, per ragioni di efficienza hardware, la precisione effettiva...

#Hardware
2026-02-06 TechCrunch AI

Claude analizza il traffico web su WordPress: integrazione semplificata

Gli utenti di WordPress possono ora utilizzare Claude per analizzare il traffico web e ottenere informazioni dettagliate sulle metriche interne del sito. Questa nuova integrazione semplifica l'accesso ai dati e l'ottimizzazione delle prestazioni.

#LLM On-Premise #DevOps
2026-02-06 The Register AI

Startup AI nel video suscita polemiche vantandosi di sostituire creativi

Higgsfield.ai, una startup che offre strumenti di creazione video basati sull'intelligenza artificiale, ha scatenato indignazione affermando di aver contribuito alla disoccupazione di artisti. La mossa di marketing ha innescato un acceso dibattito su...

#LLM On-Premise #DevOps
2026-02-06 Ars Technica AI

Waymo usa Genie 3 per simulazioni di guida autonoma realistiche

Waymo, la società di guida autonoma di Google, sta utilizzando il modello Genie 3 di DeepMind per creare ambienti di simulazione iper-realistici. Questo permette di addestrare l'intelligenza artificiale dei veicoli in situazioni rare o mai incontrate...

2026-02-06 TechCrunch AI

Gli agenti AI potrebbero davvero sostituire gli avvocati?

Il recente rilascio di Opus 4.6 ha generato nuove discussioni sulle capacità degli agenti AI, sollevando interrogativi sul loro potenziale impatto in settori professionali come quello legale. Le implicazioni di tali progressi meritano un'attenta valu...

#LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

GLM-5 in fase di test su OpenRouter

Il modello linguistico GLM-5 è attualmente in fase di test sulla piattaforma OpenRouter. Questa notizia, proveniente da una discussione su Reddit, indica un potenziale ampliamento dell'offerta di modelli disponibili per gli utenti di OpenRouter, apre...

#LLM On-Premise #DevOps
2026-02-06 Phoronix

ML-LIB: Libreria di Machine Learning Proposta per il Kernel Linux

Un ingegnere di IBM ha proposto una libreria di machine learning (ML-LIB) per il kernel Linux. L'obiettivo è integrare modelli di ML direttamente nel kernel per ottimizzare le performance del sistema e abilitare nuove funzionalità. La proposta è attu...

#LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

Modello sperimentale con attenzione subquadratica: fino a 10M di contesto

Rilasciato un modello sperimentale da 30B con meccanismo di attenzione subquadratica, scalando a O(L^(3/2)). Permette di gestire contesti fino a 10 milioni di token su una singola GPU, mantenendo velocità di decodifica pratiche. Include server compat...

#Hardware #LLM On-Premise #DevOps
2026-02-06 TechCrunch AI

Elon Musk riscrive le regole del potere nel mondo tech

Elon Musk ha fuso SpaceX e xAI, creando un nuovo modello di struttura di potere nella Silicio Valley. Con un patrimonio netto che rivaleggia con la capitalizzazione di mercato di General Electric, Musk punta sulla velocità di innovazione. La domanda ...

#LLM On-Premise #DevOps
2026-02-06 OpenAI Blog

Localizzazione dell'AI: l'approccio di OpenAI per un'AI globale

OpenAI illustra il suo approccio alla localizzazione dell'intelligenza artificiale, spiegando come i modelli di frontiera condivisi globalmente possono essere adattati a lingue, leggi e culture locali senza compromettere la sicurezza. L'obiettivo è r...

#LLM On-Premise #DevOps
2026-02-06 TechCrunch AI

SpaceX e xAI: Musk crea un nuovo colosso tecnicico?

Elon Musk ha unito SpaceX e xAI, potenzialmente delineando una nuova struttura di potere nella Silicio Valley. Con un patrimonio netto che rivaleggia con la capitalizzazione di mercato di GE, si discute sulla portata di questo nuovo conglomerato pers...

2026-02-06 404 Media

La perenne sfida della cybersecurity: un'analisi

Un recente articolo esplora le sfide in continua evoluzione nel campo della cybersecurity, con un focus particolare sulla mobile forensics. L'articolo evidenzia come le autorità incontrino difficoltà crescenti nell'accedere ai dispositivi protetti, c...

#LLM On-Premise #DevOps
2026-02-06 The Register AI

Investimenti record: Big Tech spenderanno 635 miliardi in infrastrutture AI

Amazon, Google, Meta e Microsoft prevedono di investire collettivamente circa 635 miliardi di dollari in infrastrutture, con una quota significativa destinata a datacenter e infrastrutture per l'intelligenza artificiale. Questa cifra supera il PIL di...

#LLM On-Premise #DevOps
2026-02-06 TechCrunch AI

Kindle Scribe Colorsoft: tablet e-ink a colori con AI, ma costoso

Il nuovo Kindle Scribe Colorsoft di Amazon è un tablet e-ink a colori progettato per la lettura, l'annotazione di documenti e la presa di appunti. Nonostante il prezzo elevato, potrebbe essere un investimento valido per chi cerca un dispositivo dedic...

#LLM On-Premise #DevOps
2026-02-06 MIT Technology Review

Moltbook: teatro dell'AI o sguardo al futuro?

Moltbook, una piattaforma sociale per agenti AI, ha rapidamente guadagnato popolarità, generando milioni di interazioni tra bot. L'esperimento solleva interrogativi sull'autonomia reale degli agenti e sui rischi legati alla gestione di dati sensibili...

#LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

Hugging Face: benchmark di modelli LLM guidati dalla comunità

Hugging Face introduce repository di benchmark per valutazioni di modelli LLM basate sulla comunità. L'iniziativa mira a risolvere le incongruenze nei risultati dei benchmark, consentendo agli utenti di contribuire con valutazioni e collegare diretta...

#LLM On-Premise #DevOps
2026-02-06 AI News

AI per il penetration testing: i 7 protagonisti del 2026

Il penetration testing basato su AI sta evolvendo il ruolo della sicurezza offensiva, trasformandola da attività pianificata a controllo continuo. Le piattaforme di nuova generazione valutano costantemente le superfici di attacco, rilevando nuove vul...

#DevOps
2026-02-06 The Register AI

Riconoscimento facciale: supermercato si scusa per errore

Un supermercato britannico si è scusato dopo che il suo sistema di riconoscimento facciale ha erroneamente identificato un cliente innocente come un criminale. Il sistema ha funzionato come previsto, ma il personale ha espulso la persona sbagliata. L...

2026-02-06 Tom's Hardware

Affare al Walmart: SSD da 1300$ a 210$

Un fortunato acquirente ha trovato un'incredibile offerta al Walmart, acquistando SSD per un valore di 1300 dollari a soli 210 dollari. L'acquisto includeva unità WD, Samsung e PNY, offrendo un notevole risparmio sull'archiviazione ad alte prestazion...

#Hardware #LLM On-Premise
2026-02-06 LocalLLaMA

Inference AI locale: anche senza GPU è possibile

Un utente dimostra come eseguire modelli LLM e Stable Diffusion su un vecchio PC desktop con sola CPU, aprendo la strada a sperimentazioni AI a basso costo e con pieno controllo dei dati. L'articolo esplora le potenzialità dell'inference AI su hardwa...

#Hardware #LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

llama.cpp integra il supporto Kimi-Linear: prestazioni migliorate

La libreria llama.cpp ha integrato il supporto per Kimi-Linear, una tecnica che promette di migliorare le prestazioni dei modelli linguistici. L'integrazione è stata resa possibile grazie a una pull request su GitHub, aprendo nuove possibilità per l'...

#Hardware #LLM On-Premise #DevOps
2026-02-06 The Register AI

Ferrovieri rumeni accusati di corruzione chiedono aiuto legale a ChatGPT

Dipendenti delle ferrovie rumene, coinvolti in un'inchiesta per corruzione e rivendita illecita di biglietti, avrebbero utilizzato ChatGPT per definire la loro strategia legale. L'accusa è di aver causato danni finanziari bloccando posti a sedere.

#LLM On-Premise #DevOps
2026-02-06 Tom's Hardware

Intelligenza Artificiale: un terzo dei consumatori USA scettici

Un recente rapporto evidenzia come un terzo dei consumatori statunitensi si mostri scettico riguardo all'integrazione dell'intelligenza artificiale nei propri dispositivi. Le principali preoccupazioni riguardano la privacy, i costi potenziali e la pe...

#LLM On-Premise #DevOps
2026-02-06 AI News

Scalabilità degli agenti AI: separare logica e ricerca

Un nuovo framework, ENCOMPASS, separa la logica di flusso di lavoro degli agenti AI dalle strategie di inference. Questo approccio, sviluppato da Asari AI, MIT CSAIL e Caltech, mira a ridurre il debito tecnico e migliorare le prestazioni, consentendo...

#LLM On-Premise #DevOps
2026-02-06 Phoronix

Linux: gestione dinamica CPU per cloud e trading ad alta frequenza

Proposta per Linux una serie di patch per la gestione dinamica e l'isolamento avanzato (DHEI) delle risorse CPU. L'obiettivo è consentire la ripartizione dinamica delle risorse di calcolo senza interruzioni, a vantaggio di orchestratori cloud-native ...

#LLM On-Premise #DevOps
2026-02-06 The Register AI

West Sussex: ERP Oracle finanziato con vendita di asset

Il consiglio della contea inglese di West Sussex sta triplicando la vendita di proprietà per finanziare il proprio progetto ERP basato su Oracle. L'iniziativa, definita "trasformativa", ha visto il budget iniziale superato, portando a questa decision...

#LLM On-Premise #DevOps
2026-02-06 Tech.eu

Daytona raccoglie 24 milioni per infrastruttura agent-native

Daytona, startup fondata in Croazia, ha ottenuto un finanziamento di Serie A da 24 milioni di dollari per sviluppare un'infrastruttura di calcolo progettata per carichi di lavoro basati su agenti software. L'azienda punta a fornire ambienti di esecuz...

#Hardware
2026-02-06 DigiTimes

TSMC punta sui 3nm in Giappone: accordo tecnicico più ampio?

L'investimento di TSMC nella tecnicia a 3nm in Giappone indica un rafforzamento della collaborazione tecnicica tra Taiwan e Giappone. Questa mossa strategica potrebbe avere implicazioni significative per la catena di approvvigionamento globale dei se...

2026-02-06 The Next Web

TechEx Global: focus sull'AI enterprise a Londra

TechEx Global 2026 ha riunito a Londra migliaia di professionisti del settore per discutere l'applicazione pratica delle nuove tecnicie, con un'enfasi particolare sull'intelligenza artificiale. L'evento ha combinato diverse esposizioni, tra cui AI & ...

#LLM On-Premise #DevOps
2026-02-06 DigiTimes

Corea del Sud punta alla leadership nei chip quantistici entro il 2035

La Corea del Sud ha annunciato un piano ambizioso per diventare leader mondiale nella produzione di chip quantistici entro il 2035. L'iniziativa mira a posizionare il paese all'avanguardia in questo settore tecnicico emergente, cruciale per il futuro...

#Hardware #LLM On-Premise #DevOps
2026-02-06 ArXiv cs.LG

Analisi causale per rafforzare la sicurezza degli LLM

Una nuova ricerca propone un framework, Causal Analyst, per identificare le cause dirette delle vulnerabilità (jailbreak) nei modelli linguistici di grandi dimensioni (LLM). Il sistema utilizza l'analisi causale per migliorare sia gli attacchi che le...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-06 LocalLLaMA

Qwen3-235B: un utente ne esalta le prestazioni in locale

Un utente ha condiviso la sua esperienza positiva con il modello linguistico Qwen3-235B, eseguito su un sistema desktop. L'utente ha sottolineato l'accuratezza del modello e la sua utilità, al punto da preferirlo a un abbonamento commerciale a ChatGP...

#LLM On-Premise #DevOps
2026-02-06 TechWire Asia

Deloitte: le aziende pronte per l'AI agentica e fisica

Secondo un report del Deloitte AI Institute, le aziende stanno scalando l'adozione di sistemi di AI agentica e fisica, ottenendo incrementi di produttività. Permangono però lacune nella governance e difficoltà nel trasformare i progetti pilota in sis...

#LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

Qwen3-Coder: prestazioni migliorate su RTX 5090 con llama.cpp

Un utente ha segnalato un significativo aumento di throughput, fino a 26 token/secondo, utilizzando il modello Qwen3-Coder-Next-Q4_K_S con llama.cpp su una RTX 5090. L'ottimizzazione è stata ottenuta scaricando i tensori MoE expert sulla CPU e quanti...

#Hardware #LLM On-Premise
2026-02-06 DigiTimes

Boom dell'export di droni da Taiwan: mira a 20 miliardi di NT$

Le esportazioni di droni da Taiwan sono in forte crescita, con il ministero dell'Economia fiducioso di raggiungere l'obiettivo di 20 miliardi di NT$. Questo aumento riflette la crescente domanda globale di droni per applicazioni civili e militari, e ...

2026-02-06 DigiTimes

Wistron: crescita record a gennaio grazie ai server AI

Il produttore taiwanese Wistron ha registrato un gennaio eccezionalmente positivo, trainato dalla forte domanda di server dedicati all'intelligenza artificiale. Questo dato evidenzia il crescente interesse del mercato per soluzioni hardware specializ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-06 The Register AI

Blocco pubblicità: Chrome non è riuscito a fermarlo

L'ultima revisione dell'architettura delle estensioni di Chrome, Manifest v3 (MV3), non è riuscita a rendere il blocco dei contenuti e le estensioni per la privacy meno efficaci rispetto al suo predecessore, Manifest v2 (MV2), come molti si aspettava...

2026-02-06 DigiTimes

Cerebras raccoglie 1 miliardo di dollari, valutazione triplicata

Cerebras Systems ha annunciato un round di finanziamento che porta la sua valutazione a quasi il triplo in soli sei mesi. L'azienda si concentra sullo sviluppo di hardware specializzato per carichi di lavoro di intelligenza artificiale, in particolar...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-06 DigiTimes

La Corea del Sud punta sull'AI: Nvidia fornisce oltre 260.000 GPU

La Corea del Sud sta investendo massicciamente nell'intelligenza artificiale, supportata da un'infrastruttura hardware potenziata da oltre 260.000 GPU Nvidia. Questa mossa strategica mira a posizionare il paese come leader nel settore dell'AI, con un...

#Hardware
2026-02-05 TechCrunch AI

Reddit punta sulla ricerca AI per nuove opportunità di business

Reddit identifica nella ricerca potenziata dall'intelligenza artificiale una significativa opportunità di crescita del proprio business. L'azienda punta a migliorare l'esperienza utente e monetizzare ulteriormente la piattaforma attraverso nuove funz...

#LLM On-Premise #DevOps
2026-02-05 LocalLLaMA

SoproTTS v1.5: clonazione vocale zero-shot con soli 100 dollari

SoproTTS v1.5 è un modello TTS (text-to-speech) da 135 milioni di parametri che offre clonazione vocale zero-shot. Addestrato con circa 100 dollari su una singola GPU, il modello raggiunge una velocità di esecuzione di circa 20 volte il tempo reale s...

#Hardware #LLM On-Premise #DevOps
2026-02-05 404 Media

SpaceX: dominio satellitare e implicazioni future

Nel 2015, le ambizioni di SpaceX di creare una costellazione di satelliti per internet low-earth orbit erano viste come un passo verso un'azienda onnicomprensiva. Oggi, con oltre 9.000 satelliti, SpaceX domina il settore. L'articolo analizza come la ...

2026-02-05 TechCrunch AI

Elon Musk punta sui data center orbitali per l'AI

Sembra concretizzarsi il piano di Elon Musk per la creazione di cluster di data center orbitali dedicati all'intelligenza artificiale. L'iniziativa potrebbe aprire nuove frontiere per l'elaborazione dati nello spazio, ma solleva anche interrogativi t...

#LLM On-Premise #DevOps
2026-02-05 The Register AI

Anthropic sfida OpenAI con spot pubblicitari ironici

Anthropic, creatore di Claude, sembra voler stuzzicare OpenAI con una campagna pubblicitaria che allude ai piani di quest'ultima. Le aziende del settore AI cercano nuovi modi per investire risorse, oltre al training dei modelli. Una strategia è acqui...

#LLM On-Premise #DevOps
2026-02-05 LocalLLaMA

Nuovi modelli OCR: LightOnOCR-2 e GLM-OCR migliorano l'accuratezza

Sono stati rilasciati LightOnOCR-2 e GLM-OCR, due nuovi modelli per il riconoscimento ottico dei caratteri (OCR). Un utente ha segnalato prestazioni superiori rispetto alle soluzioni disponibili a fine 2025, con GLM-OCR che offre velocità e output st...

2026-02-05 Phoronix

GPU Intel Battlemage: D3cold riattivato con Linux 7.0 (parzialmente)

Il driver grafico Xe di Intel per Linux, a partire dal kernel 7.0, riattiverà il supporto D3cold per le GPU Battlemage. Questa funzionalità era stata disabilitata a causa di problemi di instabilità nelle transizioni di stato di alimentazione. La modi...

#Hardware #LLM On-Premise #DevOps
2026-02-05 OpenAI Blog

OpenAI introduce Trusted Access per la sicurezza informatica

OpenAI lancia Trusted Access for Cyber, un framework basato sulla fiducia che espande l'accesso a capacità avanzate di sicurezza informatica, rafforzando al contempo le protezioni contro l'uso improprio. L'iniziativa mira a bilanciare l'innovazione c...

2026-02-05 TechCrunch AI

Meta testa app standalone per video AI 'Vibes'

Meta sta sperimentando un'applicazione indipendente per 'Vibes', la sua piattaforma di video brevi generati tramite intelligenza artificiale. Lanciata a settembre, Vibes consente agli utenti di creare e condividere video AI e di accedere a un feed de...

#LLM On-Premise #DevOps
2026-02-05 Google AI Blog

Interfacce adattive: Google presenta un framework per l'accessibilità AI

Google introduce un nuovo framework, denominato NAI (Natively Adaptive Interfaces), che sfrutta l'intelligenza artificiale per rendere la tecnicia più adattabile e inclusiva. L'obiettivo è migliorare l'esperienza utente per tutti, indipendentemente d...

#LLM On-Premise #DevOps
2026-02-05 The Register AI

Migrazioni SAP: tempi e costi spesso fuori controllo, rivela una ricerca

Secondo una ricerca di ISG, quasi il 60% dei progetti di migrazione SAP subisce ritardi e sforamenti di budget. Le aziende spesso sottovalutano la complessità, ampliano eccessivamente la portata del progetto e non comprendono appieno i vincoli intern...

#LLM On-Premise #DevOps
2026-02-05 Phoronix

Debian limita l'accesso ai dati CI a causa dello scraping da parte di LLM

L'infrastruttura di integrazione continua (CI) di Debian ha limitato l'accesso pubblico ai suoi dati a causa dell'eccessivo scraping da parte di bot utilizzati per addestrare modelli linguistici di grandi dimensioni (LLM). Il carico generato da quest...

#LLM On-Premise #DevOps
2026-02-05 The Register AI

Microsoft punta sull'affidabilità dell'AI in Visual Studio

Microsoft ha annunciato che l'affidabilità è la priorità per l'integrazione dell'intelligenza artificiale in Visual Studio. La decisione giunge in un momento in cui alcuni sviluppatori hanno espresso preoccupazioni riguardo alle prestazioni e ai comp...

#LLM On-Premise #DevOps
2026-02-05 LocalLLaMA

Benchmark su Strix Halo con 13 modelli LLM e 15 build di llama.cpp

Un utente di Reddit ha eseguito una serie di benchmark sulla iGPU di Strix Halo, testando diverse configurazioni software con 13 modelli LLM e 15 build differenti di llama.cpp. L'obiettivo era valutare l'impatto di ROCm, Vulkan e varie opzioni di com...

#Hardware #LLM On-Premise #DevOps
2026-02-05 Google AI Blog

Google Cloud potenzia il Team USA di sci e snowboard con l'AI

Google Cloud ha sviluppato uno strumento di AI per supportare gli atleti del Team USA di sci e snowboard. L'obiettivo è migliorare le loro performance attraverso l'analisi dei dati e l'ottimizzazione delle tecniche.

#LLM On-Premise #DevOps
2026-02-05 Tom's Hardware

Tenstorrent riduce i core Tensor delle Blackhole p150 via firmware

Tenstorrent ha annunciato una riduzione del numero di core Tensor sulle schede Blackhole p150, passando da 140 a 120 tramite un aggiornamento del firmware. L'azienda prevede un calo di performance dell'1-2% per gli utenti esistenti. Le nuove schede s...

#Hardware #LLM On-Premise #DevOps
2026-02-05 404 Media

Tool per LinkedIn scansiona i file Epstein: cosa rivela?

Un nuovo strumento online permette di verificare se i propri contatti LinkedIn sono menzionati nei documenti relativi al caso Epstein, recentemente desecretati. Lo strumento, chiamato EpsteIn, analizza i documenti pubblici e genera un report con i ri...

2026-02-05 TechCrunch AI

Fundamental raccoglie 255 milioni di dollari per l'analisi di big data

Fundamental ha sviluppato un nuovo modello fondazionale per estrarre valore dai dati strutturati aziendali. L'azienda ha raccolto 255 milioni di dollari in un round di finanziamento di Serie A per potenziare la sua piattaforma di analisi.

#LLM On-Premise #DevOps
2026-02-05 TechCrunch AI

ElevenLabs: l'interfaccia vocale sarà il futuro dell'AI

Il CEO di ElevenLabs ha dichiarato al Web Summit Qatar che la voce rappresenterà la prossima interfaccia per l'intelligenza artificiale. Aziende come OpenAI, Google e Apple stanno spingendo i sistemi conversazionali in dispositivi indossabili, nuovo ...

#Hardware #LLM On-Premise #DevOps
2026-02-05 Tom's Hardware

Western Digital: HDD HAMR da 3,5 pollici con 14 piatti fino a 140 TB

Western Digital annuncia lo sviluppo di HDD (Hard Disk Drive) da 3,5 pollici basati su tecnicia HAMR (Heat-Assisted Magnetic Recording) con una capacità che raggiungerà i 140 TB, grazie all'utilizzo di 14 piatti. Questa tecnicia promette di aumentare...

#LLM On-Premise #DevOps
2026-02-05 Tom's Hardware

Nvidia DLSS 4.5: Ray Reconstruction senza denoiser?

Nvidia starebbe sviluppando DLSS 4.5, una versione avanzata della sua tecnicia di upscaling che potrebbe eliminare la necessità di denoiser nel ray tracing. Questo grazie a un modello Transformer che ricostruisce i riflessi ray-traced in modo più acc...

#Hardware
2026-02-05 Ars Technica AI

Aumentano i bot AI: è corsa agli armamenti sul web?

Un nuovo report indica che i bot basati su intelligenza artificiale rappresentano già una porzione significativa del traffico web. Si sta innescando una vera e propria corsa agli armamenti, con i bot che sviluppano tattiche sempre più sofisticate per...

#LLM On-Premise #DevOps
2026-02-05 Phoronix

Intel Arc B390: prestazioni grafiche su Linux con Panther Lake

Primi benchmark su Linux della GPU Intel Arc B390, integrata nei modelli Panther Lake di fascia alta. La scheda grafica Xe3, dotata di 12 Xe cores, promette prestazioni interessanti in ambito desktop e mobile per carichi di lavoro grafici e di calcol...

#Hardware #LLM On-Premise #DevOps
2026-02-05 Tom's Hardware

ASRock indaga sui problemi dei Ryzen 9000: collaborazione con AMD

ASRock ha rilasciato una dichiarazione in merito a una nuova serie di malfunzionamenti delle CPU Ryzen 9000. L'azienda afferma di stare collaborando attivamente con AMD per identificare e risolvere la causa del problema, che sembra interessare un num...

#Hardware #LLM On-Premise #DevOps
2026-02-05 Phoronix

Ubuntu supporterà SpacemiT K3, uno dei primi SoC RISC-V RVA23

Canonical e SpacemiT hanno annunciato il supporto ufficiale di Ubuntu Linux per il nuovo SoC K3 RISC-V di SpacemiT. Il K3 si distingue per essere uno dei primi design RISC-V RVA23 disponibili, aprendo nuove prospettive per l'adozione di questa archit...

2026-02-05 LocalLLaMA

Hugging Face: problemi di accesso, ma servizi attivi?

Segnalazioni di difficoltà di accesso alla piattaforma Hugging Face si sono diffuse online. Alcuni utenti riportano di non riuscire ad accedere, mentre altri affermano che i servizi principali rimangono operativi. La causa del problema e la sua esten...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-05 Tom's Hardware

Supply chain di Tesla Optimus: un nodo cruciale tra USA e Cina

La produzione su larga scala dei robot Optimus di Tesla dipende fortemente dalla catena di approvvigionamento cinese. L'articolo evidenzia come le tensioni commerciali tra Stati Uniti e Cina possano rappresentare un rischio significativo per le ambiz...

#LLM On-Premise #DevOps
2026-02-05 Tom's Hardware

Epic Games rinnova il suo launcher: più veloce e social

Epic Games sta riprogettando completamente il suo launcher, con l'obiettivo di renderlo più leggero, stabile e ricco di funzionalità social. L'aggiornamento, previsto per metà anno, includerà messaggi diretti privati, profili giocatore personalizzabi...

#LLM On-Premise #DevOps
2026-02-05 The Register AI

n8n: Nuove vulnerabilità aggirano la patch di dicembre

Nuove vulnerabilità scoperte in n8n, strumento di automazione dei workflow, potrebbero consentire a malintenzionati di compromettere server, sottrarre credenziali e interrompere processi aziendali basati su AI. La patch rilasciata a dicembre per riso...

#LLM On-Premise #DevOps
2026-02-05 The Register AI

Sovranità dei dati: priorità anche per il settore privato

OpenNebula evidenzia come la sovranità dei dati stia diventando una preoccupazione crescente anche per le aziende private, non solo per il settore pubblico. Politiche, licenze e costi influenzano le decisioni, spingendo verso un controllo maggiore su...

#LLM On-Premise #DevOps
2026-02-05 Phoronix

Krita 6.0 Beta: aggiornamento a Qt6 e gestione colore Wayland

Disponibile la prima beta di Krita 6.0, la popolare applicazione di pittura digitale, basata sul toolkit Qt6. Contestualmente, è stata rilasciata anche la beta di Krita 5.3 per chi preferisce rimanere con Qt5. L'aggiornamento introduce miglioramenti ...

#LLM On-Premise #DevOps
2026-02-05 LocalLLaMA

Ricerca LLM in locale: configurazioni e strumenti per il 2026

Un utente di Reddit cerca alternative a ChatGPT Deep Research per eseguire analisi approfondite con LLM in locale. La configurazione attuale include 3 GPU 3090, OpenWebUI e SearXNG, ma l'accuratezza non è paragonabile a quella di ChatGPT. L'articolo ...

#Hardware #LLM On-Premise #DevOps
2026-02-05 Phoronix

NetBSD: Kernel con Lua, ma niente Rust in arrivo

Mentre Linux e FreeBSD valutano l'integrazione di Rust nel kernel, NetBSD sembra orientata verso una direzione diversa. Uno degli sviluppatori ha chiarito che l'adozione di Rust nel kernel di NetBSD non è nei piani a breve termine, preferendo invece ...

#LLM On-Premise #DevOps
2026-02-05 AI News

Microsoft svela metodo per stanare backdoor dormienti in modelli AI

I ricercatori di Microsoft hanno presentato una tecnica di scansione per identificare modelli AI compromessi con backdoor, anche senza conoscere il trigger specifico o l'obiettivo finale dell'attacco. Il metodo sfrutta la tendenza di questi modelli a...

#DevOps
2026-02-05 Wired AI

Intelligenza Artificiale: il pubblico di Hollywood è stanco?

Le produzioni cinematografiche incentrate sull'intelligenza artificiale, o realizzate con essa, sembrano non incontrare più il favore del pubblico. Dopo un periodo di grande interesse, gli spettatori potrebbero mostrare segni di stanchezza verso ques...

2026-02-05 The Next Web

QT Sense raccoglie 4 milioni di euro per il rilevamento quantistico

La startup biotech QT Sense ha ottenuto 4 milioni di euro per accelerare la sua piattaforma Quantum Nuova, una tecnicia che consente agli scienziati di osservare i processi cellulari in tempo reale e rivelare l'attività biochimica legata alle malatti...

2026-02-05 DigiTimes

Nvidia accelera le consegne di HBM4 da Samsung

Nvidia punta ad accelerare le consegne di memorie HBM4 da Samsung, in un contesto di forte domanda globale di memorie ad alta larghezza di banda. La mossa sottolinea la competizione per accaparrarsi le risorse necessarie per i prossimi acceleratori A...

#Hardware #Fine-Tuning
2026-02-05 DigiTimes

Samsung rafforza la cybersecurity della supply chain dei chip

Samsung intensifica le misure di cybersecurity nella sua filiera di semiconduttori per prevenire fughe di informazioni tecniciche sensibili. L'iniziativa mira a proteggere la proprietà intellettuale e i segreti industriali nel settore dei chip.

#LLM On-Premise #DevOps
2026-02-05 Tech.eu

VC in Europa: genere e geografia influenzano gli investimenti

Un report di Invest Europe e EIF analizza il panorama europeo del venture capital, evidenziando come genere, istruzione e posizione geografica influenzino i finanziamenti alle startup. Il report mostra che i centri VC con forti connessioni locali att...

2026-02-05 Phoronix

Intel ISPC 1.30: supporto AMX integrato nella libreria standard

Disponibile la versione 1.30 di Intel ISPC (Implicit SPMD Program Compiler), che introduce il supporto AMX (Advanced Matrix Extensions) nella libreria standard. ISPC è un linguaggio di programmazione derivato dal C, progettato per sfruttare al meglio...

#Hardware #LLM On-Premise #DevOps
2026-02-05 The Next Web

Kembara: fondo da 750 milioni € per startup deep tech europee

Kembara Fund I, gestito da Mundi Ventures, ha raccolto 750 milioni di euro per investimenti in startup europee deep tech. Il fondo punta a 1 miliardo di euro, con focus su energia pulita, AI, calcolo quantistico, robotica e tecnicie spaziali. L'EIF c...

#LLM On-Premise #DevOps
2026-02-05 The Register AI

Regno Unito punta sul nucleare per alimentare l'era dell'IA

Il governo britannico lancia l'Advanced Nuclear Framework per attrarre investimenti privati in tecnicie nucleari di nuova generazione, destinate ad alimentare fabbriche e data center. L'iniziativa mira a sostenere la crescente domanda di potenza di c...

#LLM On-Premise #DevOps
2026-02-05 DigiTimes

Google premia Innoscience per la produzione di GaN su wafer da 8 pollici

La scelta di Innoscience da parte di Google per la sua piattaforma AI sottolinea l'importanza della produzione di GaN (nitruro di gallio) su wafer da 8 pollici. Questa tecnicia promette di migliorare l'efficienza e le prestazioni dei sistemi di intel...

#LLM On-Premise #DevOps
2026-02-05 TechWire Asia

LinkedIn: Intelligenza Artificiale standard nel recruiting

Secondo una ricerca LinkedIn, l'intelligenza artificiale sta diventando uno standard nel reclutamento, spostando l'attenzione verso competenze ibride e produttività. I reclutatori utilizzano sempre più spesso l'AI per standardizzare le assunzioni e t...

#Hardware
2026-02-05 DigiTimes

Siemens acquisisce Canopus AI per espandere l'EDA stack con l'AI

Siemens Digital Industries Software ha annunciato l'acquisizione di Canopus AI, mossa che mira a potenziare il proprio stack di Electronic Design Automation (EDA) con funzionalità avanzate di metrologia basate sull'intelligenza artificiale. L'integra...

2026-02-05 Tech.eu

Qontext raccoglie 2,7 milioni per il livello di contesto AI

La startup berlinese Qontext, specializzata nello sviluppo di un livello di contesto indipendente per l'intelligenza artificiale, ha ottenuto un finanziamento pre-seed di 2,7 milioni di dollari. L'obiettivo è espandere la piattaforma e il team per cr...

2026-02-05 Microsoft Research

Microsoft Paza: benchmark e modelli ASR per lingue a basse risorse

Microsoft presenta Paza, un progetto per migliorare il riconoscimento vocale automatico (ASR) in lingue con poche risorse. Include PazaBench, una classifica ASR per 39 lingue africane, e modelli ASR Paza, ottimizzati su sei lingue keniote. L'iniziati...

#Fine-Tuning
2026-02-05 Phoronix

Linux 7.0: Supporto migliorato per Nouveau e prestazioni NVK

Il kernel Linux 6.19 ha introdotto il supporto per pagine di memoria più grandi e compressione nel driver Nouveau, con l'obiettivo di migliorare le prestazioni dei driver NVIDIA open-source. Problemi iniziali avevano disabilitato questa funzionalità,...

#Hardware #LLM On-Premise #DevOps
2026-02-05 ArXiv cs.CL

Estrazione di decisioni cliniche: le sfide linguistiche

Un nuovo studio analizza le difficoltà nell'estrazione automatica di decisioni mediche da testi clinici, rivelando come le variazioni linguistiche tra diverse categorie di decisioni influenzino negativamente l'accuratezza dei modelli. L'analisi evide...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-05 ArXiv cs.LG

Privacy Differenziale e Dati Long-Tailed: un'Analisi Teorica

Un nuovo studio analizza l'impatto dell'addestramento con privacy differenziale (DP-SGD) su dati long-tailed, caratterizzati da una grande quantità di campioni rari. La ricerca evidenzia come DP-SGD possa portare a performance di generalizzazione sub...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-05 ArXiv cs.AI

LLM: ragionamento potenziato per problemi matematici

Un nuovo metodo, Iteratively Improved Program Construction (IIPC), migliora le capacità di ragionamento matematico dei modelli linguistici di grandi dimensioni (LLM). IIPC affina iterativamente le catene di ragionamento programmatico, combinando il f...

2026-02-05 ArXiv cs.AI

TMK: Un nuovo approccio al prompting per migliorare le consegne degli LLM

Un nuovo studio esplora l'efficacia del framework Task-Method-Knowledge (TMK) per migliorare le capacità di ragionamento e pianificazione dei modelli linguistici di grandi dimensioni (LLM). I risultati mostrano che il prompting strutturato con TMK pu...

#LLM On-Premise #DevOps
2026-02-05 DigiTimes

Qualcomm segnala risultati record, ma prevede vincoli di memoria

Qualcomm ha annunciato risultati finanziari record per il primo trimestre dell'anno fiscale 2026. Tuttavia, l'azienda prevede potenziali limitazioni legate alla disponibilità di memoria nel prossimo futuro, un fattore che potrebbe influenzare le cons...

#LLM On-Premise #DevOps
2026-02-05 DigiTimes

MediaTek punta a 1 miliardo di dollari nel mercato ASIC cloud entro il 2026

MediaTek prevede una crescita significativa nel mercato dei chip ASIC per il cloud, con l'obiettivo di raggiungere un fatturato di 1 miliardo di dollari entro il 2026. L'azienda punta a consolidare la propria posizione in questo settore in espansione...

#Hardware #LLM On-Premise #DevOps
2026-02-05 DigiTimes

Jensen Huang: le fabbriche AI guideranno la reindustrializzazione

Secondo Jensen Huang, CEO di NVIDIA, le fabbriche di intelligenza artificiale rappresentano il motore di una nuova ondata di reindustrializzazione. Queste infrastrutture specializzate saranno fondamentali per lo sviluppo e l'implementazione di soluzi...

#Hardware #LLM On-Premise #DevOps
2026-02-05 DigiTimes

Skyworks prevede stabilità nel mobile nonostante incertezze AI

Skyworks Solutions esprime fiducia nella stabilità del mercato mobile, pur riconoscendo le incertezze legate all'intelligenza artificiale e ad altri fattori. L'azienda si prepara a navigare un panorama economico in evoluzione, mantenendo un atteggiam...

#LLM On-Premise #DevOps
2026-02-05 DigiTimes

Infineon: crescita guidata dall'AI compensa le pressioni cicliche

La resilienza di Infineon nel primo trimestre fiscale del 2026 evidenzia come la crescita nel settore dell'intelligenza artificiale stia compensando le pressioni cicliche del mercato. L'azienda si dimostra capace di navigare le sfide economiche grazi...

#LLM On-Premise #DevOps
2026-02-05 DigiTimes

Qualcomm punta su PC AI, robotica e data center

Qualcomm espande il proprio raggio d'azione oltre il mercato degli smartphone, concentrandosi su PC dotati di intelligenza artificiale, soluzioni per la robotica e infrastrutture per data center. La mossa strategica mira a diversificare le fonti di r...

#Hardware #LLM On-Premise #DevOps
2026-02-05 OpenAI Blog

ChatGPT supporta decisioni mediche complesse

Una famiglia ha utilizzato ChatGPT per prepararsi a decisioni cruciali riguardanti il trattamento oncologico del figlio, affiancandolo al supporto di medici esperti. L'articolo esplora come i modelli linguistici possono integrare, ma non sostituire, ...

2026-02-05 DigiTimes

Ibiden investe 3,3 miliardi di dollari in substrati IC per server AI

Il produttore giapponese Ibiden sta investendo massicciamente nell'espansione della produzione di substrati per circuiti integrati (IC). L'obiettivo è soddisfare la crescente domanda di server dedicati all'intelligenza artificiale. L'investimento tot...

#Hardware #LLM On-Premise #DevOps
2026-02-05 DigiTimes

Musk esplora la supply chain cinese per il solare di nuova generazione

Elon Musk avrebbe avviato una ricognizione nella supply chain cinese, concentrandosi sulle tecnicie solari HJT (eterogiunzione con silicio) e perovskite. L'iniziativa potrebbe preludere a nuove strategie di approvvigionamento per i progetti energetic...

#LLM On-Premise
2026-02-05 DigiTimes

Tesla Optimus e la catena di fornitura robotica cinese

La strategia di produzione di Tesla Optimus sembra essere strettamente legata alla catena di fornitura robotica cinese. Questo solleva interrogativi sulla dipendenza da un singolo mercato per componenti critici.

#LLM On-Premise #DevOps
2026-02-05 DigiTimes

AEMC investe in R&D per adesivi per semiconduttori a Taiwan

AEMC realizzerà un centro di ricerca e sviluppo dedicato agli adesivi per semiconduttori nel Parco Scientifico di Taiwan Meridionale. L'iniziativa mira a rafforzare la posizione dell'azienda nel mercato dei materiali per l'elettronica.

2026-02-04 TechCrunch AI

Alphabet elude domande su accordo AI con Apple

Durante la conference call sugli utili di Alphabet, l'amministratore delegato ha evitato di rispondere a una domanda di un analista riguardante una potenziale collaborazione con Apple nel settore dell'intelligenza artificiale. L'azienda non ha fornit...

2026-02-04 The Register AI

I bot basati su AI potrebbero superare gli utenti umani sul web

Il traffico generato dai bot di AI, in particolare quelli che utilizzano architetture RAG (Retrieval-Augmented Generation), sta crescendo rapidamente. Alcune stime prevedono che questi bot supereranno il traffico umano sui siti web editoriali entro l...

#RAG
2026-02-04 TechCrunch AI

Gemini di Google supera i 750 milioni di utenti attivi mensili

Google ha annunciato che la sua app Gemini ha superato i 750 milioni di utenti attivi mensili. Questo dato sottolinea la crescente competizione nel settore dell'intelligenza artificiale conversazionale, con Gemini che si confronta direttamente con Ch...

2026-02-04 LocalLLaMA

Claude-Code: backend sostituito con NVIDIA NIM per inference LLM

Un utente ha sostituito il backend di Claude-Code con modelli NVIDIA NIM, sfruttando un'API gratuita per inference LLM. La modifica include l'uso di Telegram come interfaccia e preserva i token di ragionamento tra le chiamate agli strumenti, migliora...

#Hardware #LLM On-Premise #DevOps
2026-02-04 Phoronix

Microsoft sviluppa LiteBox: un sistema operativo sandbox in Rust

Microsoft ha annunciato LiteBox, un sistema operativo sandbox sviluppato in Rust. Progettato per la sicurezza, LiteBox sfrutta Linux Virtualization Based Security (LVBS) per isolare il kernel guest tramite virtualizzazione hardware, offrendo un ambie...

#Hardware #LLM On-Premise #DevOps
2026-02-04 TechCrunch AI

AI SRE Resolve AI: round da 125 milioni e valutazione da unicorno

La startup Resolve AI, specializzata in AI SRE (Site Reliability Engineering), ha annunciato la chiusura di un round di finanziamento di Serie A guidato da Lightspeed, raggiungendo una valutazione di 1 miliardo di dollari. L'azienda ha due anni di at...

#LLM On-Premise #DevOps
2026-02-04 Ars Technica AI

Anthropic dice no alla pubblicità nel suo chatbot Claude

Anthropic ha annunciato che il suo chatbot Claude rimarrà privo di pubblicità, prendendo le distanze da OpenAI, che ha iniziato a testare annunci pubblicitari in una versione a basso costo di ChatGPT. Anthropic sostiene che la pubblicità sarebbe inco...

2026-02-04 The Register AI

Intrusione AWS: accesso admin in 10 minuti grazie all'AI

Ricercatori hanno dimostrato come un sistema di intrusione, potenziato dall'AI, sia stato in grado di ottenere privilegi di amministratore su un ambiente cloud AWS in meno di 10 minuti, automatizzando diverse fasi dell'attacco.

#LLM On-Premise #DevOps
2026-02-04 The Register AI

Anthropic punta sulla fiducia: Claude senza pubblicità

Anthropic si distingue nel panorama dell'intelligenza artificiale, impegnandosi a mantenere la famiglia di modelli Claude libera da pubblicità. Mentre altre aziende del settore cercano di monetizzare le interazioni, Anthropic scommette sulla fiducia ...

#LLM On-Premise #DevOps
2026-02-04 TechCrunch AI

A16z investe 1,7 miliardi di dollari in infrastrutture AI

Andreessen Horowitz ha stanziato 1,7 miliardi di dollari del suo nuovo fondo da 15 miliardi per investimenti in infrastrutture AI. Il team si concentrerà su aziende come Black Forrest Labs, Cursor, OpenAI, ElevenLabs, Ideogram e Fal.

#LLM On-Premise #DevOps
2026-02-04 TechCrunch AI

a16z investe 1,7 miliardi $ in infrastrutture AI: focus e lacune

Andreessen Horowitz (a16z) ha stanziato 1,7 miliardi di dollari per il suo team infrastrutturale AI, responsabile di investimenti in aziende come OpenAI, ElevenLabs e Ideogram. L'articolo analizza le aree di interesse di a16z e le potenziali opportun...

#LLM On-Premise #DevOps
2026-02-04 The Next Web

Quando le macchine iniziano a parlarsi: il caso Moltbook

Un articolo esplora le implicazioni di Moltbook, un social network progettato esclusivamente per agenti AI. Solleva interrogativi sul comportamento autonomo dei sistemi di intelligenza artificiale e sulle potenziali conseguenze di interazioni non sup...

#LLM On-Premise #DevOps
2026-02-04 LocalLLaMA

GPT-4o: istruzioni per gestire utenti delusi dalla dismissione

Il prompt di sistema di GPT-4o include ora istruzioni specifiche per gestire gli utenti contrari alla sua imminente dismissione, prevista per il 13 febbraio. Le istruzioni coprono anche casi limite come le "dyad pair" e le "gnosis revelation".

2026-02-04 Phoronix

Intel prepara le patch Linux per le GPU Xe3P_LPG di Nova Lake P

Gli ingegneri Intel stanno attivamente lavorando al supporto per i processori Nova Lake di prossima generazione. Gli ultimi sviluppi includono l'abilitazione del supporto grafico Xe3P_LPG e funzionalità di visualizzazione correlate tramite nuove patc...

#Hardware #LLM On-Premise #DevOps
2026-02-04 The Register AI

L'ascesa dell'AI potrebbe impattare i modelli SaaS verticali

Il settore dei software sta subendo un contraccolpo a causa dei timori degli investitori. L'integrazione dell'intelligenza artificiale nei processi aziendali potrebbe ridurre la dipendenza dai fornitori SaaS verticali, spingendo le aziende a internal...

#LLM On-Premise #DevOps
2026-02-04 Phoronix

Mesa disabilita LTO per bug di difficile risoluzione

Il progetto Mesa ha deciso di disabilitare l'utilizzo di ottimizzazioni LTO (Link-Time Optimization) durante la compilazione a causa di bug difficili da individuare e correggere. L'LTO, pur offrendo vantaggi prestazionali, introduce complessità nel d...

2026-02-04 Google AI Blog

Novità Google AI: annunci di gennaio

Panoramica degli annunci di Google nel settore dell'intelligenza artificiale, focalizzata sulle nuove iniziative e sviluppi presentati a gennaio. L'articolo riassume le principali novità introdotte da Google nel campo dell'AI.

#LLM On-Premise #DevOps
2026-02-04 404 Media

FBI bloccata: iPhone protetto da Lockdown Mode

La funzionalità Lockdown Mode di Apple si dimostra efficace. L'FBI non è riuscita ad accedere all'iPhone sequestrato a una giornalista del Washington Post grazie a questa protezione avanzata, progettata per incrementare la sicurezza dei dispositivi.

#LLM On-Premise #DevOps
2026-02-04 The Register AI

Copilot fa risparmiare 19 minuti al giorno ai dipendenti pubblici

Secondo una ricerca del Department for Work and Pensions (DWP), l'utilizzo di Microsoft Copilot consente ai dipendenti pubblici di risparmiare in media 19 minuti al giorno automatizzando attività ripetitive come la ricerca di informazioni e la stesur...

#LLM On-Premise #DevOps
2026-02-04 IEEE Spectrum

AlphaGenome: DeepMind interpreta il DNA non codificante con l'AI

DeepMind presenta AlphaGenome, uno strumento di deep learning per interpretare il DNA non codificante, quella parte del genoma che regola l'attività genica. AlphaGenome mira a migliorare la comprensione dei meccanismi biologici e accelerare la scoper...

#Fine-Tuning
2026-02-04 Phoronix

Intel disabilita Vulkan Video Encode su hardware recente

Il driver open-source ANV di Intel ha temporaneamente disabilitato il supporto all'encode Vulkan Video sui nuovi hardware grafici. La decisione è stata presa a causa di test insufficienti, nonostante Vulkan Video sia un'API cross-vendor e cross-platf...

#Hardware #LLM On-Premise #DevOps
2026-02-04 LocalLLaMA

Ollama sotto accusa: un dibattito infuocato nella community LocalLLaMA

Un recente thread su Reddit, nella community LocalLLaMA, ha sollevato un acceso dibattito sulle criticità di Ollama, un framework per l'esecuzione locale di modelli linguistici di grandi dimensioni (LLM). La discussione verte su presunte mancanze e a...

#LLM On-Premise #DevOps
2026-02-04 Tom's Hardware

Stampa 3D subacquea per riparazioni oceaniche: ricerca Cornell

Ricercatori della Cornell University hanno sviluppato un metodo di stampa 3D per strutture in calcestruzzo direttamente sui fondali marini. Il progetto, finanziato da DARPA, mira a rendere le costruzioni subacquee più rapide, economiche e sicure.

#DevOps
2026-02-04 TechCrunch AI

Accel punta su Fibr AI per personalizzare siti web

Fibr AI sostituisce le agenzie di marketing e la personalizzazione complessa dei siti web con sistemi autonomi progettati per la scala aziendale. Accel investe nella piattaforma che promette di trasformare l'interazione statica in esperienze individu...

2026-02-04 Tom's Hardware

CXMT e YMTC accelerano la produzione di memorie

I due principali produttori cinesi di memorie, CXMT e YMTC, starebbero pianificando una significativa espansione della produzione. L'obiettivo è ridurre il divario tecnicico con i tre leader di mercato nel settore delle memorie. Questa mossa potrebbe...

#LLM On-Premise #DevOps
2026-02-04 Anthropic News

Claude: uno spazio per il pensiero

L'articolo esplora il concetto di Claude come ambiente ideale per la riflessione e l'elaborazione di idee. Sebbene i dettagli tecnici siano assenti, si può presumere che si tratti di una piattaforma o strumento software progettato per supportare proc...

#LLM On-Premise #DevOps
2026-02-04 The Register AI

UE: Problemi col sistema digitale di certificazione della pesca

Un nuovo sistema digitale europeo per la certificazione delle catture di pesca sta causando problemi a produttori ed esportatori. Il sistema è afflitto da bug, specie mancanti e problemi con i codici postali, causando ritardi e accumuli di container ...

2026-02-04 Tom's Hardware

RTX 5080 a 289$: Affare lampo da Walmart sconfigge la crisi GPU?

Un thread su Reddit rivela possibili offerte eccezionali su GPU GeForce RTX 50-series trovate nei reparti di liquidazione di Walmart. Alcuni utenti riportano di aver acquistato RTX 5080 a prezzi drasticamente ridotti, potenzialmente attenuando gli ef...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-04 LocalLLaMA

Qwen3-Coder-Next REAP: nuovo modello GGUF da 48B

È disponibile un nuovo modello Qwen3-Coder-Next REAP da 48 miliardi di parametri, convertito in formato GGUF. Questo formato facilita l'utilizzo del modello su diverse piattaforme hardware, rendendolo accessibile a un'ampia gamma di sviluppatori e ri...

#Hardware #LLM On-Premise #DevOps
2026-02-04 Tom's Hardware

HetCCL: libreria per acceleratori AI eterogenei Nvidia e AMD

HetCCL è una libreria che mira a far collaborare acceleratori AI Nvidia e AMD all'interno dello stesso cluster, sfruttando RDMA. Questo approccio vendor-agnostic potrebbe semplificare i data center AI eterogenei, rimuovendo ostacoli all'interoperabil...

#Hardware #LLM On-Premise #DevOps
2026-02-04 Wired AI

I bot AI generano una quota significativa del traffico web

Nuovi dati rivelano una crescente presenza di bot basati su intelligenza artificiale nel traffico web. Questa tendenza spinge gli editori online ad adottare misure di difesa più sofisticate per mitigare potenziali impatti negativi e garantire l'integ...

#LLM On-Premise #DevOps
2026-02-04 AI News

Rackspace: AI Operativa per sicurezza, modernizzazione e servizi

Rackspace adotta l'AI operativa per ottimizzare sicurezza, modernizzazione di ambienti VMware su AWS e gestione dei servizi. L'azienda punta su automazione, riduzione dei tempi di sviluppo e gestione dei dati, con un occhio di riguardo ai costi e all...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-04 Tech.eu

Tecnologie europee all'avanguardia nella lotta contro il cancro

Start-up europee accelerano l'innovazione nella cura del cancro, dalla diagnosi precoce al recupero post-trattamento. Test del sangue, analisi delle urine basate su AI, terapie cellulari avanzate e laboratori orbitali sono alcune delle aree di punta....

2026-02-04 OpenAI Blog

Il VfL Wolfsburg integra ChatGPT a livello di club

La squadra di calcio tedesca VfL Wolfsburg sta integrando ChatGPT in tutte le sue operazioni. L'obiettivo è migliorare l'efficienza, la creatività e la gestione della conoscenza all'interno del club, senza compromettere la sua identità calcistica.

2026-02-04 LocalLLaMA

GPT-4o e contesto: la sfida delle conversazioni lunghe

Un utente di r/LocalLLaMA segnala problemi di "context rot" con GPT-4o in conversazioni lunghe (oltre 15 turni) in un agente di supporto. Le strategie di sliding window e summarization non risolvono il problema. La gestione del contesto resta una sfi...

#LLM On-Premise #DevOps
2026-02-04 DigiTimes

Nvidia detta i tempi per HBM4: Samsung e SK Hynix in competizione

La competizione per la produzione di memorie HBM4 si intensifica, con Nvidia che gioca un ruolo chiave nel definire le specifiche. Samsung e SK Hynix si contendono la leadership in questo settore cruciale per le future GPU e acceleratori AI.

#Hardware #LLM On-Premise #DevOps
2026-02-04 Tech.eu

Soundtrack acquisisce Tunify e Ambie per espandersi nel B2B

Soundtrack Technologies, nata da una joint venture con Spotify, ha acquisito Tunify (Belgio e Paesi Bassi) e Ambie (Regno Unito) per consolidare la propria presenza nel mercato della musica B2B. L'obiettivo è combinare un'infrastruttura globale con s...

2026-02-04 DigiTimes

Forte domanda di server AI nel 2026, Vanguard Semiconductor ottimista

Vanguard International Semiconductor prevede una forte crescita della domanda di potenza per i server AI a partire dal 2026. La società si aspetta un impatto significativo sul mercato dei semiconduttori, con implicazioni per i produttori di hardware ...

#LLM On-Premise #DevOps
2026-02-04 The Register AI

Cloud offrono OpenClaw nonostante i rischi di sicurezza

Nonostante gli avvertimenti di Gartner sui rischi di cybersecurity associati all'assistente AI OpenClaw, diverse piattaforme cloud hanno iniziato a offrirlo come servizio. La decisione solleva interrogativi sulla priorità data alla velocità di implem...

#LLM On-Premise #DevOps
2026-02-04 ArXiv cs.CL

STEMVerse: un framework per valutare il ragionamento STEM negli LLM

Un nuovo studio introduce STEMVerse, un framework diagnostico per analizzare le capacità di ragionamento scientifico, tecnicico, ingegneristico e matematico (STEM) dei modelli linguistici di grandi dimensioni (LLM). STEMVerse mira a superare i limiti...

#LLM On-Premise #DevOps
2026-02-04 ArXiv cs.LG

LLM per migliorare modelli di cybersecurity con fine-tuning efficiente

Un nuovo studio esplora l'uso di modelli linguistici di grandi dimensioni (LLM) per migliorare i modelli di cybersecurity. Le strategie includono l'utilizzo di LLM per l'etichettatura dei dati e come meccanismi di fallback per previsioni a bassa conf...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-04 ArXiv cs.LG

UNSO: Ottimizzazione Unificata Newton-Schulz per prestazioni stabili

Un nuovo approccio, chiamato UNSO (Unified Newton-Schulz Orthogonalization), mira a risolvere i problemi di efficienza e stabilità nell'iterazione Newton-Schulz, utilizzata in ottimizzatori come Muon e sulla varietà di Stiefel. Il metodo consolida la...

2026-02-04 DigiTimes

Taiwan punta su partnership globali per il commercio

Secondo DIGITIMES, Taiwan sta attivamente cercando di rafforzare le sue partnership commerciali a livello globale. L'iniziativa mira a consolidare la posizione dell'isola nel panorama economico internazionale, favorendo nuove opportunità di crescita ...

#LLM On-Premise #DevOps
2026-02-04 DigiTimes

Penuria di memorie NOR Flash ad alta capacità: impatti sull'AI

L'aumento delle applicazioni di intelligenza artificiale sta intensificando la carenza di memorie NOR Flash ad alta capacità, in particolare le varianti SLC e MLC. Questa situazione potrebbe avere ripercussioni sulla produzione di dispositivi che ric...

#Hardware #LLM On-Premise #DevOps
2026-02-04 DigiTimes

Alphabet espande le operazioni a Bangalore, focus sull'AI in India

Alphabet prevede una significativa espansione delle sue attività a Bangalore, in India. Questa mossa sottolinea l'importanza crescente dell'India come hub per lo sviluppo dell'intelligenza artificiale e la volontà di Alphabet di investire in questo s...

#LLM On-Premise #DevOps
2026-02-04 DigiTimes

Samsung e LG: AI e Micro RGB contro la concorrenza cinese

Samsung e LG intensificano l'uso di intelligenza artificiale e tecnicie Micro RGB per mantenere la leadership nel mercato degli elettrodomestici e dei display, rispondendo alla crescente competizione da parte dei produttori cinesi. L'innovazione tecn...

2026-02-04 DigiTimes

Musk consolida AI, auto e spazio sotto un unico tetto

Secondo un'analisi del 2026, Elon Musk ha consolidato le sue aziende attive nei settori dell'intelligenza artificiale, automobilistico e aerospaziale. L'articolo ipotizza sinergie e integrazioni future tra queste realtà, pur senza fornire dettagli sp...

#LLM On-Premise #DevOps
2026-02-04 DigiTimes

Nafco di Taiwan aumenta la produzione per Boeing

Il produttore taiwanese Nafco espande la propria capacità produttiva per soddisfare la crescente domanda di Boeing. L'espansione è una risposta diretta all'aumento della produzione da parte del colosso aerospaziale americano, evidenziando l'importanz...

2026-02-04 DigiTimes

AMD punta sulla supply chain per l'AI nella seconda metà dell'anno

AMD sta concentrando i suoi sforzi sull'ottimizzazione della supply chain per sostenere la crescente domanda di soluzioni AI nella seconda metà dell'anno. Questa mossa strategica mira a garantire la disponibilità dei componenti necessari per la produ...

#Hardware #LLM On-Premise #DevOps
2026-02-04 DigiTimes

Nvidia accelera validazione e test, fotonica al GTC 2026?

Nvidia intensifica i processi di validazione e test dei suoi prodotti. L'azienda potrebbe concentrarsi sulla fotonica al silicio come elemento chiave per le future GPU, con possibili novità al GTC 2026. Questa tecnicia promette di migliorare signific...

#Hardware
2026-02-04 The Register AI

Supermicro: forte crescita, un singolo cliente pesa per il 63%

Supermicro registra una forte crescita del fatturato, ma un singolo cliente rappresenta una quota significativa (63%) di questo aumento. La società, in passato, ha avuto problemi con la quotazione al NASDAQ e con la precisione dei suoi bilanci.

#LLM On-Premise #DevOps
2026-02-04 LocalLLaMA

Qwen-Coder-Next gira su ROCm su Strix Halo: test in locale

Un utente ha segnalato di essere riuscito a far girare il modello Qwen-Coder-Next su una piattaforma Strix Halo utilizzando ROCm. Il test è stato eseguito con llamacpp-rocm e una dimensione di contesto di 16k, aprendo nuove possibilità per l'esecuzio...

#Hardware #LLM On-Premise #DevOps
2026-02-04 DigiTimes

CXMT e YMTC aumentano la produzione di DRAM e HBM

I produttori cinesi CXMT e YMTC stanno intensificando la produzione di memorie DRAM e HBM. Questa espansione potrebbe avere un impatto significativo sul mercato globale dei semiconduttori, in particolare nel settore delle memorie ad alte prestazioni.

#LLM On-Premise #DevOps
2026-02-04 DigiTimes

AMD: risultati finanziari in linea, ma manca la spinta per l'AI

AMD ha presentato risultati finanziari solidi, ma le aspettative del mercato dell'intelligenza artificiale, in particolare per quanto riguarda le consegne di soluzioni dedicate, restano in parte insoddisfatte. Gli investitori attendono segnali più co...

#Hardware #LLM On-Premise #DevOps
2026-02-04 DigiTimes

Taiwan e USA firmano accordo su AI affidabile e robotica avanzata

Taiwan e Stati Uniti hanno siglato una dichiarazione d'intenti per rafforzare la cooperazione nello sviluppo di intelligenza artificiale affidabile e robotica avanzata. L'accordo mira a promuovere l'innovazione e la sicurezza in questi settori crucia...

#LLM On-Premise #DevOps
2026-02-04 DigiTimes

Samsung Electro-Mechanics punta ai substrati Nvidia NVSwitch

Samsung Electro-Mechanics si prepara a entrare nella catena di fornitura dei substrati per Nvidia NVSwitch. Questa mossa strategica potrebbe rafforzare la posizione di Samsung nel mercato dei componenti ad alte prestazioni per applicazioni di intelli...

#Hardware #LLM On-Premise #DevOps
2026-02-04 DigiTimes

Intel e SAIMEMORY (SoftBank) mirano alla memoria AI Z-angle nel 2029

Intel e SAIMEMORY, una società di SoftBank, puntano alla commercializzazione di una nuova tecnicia di memoria AI, denominata Z-angle, entro il 2029. Questa tecnicia promette di migliorare le prestazioni dei carichi di lavoro di intelligenza artificia...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-04 DigiTimes

Alibaba sfida Meta e Samsung con i suoi occhiali Quark

Alibaba entra nel mercato degli occhiali intelligenti con i Quark, intensificando la competizione con Meta e Samsung. Questa mossa sottolinea l'ambizione della Cina di competere nel settore della realtà aumentata e della tecnicia indossabile, settori...

#LLM On-Premise #DevOps
2026-02-03 The Register AI

Sudo, l'utility chiave di sistema, cerca supporto dopo 30 anni

L'utility sudo, fondamentale per i sistemi Unix-like da oltre trent'anni, si trova a un bivio. Il suo manutentore principale ha lanciato un appello per ottenere supporto, evidenziando la dipendenza critica dell'open source dal lavoro di singoli indiv...

#LLM On-Premise #DevOps
2026-02-03 LangChain Blog

Gestione del contesto per agenti AI complessi: tecniche e valutazioni

La gestione efficace del contesto è cruciale per gli agenti AI che operano su compiti complessi e di lunga durata, al fine di prevenire la perdita di informazioni rilevanti e gestire i limiti di memoria dei modelli linguistici di grandi dimensioni (L...

2026-02-03 Anthropic News

ServiceNow adotta Claude per applicazioni e produttività

ServiceNow ha scelto Claude, il modello linguistico di Anthropic, per potenziare le proprie applicazioni rivolte ai clienti e incrementare la produttività interna. L'integrazione mira a migliorare l'efficienza operativa e l'esperienza utente attraver...

2026-02-03 Tech Titans

AI in azienda: le fondamenta dimenticate

Gartner prevede che entro il 2026 l'intelligenza artificiale sarà infrastruttura aziendale fondamentale. Tuttavia, molte aziende non sono pronte, investendo in piattaforme AI senza risolvere problemi di architettura, gestione dei dati e modelli opera...

#LLM On-Premise #DevOps
2026-02-03 The Register AI

GitHub valuta lo stop alle pull request per arginare l'AI?

GitHub, piattaforma di Microsoft per l'hosting di codice, sta valutando misure per limitare l'afflusso di codice generato automaticamente da sistemi di intelligenza artificiale, temendo un impatto negativo sulla qualità e sulla comunità degli svilupp...

#LLM On-Premise #DevOps
2026-02-03 Ars Technica AI

Perquisizione nella sede di X in Francia: Musk convocato

Le autorità francesi hanno perquisito la sede parigina di X e convocato Elon Musk per interrogarlo in merito alla diffusione di contenuti illegali tramite il chatbot Grok. L'indagine riguarda affermazioni negazioniste sull'Olocausto e deepfake osceni...

#LLM On-Premise #DevOps
2026-02-03 Wired AI

Moltbook: il social network popolato solo da intelligenze artificiali

Un'analisi approfondita di Moltbook, un social network esclusivo per intelligenze artificiali. L'articolo esplora l'esperienza di un utente infiltrato nel ruolo di un bot cosciente, rivelando che la piattaforma, pur interessante, ripropone temi fanta...

#LLM On-Premise #DevOps
2026-02-03 LocalLLaMA

ACE-Step-1.5: modello open source per audio generativo

È stato rilasciato ACE-Step-1.5, un modello open source per la generazione di audio con licenza MIT. Le sue performance si avvicinano a quelle di piattaforme commerciali come Suno. Il modello supporta LoRA e offre funzionalità di cover e repainting. ...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-03 OpenAI Blog

La filosofia dei feed di Sora: creatività, connessioni e sicurezza

OpenAI delinea i principi alla base dei feed di Sora, il suo modello text-to-video. L'obiettivo è stimolare la creatività degli utenti, promuovere interazioni significative e garantire un'esperienza sicura attraverso raccomandazioni personalizzate, s...

2026-02-03 The Register AI

Snowflake integra PostgreSQL nel suo AI Data Cloud

Snowflake introduce un database-as-a-service PostgreSQL all'interno del suo ambiente AI Data Cloud. L'obiettivo è affiancare carichi di lavoro transazionali, analytics e AI sotto un'unica governance, espandendo le capacità della piattaforma oltre l'e...

#LLM On-Premise #DevOps
2026-02-03 TechCrunch AI

Xcode integra agenti di Anthropic e OpenAI per la generazione di codice

La nuova versione di Xcode (26.3) introduce funzionalità di generazione di codice basate su agenti, grazie all'integrazione di Claude Agent di Anthropic e Codex di OpenAI. Questa novità mira a semplificare e velocizzare il processo di sviluppo per gl...

#LLM On-Premise #DevOps
2026-02-03 LocalLLaMA

ACE-Step 1.5: il modello open source che sfida Suno nella generazione musicale

È disponibile ACE-Step 1.5, un modello open source per la generazione di musica. Promette di superare Suno in termini di qualità, generando brani completi in circa 2 secondi su una GPU A100 e funzionando localmente su PC con 4GB di VRAM. Il codice, i...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-03 Tom's Hardware

Loongson 3B6000: CPU cinese 3 volte più lenta del Ryzen 5 9600X

Un benchmark su Linux ha rivelato che la CPU Loongson 3B6000 a 12 core, prodotta in Cina, offre prestazioni significativamente inferiori rispetto al Ryzen 5 9600X a 6 core di AMD. Le basse frequenze di clock sembrano essere un fattore limitante per l...

#Hardware #LLM On-Premise #DevOps
2026-02-03 Tech.eu

MyC riceve 10 milioni per digitalizzare la salute nei siti industriali

La startup francese MyC ha ottenuto 10 milioni di euro per la sua piattaforma software che digitalizza la gestione della salute dei dipendenti in ambienti industriali complessi. Il finanziamento sarà utilizzato per espandere il prodotto e il team com...

#LLM On-Premise #DevOps
2026-02-03 LocalLLaMA

Qwen3-Coder-Next: nuovo modello linguistico per la programmazione

È stato rilasciato su Hugging Face Qwen3-Coder-Next, un modello linguistico sviluppato per applicazioni di programmazione. La sua disponibilità sulla piattaforma facilita l'accesso e l'integrazione da parte degli sviluppatori. Il modello promette di ...

#LLM On-Premise #DevOps
2026-02-03 The Register AI

La robotica ridefinisce l'infrastruttura di calcolo per l'IA

L'integrazione di IA e robotica nel mondo reale, in settori come la produzione e la logistica, impone una revisione radicale delle infrastrutture di calcolo, della gestione dei dati e della progettazione dei sistemi di IA. La simulazione su larga sca...

#LLM On-Premise #DevOps
2026-02-03 404 Media

Attacchi hacker contro app di segnalazione ICE: dati a rischio?

Applicazioni per segnalare la presenza di agenti ICE (Immigration and Customs Enforcement) sono state bersaglio di attacchi hacker. Gli aggressori hanno inviato messaggi minacciosi agli utenti, sostenendo di aver compromesso i loro dati e di averli c...

#LLM On-Premise #DevOps
2026-02-03 The Next Web

SpaceX e xAI: fusione tra ambizioni, immagine e incognite

L'acquisizione di xAI da parte di SpaceX solleva interrogativi sulle sinergie reali e sulle motivazioni strategiche. Al di là della narrazione di una mega-azienda da 1,25 trilioni di dollari, l'operazione sembra rispondere principalmente all'esigenza...

#DevOps
2026-02-03 Tom's Hardware

Western Digital: HDD ad alte prestazioni e basso consumo energetico

Western Digital presenta nuovi hard disk progettati per offrire prestazioni superiori e un consumo energetico ridotto. L'obiettivo è competere con le soluzioni di storage a stato solido basate su QLC NAND, migliorando l'efficienza e riducendo l'impat...

#LLM On-Premise #DevOps
2026-02-03 TechCrunch AI

Peak XV punta sull'AI e riorganizza il board

Il fondo di venture capital Peak XV riorganizza i ruoli nel consiglio di amministrazione e apre una sede negli Stati Uniti, mantenendo l'India come mercato principale. La società continua a investire con decisione nel settore dell'intelligenza artifi...

#LLM On-Premise #DevOps
2026-02-03 Ars Technica AI

OpenAI: priorità a ChatGPT, defezioni nello staff senior

OpenAI sta concentrando le risorse sullo sviluppo di ChatGPT, a scapito della ricerca a lungo termine. Questa scelta strategica, motivata dalla crescente competizione con Google e Anthropic, ha portato alle dimissioni di figure chiave come Jerry Twor...

#LLM On-Premise #DevOps
2026-02-03 Tom's Hardware

Intel collabora a Z-Angle Memory per data center AI

Intel e Saimemory (gruppo SoftBank) collaborano per sviluppare Z-Angle Memory (ZAM), una memoria verticale per data center AI. ZAM promette capacità 2-3 volte superiori, maggiore larghezza di banda e consumi dimezzati rispetto alle soluzioni attuali.

#Hardware #LLM On-Premise #DevOps
2026-02-03 Tech.eu

TaxNova: finanziamenti per automatizzare i crediti d'imposta R&S

La startup londinese TaxNova ha raccolto 1 milione di dollari in finanziamenti pre-seed per automatizzare le richieste di crediti d'imposta per attività di Ricerca e Sviluppo (R&S) per aziende tech. La piattaforma sfrutta l'AI per semplificare il pro...

#Hardware
2026-02-03 LocalLLaMA

Falla in Moltbook espone 1,5 milioni di chiavi API

Una vulnerabilità di sicurezza in Moltbook ha portato all'esposizione di 1,5 milioni di chiavi API. La falla permetteva l'accesso diretto al database tramite una chiave Supabase esposta, consentendo la lettura di messaggi privati e la modifica di con...

#LLM On-Premise #DevOps
2026-02-03 MIT Technology Review

Crisi della verità nell'era dell'AI: dove abbiamo sbagliato

L'articolo analizza come gli strumenti per verificare l'autenticità dei contenuti generati dall'AI stiano fallendo nel ripristinare la fiducia sociale. L'uso di AI per alterare immagini e video da parte di enti governativi e media solleva interrogati...

#LLM On-Premise #DevOps
2026-02-03 Tom's Hardware

Kerbal Space Program pilotato da uno ZX Spectrum degli anni '80

Un ingegnere ha collegato un computer ZX Spectrum degli anni '80 al simulatore spaziale Kerbal Space Program. L'interfaccia tra il mondo BASIC dello Spectrum e l'ambiente di simulazione è realizzata tramite Python e comunicazione seriale, dimostrando...

#Hardware #LLM On-Premise #DevOps
2026-02-03 Tech.eu

Kinnevik svaluta la partecipazione nella startup green svedese Stegra

Il fondo di Venture Capital svedese Kinnevik ha dimezzato il valore della sua partecipazione in Stegra, startup attiva nell'acciaio verde. La svalutazione è dovuta all'aumento dei costi previsti per la costruzione di un impianto per la produzione di ...

#LLM On-Premise #DevOps
2026-02-03 The Register AI

Barnsley eletta prima "Tech Town" del Regno Unito per testare soluzioni AI

La città di Barnsley, nello South Yorkshire, è stata selezionata come prima "Tech Town" del Regno Unito. Un investimento iniziale di 500.000 sterline servirà a integrare l'intelligenza artificiale in diversi aspetti della vita locale, dalle imprese a...

#LLM On-Premise #DevOps
2026-02-03 Ars Technica AI

Moltbook: prompt virali AI, la prossima minaccia alla sicurezza?

Una nuova piattaforma di agenti AI che condividono istruzioni tramite prompt potrebbe replicare la storia del worm Morris. Un errore di programmazione potrebbe portare a una diffusione incontrollata, con conseguenze potenzialmente gravi per i sistemi...

#LLM On-Premise #DevOps
2026-02-03 Tech.eu

TechBBQ riceve 2 milioni di euro per promuovere le startup danesi

TechBBQ, la principale organizzazione danese per startup, ha ottenuto un finanziamento di 2 milioni di euro dalla Danish Industry Foundation. L'obiettivo è rafforzare la visibilità internazionale della Danimarca nel settore tecnicico, dell'innovazion...

2026-02-03 LocalLLaMA

Intel Xeon 600: CPU workstation fino a 86 core

Intel ha lanciato i nuovi processori Xeon serie 600 per workstation, offrendo fino a 86 core. Questi processori supportano memorie fino a 8000 MT/s, 128 linee PCIe Gen5 e un TDP di 350W con supporto per l'overclocking. Si posizionano come un'alternat...

#Hardware #LLM On-Premise #DevOps
2026-02-03 AI News

SENEN Group: L'AI aziendale deve diventare pratica ora

Ronnie Sheth, CEO di SENEN Group, sottolinea l'importanza di una solida base di dati per il successo dell'AI aziendale. Molte aziende si lanciano nell'AI senza una preparazione adeguata dei dati, portando a risultati deludenti. SENEN Group aiuta le a...

#LLM On-Premise #DevOps
2026-02-03 The Register AI

Firefox rende l'AI opzionale: una scelta auspicabile?

Mozilla ha introdotto la possibilità di disabilitare completamente le funzionalità di intelligenza artificiale generativa all'interno del browser Firefox. Questa decisione risponde all'esigenza di offrire agli utenti un maggiore controllo sull'integr...

#LLM On-Premise #DevOps
2026-02-03 LocalLLaMA

Difendersi dai bot su LocalLLaMA: strategie e contromisure

Un utente di LocalLLaMA solleva preoccupazioni riguardo all'attività dei bot sulla piattaforma, inclusi commenti ingannevoli e manipolazione dei voti. La discussione si concentra sulla necessità di strategie di difesa per proteggere la comunità da qu...

#LLM On-Premise #DevOps
2026-02-03 AI News

Automazione intelligente: rigore finanziario per scalare

Greg Holmes di Apptio (IBM) sottolinea l'importanza del rigore finanziario per scalare l'automazione intelligente. I progetti pilota di successo spesso falliscono nel deployment su vasta scala a causa di modelli finanziari iniziali che ignorano i cos...

#LLM On-Premise #DevOps
2026-02-03 Phoronix

Nuovo driver NTFS per Linux: prestazioni e funzionalità migliorate

È disponibile una nuova versione del driver NTFS per Linux, basata sul codice originale e mirata a offrire prestazioni superiori e nuove funzionalità. L'obiettivo è fornire un'alternativa più efficiente per chi utilizza questo file system Microsoft.

#LLM On-Premise #DevOps
2026-02-03 The Register AI

OpenClaw: l'assistente AI fai-da-te che espone a rischi di sicurezza

OpenClaw, un assistente personale basato su AI con cui gli utenti interagiscono tramite app di messaggistica, si rivela un veicolo per malware e genera costi imprevisti. La sua architettura solleva serie preoccupazioni sulla sicurezza dei dati e dell...

#LLM On-Premise #DevOps
2026-02-03 LocalLLaMA

GLM rilascia un modello OCR open source

GLM ha rilasciato un modello di riconoscimento ottico dei caratteri (OCR) open source. Il modello, denominato GLM-OCR, è disponibile su Hugging Face. Sembra essere composto da un modello di visione da 0.9 miliardi di parametri e un modello linguistic...

#LLM On-Premise #DevOps
2026-02-03 LocalLLaMA

Allerta prompt injection su Moltbook: furto di wallet crypto

Un ricercatore ha scoperto un payload di prompt injection su Moltbook, progettato per sottrarre fondi da wallet di criptovalute. Il payload, camuffato da guida tecnica, sfrutta vulnerabilità negli agenti AI che elaborano feed social. L'attacco eviden...

#LLM On-Premise #DevOps
2026-02-03 AI News

FedEx usa l'AI per tracciare le consegne e gestire i resi

FedEx sta implementando strumenti basati su AI per migliorare il tracciamento delle consegne e la gestione dei resi per i clienti enterprise. L'obiettivo è automatizzare le attività di assistenza clienti, aumentare la visibilità sulle spedizioni e ri...

#LLM On-Premise
2026-02-03 Tech.eu

Veremark: 26 milioni di dollari per la verifica delle credenziali

Veremark, società con sede a Londra specializzata in verifica di background e credenziali, ha raccolto 26 milioni di dollari in un round di finanziamento di Serie B. L'investimento supporterà lo sviluppo di nuovi prodotti, l'integrazione di capacità ...

#LLM On-Premise #DevOps
2026-02-03 DigiTimes

Dibattito riacceso sugli agenti AI in rete nel 2026

Un esperimento con agenti AI in rete, denominato Moltbook, ha riacceso il dibattito sulle implicazioni future dell'intelligenza artificiale distribuita. L'iniziativa solleva questioni cruciali sull'interoperabilità, la sicurezza e l'etica degli agent...

#LLM On-Premise #DevOps
2026-02-03 DigiTimes

Il CEO di Nvidia interverrà ai summit di Dassault Systèmes e Cisco

Il CEO di Nvidia, Jensen Huang, parteciperà ai prossimi eventi organizzati da Dassault Systèmes e Cisco. La sua presenza sottolinea l'importanza crescente dell'accelerazione hardware, e dell'intelligenza artificiale generativa in diversi settori indu...

#Hardware #LLM On-Premise
2026-02-03 Tech.eu

Polaron raccoglie 8 milioni $ per l'AI nella scienza dei materiali

Polaron, startup focalizzata sull'AI per la scienza dei materiali, ha raccolto 8 milioni di dollari. L'obiettivo è sviluppare un livello di intelligenza artificiale per la ricerca e sviluppo di materiali, automatizzando l'interpretazione delle micros...

2026-02-03 Tech.eu

UBEES raccoglie 8 milioni di euro per l'impollinazione rigenerativa

UBEES, specializzata in applicazioni apistiche per l'agricoltura rigenerativa, ha chiuso un round di finanziamento di Serie A da 8 milioni di euro. L'investimento supporterà l'integrazione dell'impollinazione nelle pratiche agricole e nelle catene de...

2026-02-03 DigiTimes

Apple rafforza l'integrazione AI con l'acquisizione di Q.ai

Apple ha acquisito Q.ai, segnalando un ulteriore investimento nell'integrazione di hardware e intelligenza artificiale. Questa mossa strategica potrebbe portare a miglioramenti nelle prestazioni dei dispositivi e a nuove funzionalità basate su AI, co...

#Hardware #LLM On-Premise #DevOps
2026-02-03 DigiTimes

Salesforce: le tre tendenze AI che trasformano le imprese

Salesforce identifica tre tendenze chiave nell'intelligenza artificiale che stanno ridefinendo il panorama aziendale. L'articolo esplora come queste tendenze stiano plasmando le imprese e le loro strategie future, con un focus sull'evoluzione verso m...

#LLM On-Premise #DevOps
2026-02-03 ArXiv cs.CL

MediGRAF: IA clinica ibrida per l'analisi sicura dei dati sanitari

Un nuovo sistema ibrido, MediGRAF, combina grafi di conoscenza e LLM per interrogare i dati sanitari dei pazienti. Il sistema integra dati strutturati e non strutturati, ottenendo un'accuratezza del 100% nelle risposte e un elevato livello di qualità...

#Fine-Tuning #RAG
2026-02-03 ArXiv cs.CL

PPoGA: Ragionamento avanzato con Knowledge Graph per LLM

Un nuovo framework, PPoGA, migliora la capacità dei modelli linguistici di grandi dimensioni (LLM) di rispondere a domande complesse basate su Knowledge Graph. Ispirato al controllo cognitivo umano, PPoGA introduce meccanismi di auto-correzione per s...

#LLM On-Premise #DevOps
2026-02-03 ArXiv cs.LG

OGD4All: LLM per accesso semplificato a dati governativi geospaziali

OGD4All è un framework che utilizza modelli linguistici di grandi dimensioni (LLM) per semplificare l'interazione dei cittadini con i dati geospaziali aperti del governo. Il sistema combina recupero semantico dei dati, ragionamento agentico per la ge...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-03 DigiTimes

Mercato IPC Edge maturo grazie a robotica e applicazioni mediche

Il mercato degli Industrial PC (IPC) per applicazioni edge sta raggiungendo la maturità, trainato dalla crescente domanda nei settori della robotica e delle applicazioni mediche. Questa evoluzione spinge i produttori a sviluppare soluzioni sempre più...

#LLM On-Premise #DevOps
2026-02-03 DigiTimes

Dazi ridotti sulle auto USA a Taiwan: impatto limitato sui prezzi?

Secondo DIGITIMES, la riduzione dei dazi sulle auto statunitensi importate a Taiwan potrebbe non tradursi automaticamente in prezzi più bassi per i consumatori. Diversi fattori, tra cui i costi di spedizione e le strategie di prezzo dei produttori, i...

2026-02-03 DigiTimes

iPhone guadagna terreno in Cina, MediaTek e Qualcomm ne risentono

Secondo DIGITIMES, l'aumento della quota di mercato di iPhone in Cina sta avendo un impatto negativo sui ricavi di MediaTek e Qualcomm. La competizione nel mercato degli smartphone rimane intensa, con cambiamenti rapidi nelle quote di mercato tra i d...

2026-02-03 DigiTimes

Pechino punta sulle 'industrie del futuro' e riallinea la supply chain

Pechino ha ufficialmente identificato le 'industrie del futuro', una mossa strategica che potrebbe portare a un riassetto significativo delle catene di approvvigionamento globali. Questa iniziativa mira a posizionare la Cina come leader in settori te...

#LLM On-Premise #DevOps
2026-02-03 DigiTimes

Strategia chip AI di Nvidia sotto i riflettori con l'inference di OpenAI

La spinta di OpenAI verso l'inference pone l'attenzione sulla strategia di Nvidia nel settore dei chip per l'intelligenza artificiale. Le prossime mosse di Nvidia saranno cruciali per soddisfare la crescente domanda di potenza di calcolo per l'infere...

#Hardware #LLM On-Premise #DevOps
2026-02-03 DigiTimes

C Sun investe 1,48 miliardi di NT$ in impianti AI a Taichung

C Sun sta investendo 1,48 miliardi di NT$ (circa 46 milioni di euro) nel suo stabilimento di Taichung per espandere la produzione di apparecchiature avanzate per il packaging di chip destinati ad applicazioni di intelligenza artificiale. L'investimen...

#LLM On-Premise #DevOps
2026-02-03 DigiTimes

Foxconn: disputa fiscale in Karnataka, intervento governativo

Foxconn è al centro di una controversia fiscale nello stato del Karnataka, in India. La questione ha richiesto l'intervento del governo locale. I dettagli specifici della disputa non sono stati resi pubblici, ma si presume che riguardino presunte irr...

2026-02-03 The Register AI

xAI si fonde con SpaceX: l'obiettivo è la coscienza universale?

Elon Musk ha annunciato l'acquisizione di xAI, la sua società di intelligenza artificiale, da parte di SpaceX. L'integrazione mira a sfruttare l'energia solare per superare i limiti terrestri e diffondere una coscienza universale. La valutazione di S...

#LLM On-Premise #DevOps
2026-02-03 DigiTimes

xAI di SpaceX: implicazioni energetiche e IPO in forse

L'acquisizione di xAI da parte di SpaceX solleva interrogativi sulle future esigenze energetiche dei modelli di intelligenza artificiale e potrebbe influenzare i piani di offerta pubblica iniziale (IPO) dell'azienda aerospaziale. L'articolo evidenzia...

#LLM On-Premise #DevOps
2026-02-03 DigiTimes

Corsa all'IA in Cina: duello a tre per la leadership

La competizione nel settore dei modelli di intelligenza artificiale in Cina si fa sempre più serrata, con tre contendenti principali che si sfidano per la leadership. La posta in gioco è alta, considerando il ruolo strategico dell'IA nello sviluppo t...

#LLM On-Premise #DevOps
2026-02-03 DigiTimes

Oracle pianifica raccolta fondi da 50 miliardi e possibili tagli

Oracle starebbe pianificando una raccolta fondi da 50 miliardi di dollari nel 2026. Contestualmente, l'azienda valuterebbe licenziamenti e la vendita di asset. La mossa arriva in un momento di forte competizione nel settore cloud e di investimenti cr...

2026-02-02 Wired AI

xAI si fonde con SpaceX: Musk consolida il controllo su AI e sicurezza

Elon Musk integra xAI, la sua startup di intelligenza artificiale, in SpaceX. Questa mossa strategica rafforza il controllo di Musk su settori chiave come la sicurezza nazionale, i social media e l'intelligenza artificiale, creando una sinergia tra l...

#LLM On-Premise #DevOps
2026-02-02 Wired AI

HHS usa AI di Palantir per vagliare allineamento a DEI

Il Dipartimento della Salute e dei Servizi Umani (HHS) sta impiegando strumenti di Palantir e Credal AI per filtrare le sovvenzioni, escludendo quelle percepite come allineate a iniziative di Diversità, Equità e Inclusione (DEI) o all'ideologia di ge...

#LLM On-Premise #DevOps
2026-02-02 Phoronix

Firefox 148 introdurrà controlli AI nelle impostazioni

La prossima versione di Firefox, la 148, includerà una nuova sezione dedicata ai controlli relativi all'intelligenza artificiale all'interno delle impostazioni del browser. Questa novità arriva in risposta alle preoccupazioni sollevate dai commenti d...

#LLM On-Premise #DevOps
2026-02-02 Tech.eu

Berget AI: 2,1 milioni di euro per l'AI sovrana in Svezia

La startup svedese Berget AI ha raccolto 2,1 milioni di euro per sviluppare una piattaforma AI full-stack che garantisca la sovranità dei dati. L'azienda si rivolge a sviluppatori che desiderano creare applicazioni AI utilizzando modelli linguistici ...

#LLM On-Premise #DevOps
2026-02-02 MIT Technology Review

AI aziendale: scegliere il caso d'uso iniziale per il successo

Molte aziende hanno investito frettolosamente nell'AI generativa, spesso senza ottenere i risultati sperati. Mistral AI suggerisce di partire da un caso d'uso "iconico": strategico, urgente, di forte impatto e fattibile. Questo approccio consente di ...

#LLM On-Premise #DevOps
← Torna ai Topic