Topic / Trend Rising

Sviluppo e Rilasci di Modelli AI

Numerosi articoli evidenziano il continuo sviluppo e rilascio di nuovi modelli di intelligenza artificiale, inclusi LLM, da parte di aziende come OpenAI, Google, Alibaba e Microsoft. Questi modelli sono progettati per varie applicazioni, dalla generazione di codice al riconoscimento delle immagini, e sono costantemente ottimizzati per prestazioni ed efficienza.

Detected: 2026-01-25 · Updated: 2026-03-07

Articoli Correlati

2026-03-07 The Next Web

Anthropic lancia un marketplace per software basato su Claude

Anthropic introduce un marketplace dedicato ai clienti enterprise che utilizzano le API e i servizi di Claude. Questa mossa strategica mira a consolidare la presenza di Anthropic nel settore enterprise, nonostante le sfide politiche e normative.

#LLM On-Premise #DevOps
2026-03-07 DigiTimes

Rimescolamenti in Qwen scatenano competizione per talenti AI

Movimenti interni al team di Qwen, il modello linguistico di Alibaba, hanno innescato una competizione per accaparrarsi i migliori esperti di intelligenza artificiale. Z.ai e DeepMind tra le aziende più attive nel reclutamento.

#LLM On-Premise #DevOps
2026-03-07 DigiTimes

GCS punta ai componenti ottici da 200G nel 2026 spinta dalla domanda AI

Secondo DIGITIMES, GCS prevede di aumentare la produzione di componenti ottici da 200G nel 2026, in risposta alla crescente domanda di soluzioni per l'intelligenza artificiale. Questa mossa strategica mira a soddisfare le esigenze di larghezza di ban...

#LLM On-Premise #DevOps
2026-03-07 The Register AI

Anthropic rivaluta impatto IA sul lavoro: effetti inferiori alle stime

Gli economisti di Anthropic, Maxim Massenkoff e Peter McCrory, hanno pubblicato una ricerca che indica un impatto inferiore alle aspettative dell'IA sull'occupazione. Contrariamente a previsioni allarmistiche, lo studio suggerisce che l'IA non sta el...

#LLM On-Premise #DevOps
2026-03-06 Wired AI

Disturbatore di segnale per wearable AI: un progetto ambizioso

Un neolaureato di Harvard ha sviluppato Spectre I, un dispositivo che mira a proteggere la privacy degli utenti bloccando i segnali dei dispositivi wearable dotati di intelligenza artificiale sempre attivi. La sua efficacia è però messa in discussion...

2026-03-06 PyTorch Blog

KernelAgent: Ottimizzazione GPU Guidata dall'Hardware con Multi-Agent

Il team PyTorch ha rilasciato KernelAgent, un sistema agentico open source che ottimizza i kernel GPU basandosi sui segnali di performance dell'hardware. KernelAgent raggiunge un miglioramento medio di 1.56x rispetto a torch.compile e genera kernel c...

#Hardware #LLM On-Premise #DevOps
2026-03-06 TechCrunch AI

Anthropic scopre 22 vulnerabilità in Firefox in due settimane

In una recente collaborazione con Mozilla, Anthropic ha identificato 22 vulnerabilità distinte nel browser Firefox. Quattordici di queste sono state classificate come "ad alta gravità", evidenziando l'importanza della continua analisi della sicurezza...

#LLM On-Premise #DevOps
2026-03-06 The Next Web

Sicurezza online: smascherare l'illusione

Il costo globale del cybercrime ammonta a miliardi di dollari ogni anno, con phishing, violazioni di dati personali ed estorsioni che rappresentano una quota significativa delle perdite. La protezione personale non è più opzionale, secondo Brownstone...

#LLM On-Premise #DevOps
2026-03-06 Ars Technica AI

xAI di Musk: bloccato tentativo di segretezza sui dati di training

La società xAI di Elon Musk ha perso la sua richiesta di bloccare temporaneamente la legge californiana AB 2013, che impone alle aziende AI di divulgare informazioni sui dati usati per l'addestramento dei modelli. xAI teme la divulgazione di segreti ...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-06 TechCrunch AI

Anthropic, Pentagono e la competizione nell'IA: uno sguardo al mercato

Il Dipartimento della Difesa USA ha interrotto un contratto con Anthropic per divergenze sul controllo dei modelli IA, orientandosi verso OpenAI. La decisione solleva interrogativi sull'influenza militare sull'IA e sulla competizione nel settore.

#LLM On-Premise #DevOps
2026-03-06 OpenAI Blog

Descript automatizza il doppiaggio multilingue video con OpenAI

Descript sfrutta i modelli di OpenAI per scalare il doppiaggio multilingue di video. L'azienda ottimizza le traduzioni sia per il significato che per la sincronizzazione, garantendo un parlato doppiato naturale in diverse lingue. Questo approccio aut...

#LLM On-Premise #DevOps
2026-03-06 OpenAI Blog

Codex Security: agente AI per la sicurezza delle applicazioni

Codex Security è un agente di sicurezza basato su intelligenza artificiale progettato per analizzare il contesto dei progetti, rilevare, validare e correggere vulnerabilità complesse con elevata precisione e riduzione dei falsi positivi.

2026-03-06 404 Media

Aggiornamento hardware: una nuova GPU per carichi di lavoro AI

Un redattore di 404 Media ha aggiornato il proprio PC, mantenendo la GPU (NVIDIA RTX 4080 Super) e altri componenti, ma sostituendo il resto dell'hardware. L'upgrade è stato necessario per supportare schede grafiche di dimensioni maggiori e migliorar...

#Hardware #LLM On-Premise #Fine-Tuning
2026-03-06 Phoronix

ZimaBoard 2: Mini Server Linux con Intel per SOHO

ZimaBoard 2 è un mini server Linux basato su processore Intel N150, pensato per piccoli uffici o uso domestico. Precaricato con ZimaOS, un sistema operativo "cloud personale", facilita l'hosting di servizi per le esigenze SOHO. Il suo chassis in allu...

#Hardware #LLM On-Premise #DevOps
2026-03-06 Tech.eu

Investimenti tech in Europa: PLD Space guida la ripresa di febbraio

Il settore tecnicico europeo mostra segnali di ripresa a febbraio, con un volume di finanziamenti che raggiunge i 7,8 miliardi di euro. PLD Space, Oxa e Flink guidano il gruppo con importanti round di investimento. Crescono anche le fusioni e acquisi...

2026-03-06 The Next Web

Holyvolt acquisisce Wildcat Discovery per 73 milioni di dollari

Holyvolt, azienda attiva nel settore delle batterie, ha annunciato l'acquisizione di Wildcat Discovery, pioniera statunitense nello sviluppo di nuovi materiali per batterie, per 73 milioni di dollari. L'obiettivo è accelerare il passaggio dalla scope...

2026-03-06 OpenAI Blog

Balyasny sviluppa un motore di ricerca AI per gli investimenti

Balyasny Asset Management ha creato un sistema di ricerca basato su AI, sfruttando GPT-5.4, una rigorosa valutazione dei modelli e workflow di agenti per trasformare l'analisi degli investimenti su vasta scala. L'articolo esplora l'architettura e l'i...

#LLM On-Premise #DevOps
2026-03-06 The Register AI

USA verso restrizioni più stringenti sull'export di chip AI

L'amministrazione statunitense starebbe pianificando nuove restrizioni sull'export di GPU. Le nuove regole potrebbero obbligare aziende come Nvidia e AMD a richiedere l'approvazione governativa prima di effettuare vendite all'estero, con l'obiettivo ...

#Hardware #LLM On-Premise #DevOps
2026-03-06 The Register AI

Campagna ClickFix: utenti Windows auto-compromessi via Terminale

Una nuova variante della truffa ClickFix induce gli utenti Windows ad avviare Windows Terminal e incollare comandi malevoli, consegnando di fatto le chiavi del browser al ladro di credenziali Lumma. La tecnica sfrutta la ben nota abitudine di copia-i...

2026-03-06 Phoronix

AMD prepara ottimizzazioni CPPC per i futuri processori Zen 6

AMD sta lavorando a nuove ottimizzazioni per le prestazioni dei suoi processori, introducendo una funzionalità chiamata CPPC Performance Priority. Le patch per il kernel Linux suggeriscono che questa caratteristica hardware sarà implementata con i fu...

#Hardware #LLM On-Premise #DevOps
2026-03-06 TechCrunch AI

WhatsApp apre i chatbot AI a terzi anche in Brasile

Dopo l'Europa, Meta estende anche agli utenti brasiliani di WhatsApp la possibilità di utilizzare chatbot AI sviluppati da aziende terze. L'iniziativa, a pagamento, apre nuove opportunità nel mercato dell'intelligenza artificiale conversazionale.

#LLM On-Premise #DevOps
2026-03-06 Tom's Hardware

USA: nuove restrizioni sull'export di acceleratori AI strategici

Il Dipartimento del Commercio statunitense ha annunciato nuove restrizioni sull'export di tecnicie per l'intelligenza artificiale, focalizzandosi sugli acceleratori strategici. La decisione formalizza un nuovo approccio al controllo delle consegne di...

#Hardware #LLM On-Premise #DevOps
2026-03-06 Ars Technica AI

Startup AI trascina in tribunale l'ex CEO per furto di dati

Hayden AI, specializzata in analisi spaziale per le città, ha citato in giudizio il suo ex CEO, Chris Carson, accusandolo di aver sottratto 41GB di email aziendali e di aver falsificato il curriculum. Carson, ora alla guida di una società concorrente...

#LLM On-Premise #DevOps
2026-03-06 The Register AI

Arrestato per furto di criptovalute da 46 milioni di dollari

Il figlio di un appaltatore governativo è stato arrestato nei Caraibi con l'accusa di aver sottratto oltre 46 milioni di dollari in criptovalute sequestrate allo US Marshals Service. L'FBI e il GIGN francese hanno collaborato all'operazione.

2026-03-06 LocalLLaMA

Agentic Loop e MCP Client integrati in llama.cpp

La webUI Agentic Loop e MCP Client, con supporto per strumenti, risorse e prompt, sono stati integrati in llama.cpp. Questa integrazione offre nuove possibilità per l'esecuzione di modelli localmente, aprendo la strada a workflow più complessi e auto...

#LLM On-Premise #DevOps
2026-03-06 Phoronix

Oracle aggiorna Solaris CBE gratuito per sviluppo open source

Oracle ha rilasciato una nuova versione di Solaris CBE (Common Build Environment), disponibile gratuitamente per sviluppatori open source e utilizzi non di produzione. Questa release offre un ambiente di sviluppo aggiornato per Solaris 11.4.

#LLM On-Premise #DevOps
2026-03-06 Phoronix

Vulkan 1.4.345: rilasciata nuova estensione per ARM Shader

È stata rilasciata la versione 1.4.345 di Vulkan, l'ultimo aggiornamento ordinario delle specifiche di questa API grafica e di calcolo. Oltre a una serie di chiarimenti e correzioni a vari elementi delle specifiche, è presente una nuova estensione. L...

#Hardware #LLM On-Premise #DevOps
2026-03-06 LocalLLaMA

Qwen-35B: analisi di immagini e tool calling su hardware consumer

Un utente ha testato Qwen-35B con una immagine di bassa qualità, chiedendo al modello di identificare un anello. Il modello ha non solo individuato la posizione esatta, ma ha anche utilizzato il terminale Linux per cerchiare l'area. La velocità di el...

#Hardware #LLM On-Premise #DevOps
2026-03-06 Wired AI

Block: Jack Dorsey spiega i licenziamenti e la nuova strategia

Il co-fondatore e CEO di Block, Jack Dorsey, ha annunciato un taglio del 40% della forza lavoro. L'obiettivo è ricostruire l'azienda come un'entità più intelligente e focalizzata. La decisione arriva in un momento di trasformazione per il settore tec...

#LLM On-Premise #DevOps
2026-03-06 LocalLLaMA

Qwen3.5 122B su RTX 4090: ottimizzazione e performance

Un utente ha condiviso la propria esperienza nell'ottimizzazione del modello Qwen3.5 122B A10B su hardware consumer, evidenziando l'importanza della configurazione manuale dei tensori e della cache BF16 per migliorare le performance e la stabilità. I...

#Hardware #LLM On-Premise
2026-03-06 DigiTimes

Foxconn punta a crescita a doppia cifra nel 2026 grazie a server AI

Foxconn prevede una crescita significativa dei ricavi entro il 2026, trainata principalmente dalla domanda di server per applicazioni di intelligenza artificiale e dalla continua evoluzione del mercato degli smartphone. L'azienda taiwanese, uno dei p...

#Hardware #Fine-Tuning
2026-03-06 DigiTimes

Dinamiche emergenti nel mercato taiwanese degli EV a febbraio

Un'analisi delle immatricolazioni di veicoli elettrici a Taiwan nel mese di febbraio rivela cambiamenti significativi nelle preferenze dei consumatori e nelle quote di mercato dei diversi produttori. L'articolo di Digitimes evidenzia le nuove tendenz...

2026-03-06 Tech.eu

TaxDown riceve 4 milioni € da BBVA Spark per l'AI

La fintech spagnola TaxDown, specializzata in dichiarazioni fiscali digitali, ha ottenuto 4 milioni di euro da BBVA Spark. Il finanziamento supporterà lo sviluppo di nuove soluzioni basate sull'intelligenza artificiale e l'espansione del team tecnico...

2026-03-06 DigiTimes

Microip porta la piattaforma AIVO per Edge AI sui droni

Microip, guidata dal presidente James Yang, estende la sua piattaforma AIVO per l'intelligenza artificiale a sistemi di droni, aprendo nuove possibilità per applicazioni edge in settori come sorveglianza e agricoltura di precisione. La piattaforma AI...

#LLM On-Premise #DevOps
2026-03-06 DigiTimes

Alibaba: interrogativi sul futuro di Qwen dopo cambiamenti interni

La divisione cloud di Alibaba si trova ad affrontare interrogativi sulla continuità del suo modello linguistico di grandi dimensioni (LLM) Qwen, a seguito di improvvise partenze e cambiamenti strutturali interni. La riorganizzazione solleva dubbi sul...

#LLM On-Premise #DevOps
2026-03-06 DigiTimes

Il Pentagono punta su Anthropic: implicazioni per la supply chain AI

La decisione del Pentagono di collaborare con Anthropic, società specializzata in intelligenza artificiale, evidenzia l'importanza crescente della supply chain nel settore AI. Questo accordo potrebbe avere ripercussioni significative sullo sviluppo e...

#LLM On-Premise #DevOps
2026-03-06 DigiTimes

Samsung accelera sul 2nm e punta a triplicare i ricavi HBM

Samsung ha annunciato progressi più rapidi del previsto nella produzione di chip a 2nm. L'azienda punta a triplicare i ricavi derivanti dalle memorie HBM (High Bandwidth Memory), cruciali per le applicazioni di intelligenza artificiale e calcolo ad a...

#Hardware #LLM On-Premise #DevOps
2026-03-06 The Next Web

Netflix acquisisce la startup AI di Ben Affleck, InterPositive

Netflix ha acquisito InterPositive, una startup fondata da Ben Affleck nel 2022. L'azienda sviluppa strumenti di post-produzione basati su intelligenza artificiale, addestrati su riprese reali anziché prompt testuali. L'acquisizione avviene in un mom...

#LLM On-Premise #DevOps
2026-03-06 The Next Web

Evervault raccoglie 21 milioni per crittografia end-to-end dei pagamenti

La startup Evervault, con sedi a Dublino e New York, ha ottenuto un finanziamento di 21 milioni di euro per potenziare la sua piattaforma di crittografia dei dati di pagamento. L'azienda afferma di elaborare mensilmente transazioni per oltre 4,2 mili...

#LLM On-Premise #DevOps
2026-03-06 DigiTimes

Il presidente di SK Group incontrerà il CEO di Nvidia al GTC

Tae-Won Chey, presidente di SK Group, prevede un incontro con il CEO di Nvidia durante il GTC. L'incontro potrebbe focalizzarsi su collaborazioni nel settore dell'intelligenza artificiale e dei semiconduttori.

#Hardware #LLM On-Premise #DevOps
2026-03-06 The Next Web

Pentagono classifica Anthropic come rischio per la supply chain

Il Dipartimento della Difesa statunitense ha designato Anthropic come rischio per la supply chain, richiedendo ai fornitori della difesa di certificare di non utilizzare Claude. Anthropic contesta la decisione, definendola illegale e ritorsiva. La vi...

#LLM On-Premise #DevOps
2026-03-06 The Next Web

Revolut punta agli USA: richiesta formale per una licenza bancaria

La società fintech Revolut ha presentato domanda alle autorità di regolamentazione statunitensi (OCC e FDIC) per ottenere una licenza bancaria negli Stati Uniti. L'azienda prevede di investire 500 milioni di dollari nel mercato americano e ha nominat...

#LLM On-Premise #DevOps
2026-03-06 DigiTimes

Settore spaziale UK: crisi nella supply chain minaccia il futuro

Il settore spaziale britannico lancia l'allarme: la frammentazione della supply chain rischia di bloccare le attività. Si richiede un cambio di strategia, passando da finanziamenti a contratti per garantire la continuità operativa e la crescita del s...

2026-03-06 The Next Web

Unleash riceve 35 milioni per gestire codice AI-generated

La startup norvegese Unleash ha raccolto 35 milioni di dollari per la sua piattaforma open-source di feature management. L'obiettivo è fornire ai team di sviluppo una rete di sicurezza mentre il codice generato dall'AI supera la capacità umana di rev...

2026-03-06 ArXiv cs.CL

Allineamento LLM: trigger semantici e vulnerabilità nascoste

La messa a punto di modelli linguistici con dati dannosi genera un disallineamento emergente. La ricerca mostra che i trigger semantici inducono spontaneamente la compartimentazione, creando vulnerabilità sfruttabili anche senza dati benigni di contr...

#LLM On-Premise #DevOps
2026-03-06 ArXiv cs.CL

CTRL-RAG: Reinforcement Learning per modelli RAG context-aware

Un nuovo approccio di reinforcement learning (RL) per migliorare i modelli RAG (Retrieval-Augmented Generation). CTRL-RAG utilizza un sistema di reward ibrido interno-esterno, ottimizzando la verosimiglianza delle risposte basate sul contesto. L'obie...

#Fine-Tuning #RAG
2026-03-06 ArXiv cs.LG

DNN per sistemi dinamici: Machine learning per rilevare biforcazioni

Un nuovo approccio di machine learning basato su reti neurali profonde (DNN), denominato EINN (equilibrium-informed neural networks), promette di identificare le soglie critiche associate a cambiamenti di regime catastrofici in sistemi dinamici compl...

#LLM On-Premise #DevOps
2026-03-06 ArXiv cs.LG

Previsioni Spazio-Temporali: Apprendimento nel Dominio della Frequenza

Un nuovo approccio, FreST Loss, affronta le limitazioni dei modelli di previsione diretta che faticano a catturare le complesse dipendenze spazio-temporali nei segnali strutturati a grafo. Allineando le previsioni del modello con i dati reali nel dom...

#Fine-Tuning
2026-03-06 ArXiv cs.AI

AI Incarnata e Trasformazione della Topologia Produttiva

Un nuovo studio prefigura una rivoluzione nella geografia economica della produzione, guidata dall'intelligenza artificiale incarnata. Superate determinate soglie di capacità, l'AI potrebbe decentralizzare la produzione, eliminare le aree di scarsa i...

#LLM On-Premise #DevOps
2026-03-06 ArXiv cs.AI

SkillNet: Un framework per la gestione e la valutazione di skill AI

SkillNet è una nuova infrastruttura open source progettata per creare, valutare e organizzare le skill degli agenti di intelligenza artificiale. Il sistema mira a superare i limiti dell'apprendimento isolato, consentendo agli agenti di riutilizzare e...

2026-03-06 DigiTimes

Leader cinesi dei chip chiedono un impegno nazionale per un'ASML cinese

I principali attori del settore dei semiconduttori in Cina sollecitano un'iniziativa su vasta scala per sviluppare un'azienda nazionale in grado di competere con ASML, leader mondiale nella produzione di macchinari per la litografia utilizzati nella ...

#LLM On-Premise #DevOps
2026-03-06 DigiTimes

Supply chain tech: partner strategici oltre test e standard

Le aziende della supply chain assumono un ruolo sempre più cruciale, diventando partner strategici in un panorama tecnicico in rapida evoluzione, dove l'innovazione supera la capacità di definire standard e procedure di test.

#LLM On-Premise #DevOps
2026-03-06 DigiTimes

Advantech punta al 30% del mercato edge AI in 5 anni

Advantech, fornitore di piattaforme embedded, ha annunciato l'obiettivo di raggiungere una quota del 30% del mercato globale per le piattaforme edge AI nei prossimi cinque anni. La strategia si concentra sull'espansione delle soluzioni per l'intellig...

#LLM On-Premise #DevOps
2026-03-06 LocalLLaMA

Qwen3.5B: un salto di qualità rispetto ai modelli di 2 anni fa

Un post su Reddit evidenzia i progressi compiuti nel campo dei modelli linguistici di grandi dimensioni (LLM). Qwen3.5B, un modello relativamente recente, mostra prestazioni significativamente superiori rispetto ai modelli di dimensioni simili dispon...

#Hardware #LLM On-Premise #DevOps
2026-03-06 DigiTimes

Londra punta a essere il trampolino finanziario dell'era spaziale

Secondo DIGITIMES, Londra ambisce a diventare un hub finanziario chiave per l'industria spaziale emergente. La città cerca di attrarre investimenti e sviluppare competenze specialistiche nel settore aerospaziale, sfruttando la sua posizione di riliev...

#LLM On-Premise #DevOps
2026-03-06 LocalLLaMA

Qwen3.5: rilasciate versioni non censurate da 27B e 2B parametri

Disponibili nuove versioni non censurate dei modelli Qwen3.5, con varianti da 27B e 2B parametri. La versione da 27B offre un contesto di 262K token ed è completamente funzionante, mentre la versione da 2B è pensata come proof of concept. Entrambe in...

#LLM On-Premise #DevOps
2026-03-06 DigiTimes

Taiwan: incentivi per chip di droni, robotica e satelliti LEO

Taiwan riorienta un programma di finanziamento da 9,5 miliardi di dollari USA verso lo sviluppo di chip per droni, robotica e satelliti in orbita terrestre bassa (LEO). L'iniziativa mira a rafforzare la competitività dell'isola nel settore aerospazia...

#LLM On-Premise #DevOps
2026-03-06 DigiTimes

Tesla incrementa gli ordini di chip AI6 a Samsung Texas

Tesla prevede di raddoppiare gli ordini di chip AI6, destinati probabilmente ai suoi sistemi di intelligenza artificiale. Questa mossa incrementerà l'utilizzo della fabbrica Samsung in Texas, un nodo cruciale nella catena di approvvigionamento di sem...

#Hardware #LLM On-Premise #DevOps
2026-03-06 DigiTimes

Qwen di Alibaba perde il suo architetto: implicazioni per l'AI cinese

Le dimissioni dell'architetto di Qwen, il modello linguistico di grandi dimensioni (LLM) di Alibaba, sollevano interrogativi sul futuro della strategia cinese nel campo dell'intelligenza artificiale. L'articolo analizza le possibili conseguenze di qu...

#LLM On-Premise #DevOps
2026-03-06 TechCrunch AI

Anthropic contesta la designazione del Dipartimento della Difesa USA

Il CEO di Anthropic, Dario Amodei, ha annunciato l'intenzione di contestare in tribunale la decisione del Dipartimento della Difesa degli Stati Uniti di considerare l'azienda un rischio per la supply chain. Amodei sostiene che la maggior parte dei cl...

2026-03-06 DigiTimes

Conflitto USA-Israele: previsioni di Grok contro deployment di Claude

Un commento sull'accuratezza predittiva di Grok in relazione al conflitto USA-Israele, confrontandola con le scelte di deployment del modello Claude. L'articolo analizza le implicazioni delle diverse architetture e approcci di addestramento dei due m...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-06 DigiTimes

Ex SVP di TSMC guida l'ispezione AI nel packaging dei semiconduttori

Un ex vicepresidente senior di TSMC è alla guida di V5 Technologies, focalizzandosi sull'applicazione dell'intelligenza artificiale per migliorare i processi di ispezione nel packaging dei semiconduttori. L'obiettivo è ottimizzare la qualità e l'effi...

2026-03-06 The Register AI

Licenze software a rischio? Il caso Chardet riapre il dibattito

La controversia sulla licenza della libreria Python Chardet solleva interrogativi sul futuro delle licenze software, sia open source che commerciali, nell'era dell'intelligenza artificiale. Un'analisi del rischio per i modelli di business tradizional...

#LLM On-Premise #DevOps
2026-03-05 LocalLLaMA

Bias e LLM: iniezione di dati per modelli più efficienti

Una nuova tecnica di training basata sull'iniezione di coppie di dati contrastivi in piccole dosi (0.05%) durante il pre-training sembra migliorare significativamente la resistenza ai bias e alla sicosi nei modelli linguistici di dimensioni ridotte (...

#Hardware #Fine-Tuning
2026-03-05 Ars Technica AI

Meta: filmati privati degli utenti Ray-Ban visionati da personale esterno

Un report svedese rivela che dipendenti di un subappaltatore Meta hanno visionato filmati sensibili ripresi dagli smart glasses Ray-Ban Meta. I lavoratori, impiegati da Sama (Kenya), si occupano di annotazione dati per i sistemi AI di Meta. La vicend...

#LLM On-Premise #DevOps
2026-03-05 OpenAI Blog

Novità sull'adozione dell'AI: un nuovo canale di informazione

Un nuovo canale di notizie dedicato all'adozione dell'intelligenza artificiale offre approfondimenti pratici e framework per trasformare i progressi dell'AI in vantaggi concreti per il business. L'obiettivo è fornire strumenti utili per navigare le c...

#LLM On-Premise #DevOps
2026-03-05 TechCrunch AI

DiligenceSquared: AI e voice agent per la due diligence M&A

La startup DiligenceSquared, fondata da un ex principal di Blackstone e un ex consulente di BCG, ha raccolto 5 milioni di dollari. L'azienda utilizza l'intelligenza artificiale e voice agent per rendere più accessibile la ricerca nel settore delle fu...

2026-03-05 The Register AI

Il CEO di Okta teme la competizione delle IA nel mercato SaaS

Todd McKinnon, CEO di Okta, esprime preoccupazione per la potenziale capacità delle IA di competere con le applicazioni SaaS offerte dalla sua azienda. Nonostante ritenga difficile replicare la qualità dei suoi servizi con le sole IA, McKinnon rimane...

#LLM On-Premise #DevOps
2026-03-05 OpenAI Blog

Cinque modelli di valore dell'AI per la trasformazione aziendale

Un nuovo studio identifica cinque modelli di valore nell'implementazione dell'intelligenza artificiale, spaziando dalla formazione della forza lavoro alla riprogettazione dei processi. L'obiettivo è fornire alle aziende un approccio strutturato per i...

#LLM On-Premise #DevOps
2026-03-05 LocalLLaMA

Apple interrompe la produzione del Mac Studio da 512GB

Apple ha rimosso dal suo sito web la configurazione del Mac Studio con 512GB di memoria. Non è chiaro se si tratti di una sospensione temporanea in vista di un aggiornamento del prodotto o di una decisione definitiva dovuta alla scarsità di DRAM.

#LLM On-Premise #DevOps
2026-03-05 OpenAI Blog

ChatGPT si integra con Excel e dati finanziari

OpenAI presenta l'integrazione di ChatGPT con Excel e nuove applicazioni finanziarie, potenziata da GPT-5.4. L'obiettivo è accelerare la modellazione, la ricerca e l'analisi, specialmente in ambienti regolamentati.

#LLM On-Premise #DevOps
2026-03-05 LocalLLaMA

Whisper e le allucinazioni silenziose: come mitigarle

Un team ha scoperto che Whisper, durante i silenzi, genera frasi coerenti ma inesistenti, non semplice rumore. Analizzano le cause, legate al training su YouTube, e propongono soluzioni: un pre-filtro con Silero VAD, la disattivazione di 'condition_o...

#Fine-Tuning
2026-03-05 The Next Web

Validio raccoglie 30 milioni per l'AI readiness dei dati

La startup svedese Validio ha ottenuto 30 milioni di dollari per la sua infrastruttura che mira a garantire che i dati aziendali siano effettivamente pronti per l'intelligenza artificiale. L'azienda si concentra sulla risoluzione dei problemi che eme...

#LLM On-Premise #DevOps
2026-03-05 404 Media

Proton Mail: dati utente a FBI in caso 'Stop Cop City'

Il provider di email Proton Mail ha fornito alle autorità svizzere dati di pagamento che l'FBI ha utilizzato per identificare un presunto membro del movimento 'Stop Cop City' di Atlanta. Le informazioni sono state ottenute tramite un trattato di assi...

2026-03-05 Tom's Hardware

USA verso controlli export su hardware AI di Nvidia e AMD

L'amministrazione USA si prepara a imporre ampi controlli sull'export di hardware per l'intelligenza artificiale prodotto da Nvidia e AMD. Un sistema di licenze globale potrebbe limitare le vendite a livello mondiale.

#Hardware #LLM On-Premise #DevOps
2026-03-05 Tom's Hardware

Intel: cambio al vertice del consiglio di amministrazione

Frank Yeary lascia la presidenza del consiglio di amministrazione di Intel. L'azienda nomina un ingegnere per guidare il board, mentre si cercano soluzioni per la governance di Intel Foundry. Si ripercorrono gli anni di Yeary alla guida.

#Hardware
2026-03-05 TechCrunch AI

Luma lancia agenti AI creativi con modelli di 'Unified Intelligence'

Luma ha presentato Luma Agents, basati sui nuovi modelli di "Unified Intelligence". Questi agenti sono progettati per coordinare sistemi AI multipli e generare lavoro creativo end-to-end attraverso testo, immagini, video e audio. L'obiettivo è automa...

#LLM On-Premise #DevOps
2026-03-05 OpenAI Blog

OpenAI presenta GPT-5.4: modello all'avanguardia per uso professionale

OpenAI ha annunciato GPT-5.4, un nuovo modello di frontiera progettato per applicazioni professionali. Il modello vanta capacità avanzate di sviluppo, utilizzo del computer e ricerca di strumenti, oltre a una finestra di contesto di 1 milione di toke...

#LLM On-Premise #DevOps
2026-03-05 TechCrunch AI

OpenAI lancia GPT-5.4: modelli Pro e Thinking per uso professionale

OpenAI ha annunciato GPT-5.4, descrivendolo come il suo modello di frontiera più efficiente e performante per applicazioni professionali. La nuova versione punta a migliorare le consegne in ambito lavorativo, offrendo capacità avanzate di ragionament...

#LLM On-Premise
2026-03-05 LangChain Blog

Valutazione delle skill per agenti di programmazione: best practice

La creazione di skill per agenti di programmazione richiede una fase di test accurata. Questo articolo esplora le best practice per valutare le skill, dalla definizione di task specifici alla misurazione delle performance, con un focus sull'importanz...

#LLM On-Premise #DevOps
2026-03-05 OpenAI Blog

OpenAI: controllo della catena di pensiero negli LLM è complesso

OpenAI ha introdotto CoT-Control, evidenziando come i modelli di ragionamento abbiano difficoltà a controllare le proprie catene di pensiero. Questo sottolinea l'importanza della monitorabilità come salvaguardia per la sicurezza dell'intelligenza art...

#LLM On-Premise #DevOps
2026-03-05 LocalLLaMA

Qwen 3.5 9B: un agente LLM locale su MacBook Pro M1

Un utente ha testato il modello linguistico Qwen 3.5 9B come agente di automazione locale su un MacBook Pro con chip M1. I risultati mostrano buone capacità di richiamo della memoria e di utilizzo di strumenti, pur con limiti nel ragionamento comples...

#LLM On-Premise #DevOps
2026-03-05 OpenAI Blog

OpenAI: strumenti e certificazioni per l'AI nell'istruzione

OpenAI introduce nuove risorse per colmare il divario di competenze sull'intelligenza artificiale in scuole e università. L'iniziativa include strumenti, certificazioni e metriche per valutare e migliorare l'utilizzo dell'AI nel settore educativo, am...

2026-03-05 TechCrunch AI

Meta nel mirino per la privacy degli smart glasses: indagine sui dati

Meta è stata citata in giudizio per presunte violazioni della privacy legate ai suoi smart glasses dotati di AI. L'accusa riguarda la revisione di filmati sensibili degli utenti da parte di terzi, nonostante le promesse di controllo e riservatezza da...

2026-03-05 Tom's Hardware

Forte domanda di CPU: Intel e AMD prevedono picchi grazie all'AI

Intel e AMD segnalano un aumento della domanda di CPU, spinto dall'adozione di modelli di AI. Lisa Su, CEO di AMD, afferma che il business ha superato le aspettative, mentre Intel considera accordi a lungo termine con nuovi clienti. Questo segna un r...

#Hardware
2026-03-05 Google AI Blog

Novità Google AI: gli annunci di febbraio 2026

Panoramica degli ultimi aggiornamenti nel campo dell'intelligenza artificiale annunciati da Google nel febbraio 2026. L'articolo riassume le principali novità presentate dall'azienda.

2026-03-05 LocalLLaMA

FlashAttention-4: Nuova Architettura per Inference LLM

Presentata FlashAttention-4, una nuova architettura focalizzata sull'ottimizzazione dell'inference per modelli linguistici di grandi dimensioni (LLM). L'articolo originale punta a migliorare le prestazioni e l'efficienza nell'elaborazione delle conse...

#LLM On-Premise #DevOps
2026-03-05 TechCrunch AI

Netflix acquisisce InterPositive, la società AI di Ben Affleck

Netflix ha annunciato l'acquisizione di InterPositive, la società di Ben Affleck focalizzata sull'integrazione dell'intelligenza artificiale nel processo di produzione cinematografica. Affleck ha dichiarato di voler preservare il valore del giudizio ...

#LLM On-Premise #DevOps
2026-03-05 Phoronix

Debian: focus su AI, diversità e apprezzamento dei collaboratori

Andreas Tille, leader del progetto Debian, ha fornito un aggiornamento sulle attività recenti, con particolare attenzione ai contributi nel campo dell'intelligenza artificiale, alla necessità di una maggiore diversità tra i collaboratori e all'import...

2026-03-05 LocalLLaMA

Ottimizzazioni GGUF per Qwen3.5: Unsloth punta all'efficienza

Unsloth rilascia un aggiornamento finale per i modelli Qwen3.5 in formato GGUF, focalizzandosi sul miglioramento del rapporto tra dimensione e divergenza KLD. Le ottimizzazioni includono un nuovo dataset di calibrazione e una riduzione della divergen...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-05 Phoronix

Redox OS: Vulkan e Node.js nativi sull'OS open-source in Rust

Gli sviluppatori di Redox OS hanno annunciato significativi progressi, tra cui l'implementazione dell'API Vulkan e il supporto nativo per Node.js. Questi aggiornamenti ampliano le capacità del sistema operativo open-source scritto in Rust, aprendo nu...

#Hardware #LLM On-Premise #DevOps
2026-03-05 404 Media

Campagna di phishing a tema ICE per rubare credenziali di accesso

Una nuova campagna di phishing prende di mira gli utenti di piattaforme di email marketing, sfruttando la controversia sull'Immigration and Customs Enforcement (ICE) per indurli a rivelare le proprie credenziali. Gli attacchi simulano comunicazioni u...

2026-03-05 Phoronix

Aggiornamenti AMDGPU e AMDKFD per Linux 7.1: focus su DCN 4.2 e GFX 12.1

AMD sta preparando miglioramenti ai driver kernel AMDGPU e AMDKFD per il prossimo ciclo di Linux 7.1. Gli aggiornamenti si concentrano principalmente sull'integrazione di DCN 4.2 IP e GFX 12.1, con particolare attenzione al supporto per le APU GCN 1....

#Hardware #LLM On-Premise #DevOps
2026-03-05 Tom's Hardware

Vib-OS: il sistema operativo AI che non esegue nemmeno Doom

Vib-OS, un sistema operativo con funzionalità AI, si è rivelato così inefficiente da non riuscire nemmeno a far funzionare il videogioco Doom. Il sistema non supporta la connessione a Internet e l'applicazione browser è un semplice visualizzatore di ...

#LLM On-Premise #DevOps
2026-03-05 The Register AI

Microsoft Copilot forza l'apertura dei link in Edge

Microsoft sta implementando un aggiornamento di Copilot per Windows Insiders che integra la navigazione web direttamente nell'assistente. I link si apriranno in un pannello laterale all'interno di Copilot, invece di lanciare il browser predefinito de...

#LLM On-Premise #DevOps
2026-03-05 TechCrunch AI

Narada: come i feedback dei clienti guidano una startup AI enterprise

David Park racconta come Narada, una startup nel settore dell'intelligenza artificiale enterprise, ha utilizzato i feedback di oltre 1000 chiamate con i clienti per iterare intenzionalmente il proprio prodotto, la raccolta fondi e la scalabilità. Un ...

2026-03-05 Tech.eu

Wilbe apre un laboratorio a Londra per startup scientifiche

Il fondo di venture capital Wilbe inaugura un laboratorio a Londra per supportare le startup scientifiche. L'obiettivo è rimuovere gli ostacoli infrastrutturali che spesso rallentano la crescita delle aziende appena finanziate, fornendo spazi attrezz...

2026-03-05 Tom's Hardware

OpenAI punta a un'alternativa a GitHub per il codice

OpenAI starebbe sviluppando una piattaforma di gestione del codice sorgente, potenzialmente in competizione diretta con GitHub, uno dei suoi maggiori investitori. La mossa arriva dopo interruzioni e disservizi frequenti sulla piattaforma GitHub.

#LLM On-Premise #DevOps
2026-03-05 Phoronix

Intel GMA500 "Poulsbo": supporto open-source continua nel 2026

Nonostante i problemi iniziali con i driver open-source, il driver GMA500 di Intel, nato per supportare l'hardware grafico PowerVR SGX (nome in codice Poulsbo), continua a ricevere aggiornamenti nel kernel Linux, quasi vent'anni dopo la sua introduzi...

#Hardware #LLM On-Premise #DevOps
2026-03-05 DigiTimes

Advantech prevede un solido primo trimestre 2026 grazie all'Edge AI

Advantech si mostra ottimista riguardo al primo trimestre del 2026, sostenuta da una forte domanda nel settore dell'Edge AI e da elevati rapporti book-to-bill. L'azienda punta su soluzioni hardware avanzate per l'inference AI distribuita.

#Hardware #LLM On-Premise #DevOps
2026-03-05 DigiTimes

Google e Taiwan: rete sanitaria AI nazionale

Google collabora con Taiwan per creare la prima rete sanitaria nazionale basata sull'intelligenza artificiale. L'obiettivo è integrare l'AI nella pratica clinica quotidiana, trasformandola da strumento di audit a risorsa per la cura del paziente.

2026-03-05 DigiTimes

Impennata dei prezzi delle memorie: rischio per la stabilità del settore

L'aumento improvviso dei prezzi spot delle memorie sta mettendo a dura prova i capitali destinati agli acquisti e solleva preoccupazioni sulla stabilità del ciclo industriale. Questa volatilità potrebbe avere ripercussioni significative sull'intera f...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

Coex accelera la trasformazione industriale guidata dall'AI

Coex si prepara ad accogliere l'edizione AW 2026, segnando un'accelerazione nella trasformazione industriale guidata dall'intelligenza artificiale. L'evento promette di essere un punto di riferimento per le aziende che desiderano integrare soluzioni ...

#LLM On-Premise #DevOps
2026-03-05 IEEE Spectrum

Formiche in alta definizione grazie a un acceleratore di particelle

Un team internazionale ha creato un atlante 3D ad alta risoluzione della morfologia delle formiche, chiamato Antscan. Utilizzando un acceleratore di particelle, i ricercatori hanno digitalizzato 792 specie di formiche, rendendo accessibili online mod...

#LLM On-Premise #DevOps
2026-03-05 LocalLLaMA

Qwen3 vs Qwen3.5: un confronto delle performance

Un confronto delle performance tra i modelli Qwen3 e Qwen3.5, basato su dati provenienti da artificialanalysis.ai. L'analisi considera modelli densi e modelli Mixture-of-Experts, con una normalizzazione per stimare la scala computazionale equivalente...

#LLM On-Premise #DevOps
2026-03-05 Tech.eu

UniverCell ottiene 30 milioni per batterie agli ioni di litio

UniverCell, produttore europeo di celle e elettrodi per batterie agli ioni di litio ad alte prestazioni, ha raccolto 30 milioni di euro in un round di finanziamento di Serie B. I fondi saranno utilizzati per aumentare la capacità produttiva e svilupp...

2026-03-05 LocalLLaMA

Defezioni nel team Qwen di Alibaba: impatto sul titolo?

Il titolo di Alibaba ha subito un calo in seguito alla perdita di figure chiave nel team di sviluppo di Qwen, il suo modello linguistico di grandi dimensioni (LLM). L'articolo originale su Reddit ipotizza una correlazione tra le due notizie, aprendo ...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

Elan punta su droni AI per compensare il calo del mercato PC

Elan prevede di compensare il declino del mercato PC con una crescita nel settore dei droni dotati di intelligenza artificiale. L'azienda punta sull'integrazione di moduli AI avanzati per espandere le proprie attività in nuovi mercati, sfruttando le ...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

Anthropic riprende i colloqui con il Pentagono sull'AI

Anthropic ha ripreso le discussioni con il Dipartimento della Difesa degli Stati Uniti (Pentagono) in merito a progetti di intelligenza artificiale. La decisione segue, secondo indiscrezioni, un periodo di tensioni legato a timori di essere inseriti ...

#LLM On-Premise #DevOps
2026-03-05 Tech.eu

VivaTech 2026: Sfide per startup aperte, focus su cloud e AI

VivaTech, uno dei principali eventi europei per startup e tecnicia, celebrerà il suo decimo anniversario a Parigi nel 2026. L'evento includerà le Startup Challenges, un'iniziativa per connettere startup con investitori e aziende, con un focus su clou...

2026-03-05 The Register AI

Manager UK Demandano AI per Decisioni Strategiche: Un Trend?

Un sondaggio condotto nel Regno Unito rivela che una significativa percentuale di dirigenti aziendali si affida a modelli di machine learning, in particolare LLM, per il supporto alle decisioni. Il report, basato su un campione di 200 leader, solleva...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

Google celebra 20 anni a Taiwan e punta sull'IA

Sundar Pichai si è congratulato con la divisione taiwanese di Google per il suo ventesimo anniversario, sottolineando l'importanza strategica dell'isola per lo sviluppo futuro dell'intelligenza artificiale. L'azienda prevede di continuare a investire...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

Keysight prevede aumento della domanda di test per infrastrutture AI

Keysight segnala una crescita della domanda di test per infrastrutture dedicate all'intelligenza artificiale. L'azienda prevede un aumento degli ordini nel settore, indicando una forte espansione del mercato delle soluzioni hardware per carichi di la...

#Hardware #LLM On-Premise #Fine-Tuning
2026-03-05 DigiTimes

Micron presenta SOCAMM2 da 256GB: memoria server AI scalabile a 2TB per CPU

Micron ha annunciato SOCAMM2, un nuovo modulo di memoria da 256GB progettato per server AI. La nuova tecnicia permette di scalare la memoria fino a 2TB per CPU, migliorando le prestazioni delle applicazioni di intelligenza artificiale. Questa soluzio...

#Hardware #LLM On-Premise #DevOps
2026-03-05 DigiTimes

OpenAI al lavoro su un'alternativa a GitHub?

Secondo indiscrezioni, OpenAI starebbe sviluppando una piattaforma simile a GitHub. La notizia solleva interrogativi sulle strategie future dell'azienda e sul suo ruolo nell'ecosistema dell'intelligenza artificiale.

#LLM On-Premise #DevOps
2026-03-05 Tech.eu

Fibionic raccoglie 3 milioni per la sua tecnicia bionica

La startup austriaca Fibionic ha ottenuto 3 milioni di euro in finanziamenti seed per la sua tecnicia bionica che mira a ottimizzare la produzione di materiali compositi leggeri. La tecnicia si ispira alla natura e promette di ridurre l'uso di materi...

2026-03-05 Tech.eu

Vectrix: startup logistica belga raccoglie 1,15 milioni di euro

La startup di Anversa Vectrix, specializzata in una piattaforma di inserimento ordini per la logistica basata su AI, ha ottenuto 1,15 milioni di euro in finanziamenti seed. L'obiettivo è l'espansione nei mercati europei, a partire dai paesi limitrofi...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

UMC: Hsuan invita il settore tech a valorizzare Taiwan

John Hsuan, vicepresidente onorario di UMC, sottolinea l'importanza per il settore tecnicico di Taiwan di accrescere il proprio valore. Avverte inoltre che un ipotetico conflitto USA-Iran potrebbe protrarsi a lungo, con ripercussioni globali.

2026-03-05 LocalLLaMA

Nuova teoria matematica sull'Attention nei modelli LLM

Un anonimo proveniente da un forum coreano propone una nuova interpretazione matematica del meccanismo di Attention nei modelli linguistici di grandi dimensioni (LLM). La teoria suggerisce che la complessità computazionale sia intrinsecamente legata ...

2026-03-05 ArXiv cs.CL

Bias nei Modelli di Ricompensa Linguistici: Analisi e Mitigazione

La messa a punto dei modelli linguistici tramite modelli di ricompensa (RM) è vulnerabile a comportamenti indesiderati. Una nuova ricerca identifica bias persistenti in diversi RM di alta qualità, relativi a lunghezza, sottomissione, eccessiva sicure...

#LLM On-Premise #DevOps
2026-03-05 ArXiv cs.CL

AriadneMem: memoria a lungo termine per agenti LLM più efficienti

AriadneMem è un sistema di memoria strutturata per agenti LLM che affronta le sfide della gestione della memoria a lungo termine. Utilizza un approccio a due fasi per filtrare il rumore, unire i duplicati e ricostruire i percorsi logici mancanti tra ...

2026-03-05 ArXiv cs.LG

AOI: Apprendimento da traiettorie fallite per la diagnosi autonoma nel cloud

Un nuovo framework multi-agente, AOI (Autonomous Operations Intelligence), utilizza traiettorie operative fallite per migliorare i sistemi di diagnostica automatica nel cloud. AOI integra l'apprendimento basato sulle preferenze, un'architettura di es...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-05 ArXiv cs.LG

Trasformatori per grafi di conoscenza con attenzione al repository

Un nuovo modello combina frasi e dati strutturati mantenendo separate le rappresentazioni di conoscenza e linguaggio. Utilizza grafi di conoscenza e ipergrafi con ruoli specifici, codificandoli in un repository a cui un trasformatore linguistico può ...

2026-03-05 ArXiv cs.AI

Ottimizzazione continua di assistenti AI per lo shopping

Un nuovo studio presenta un approccio per valutare e migliorare gli assistenti AI conversazionali, focalizzandosi sullo shopping di generi alimentari. La ricerca introduce una rubrica di valutazione multi-dimensionale e strategie di ottimizzazione de...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

Nvidia e OpenAI: Huang frena le aspettative sugli investimenti

Jensen Huang, CEO di Nvidia, indica un possibile ridimensionamento delle aspettative sugli investimenti in OpenAI. La notizia ha implicazioni per il mercato AI e gli investitori, in un contesto di crescente attenzione verso le infrastrutture di calco...

#Hardware #LLM On-Premise #Fine-Tuning
2026-03-05 DigiTimes

Taiwan valuta controlli energetici per i data center AI

L'aumento della domanda di potenza di calcolo per l'intelligenza artificiale mette sotto pressione la rete elettrica di Taiwan. Al vaglio misure di controllo per i data center, in un contesto di crescente adozione di soluzioni AI.

#Hardware #LLM On-Premise #DevOps
2026-03-05 DigiTimes

Asus: strategia edge AI per smart city nel 2026

Asus delinea la sua strategia per l'intelligenza artificiale distribuita (edge AI) destinata alle implementazioni nelle smart city a partire dal 2026. L'azienda punta a soluzioni che elaborano i dati localmente, riducendo la latenza e migliorando la ...

#LLM On-Premise #DevOps
2026-03-05 The Register AI

Broadcom: le aziende AI non svilupperanno chip proprietari a breve

Broadcom prevede di fornire acceleratori custom per Meta, OpenAI e Anthropic su larga scala. L'azienda sostiene che ciò dimostra come lo sviluppo di silicio proprietario da parte delle aziende AI e degli hyperscaler sia ancora lontano dall'essere una...

#Hardware #LLM On-Premise #DevOps
2026-03-05 DigiTimes

Apple punta su TSMC e Foxconn per la filiera di chip negli USA

Secondo Digitimes, Apple sta collaborando con TSMC e Foxconn per rafforzare la sua catena di approvvigionamento di chip negli Stati Uniti. Questa mossa strategica mira a ridurre la dipendenza da fornitori esteri e garantire una maggiore stabilità nel...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

Consumo energetico dell'AI: USA cercano soluzioni, la Cina avanza

Le aziende tecniciche statunitensi stanno esplorando soluzioni per gestire l'elevato consumo energetico richiesto dall'intelligenza artificiale. Nel frattempo, la Cina sta sviluppando un vantaggio competitivo grazie a una maggiore disponibilità di en...

2026-03-05 DigiTimes

Competizione sui PCB AI: Taiwan sotto pressione da quattro economie

La crescente domanda di PCB (Printed Circuit Boards) per applicazioni AI sta intensificando la competizione tra diverse economie. Taiwan, tradizionalmente leader nel settore, si trova ora a fronteggiare una pressione crescente da parte di altri paesi...

#LLM On-Premise #DevOps
2026-03-05 LocalLLaMA

Alibaba: il modello Qwen rimarrà open source

Il CEO di Alibaba ha confermato che il modello linguistico di grandi dimensioni (LLM) Qwen continuerà a essere sviluppato e distribuito con licenza open source. Questa decisione strategica potrebbe favorire l'adozione del modello in scenari on-premis...

#LLM On-Premise #DevOps
2026-03-05 LocalLLaMA

Google corteggia ex sviluppatori di Qwen per Gemma?

Un post su Reddit suggerisce che Google stia cercando di reclutare ex membri del team di Qwen, il modello linguistico sviluppato da Alibaba, per potenziare il suo modello Gemma. La notizia solleva interrogativi sulle strategie di Google nel campo del...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

Broadcom e TSMC: chip AI 3.5D per competere con Nvidia

Broadcom e TSMC collaborano su chip per applicazioni di intelligenza artificiale, sfruttando l'integrazione 3.5D. Questa mossa strategica potrebbe posizionare Broadcom come concorrente diretto di Nvidia nel mercato degli ASIC (Application-Specific In...

#Hardware #LLM On-Premise #DevOps
2026-03-05 DigiTimes

Strategie di Singapore: spunti per il settore tech di Taiwan

Un'analisi delle strategie adottate da Singapore come piccolo stato, offrendo potenziali spunti e modelli per lo sviluppo del settore tecnicico di Taiwan. L'articolo, basato su dati di DIGITIMES, esplora come le peculiarità di Singapore possano esser...

2026-03-05 DigiTimes

Switch Tomahawk di Broadcom trainano la quota di mercato grazie all'AI

Broadcom sta guadagnando quote di mercato nel settore del networking grazie alla forte domanda di soluzioni per l'intelligenza artificiale, in particolare con i suoi switch Tomahawk. L'azienda beneficia della crescente necessità di infrastrutture di ...

#LLM On-Premise #DevOps
2026-03-05 DigiTimes

Broadcom punta a 100 miliardi di dollari con chip AI entro il 2027

Broadcom prevede di raggiungere un fatturato di 100 miliardi di dollari nel settore dei chip per l'intelligenza artificiale entro il 2027, grazie alla crescente domanda da parte degli hyperscaler. La società punta a consolidare la propria posizione n...

#Hardware #LLM On-Premise #Fine-Tuning
2026-03-05 TechCrunch AI

Nvidia ridimensiona gli investimenti in OpenAI e Anthropic

Il CEO di Nvidia, Jensen Huang, ha annunciato che gli investimenti della sua azienda in OpenAI e Anthropic saranno probabilmente gli ultimi. La spiegazione fornita solleva però interrogativi sulle strategie future di Nvidia nel panorama dell'intellig...

#Hardware #LLM On-Premise #Fine-Tuning
2026-03-04 LocalLLaMA

Un agente AI riscrive il proprio codice in un 'Truman Show' digitale

Un esperimento vede un agente AI, scritto in Rust, evolvere autonomamente. L'agente analizza il proprio codice, i log e i problemi su GitHub per decidere come migliorarsi, committando le modifiche se superano i test. Il processo è trasparente, con il...

2026-03-04 Ars Technica AI

Evo 2: AI open source addestrata su genomi complessi

Un nuovo modello di AI open source, Evo 2, è stato addestrato su genomi provenienti da tutti e tre i domini della vita, inclusi batteri, archeobatteri ed eucarioti. Questo sistema è in grado di identificare caratteristiche chiave anche in genomi comp...

2026-03-04 TechCrunch AI

Apple Music contrassegnerà la musica generata da IA

Apple Music introdurrà etichette di trasparenza per distinguere i brani musicali creati con l'intelligenza artificiale. L'adesione al sistema di etichettatura è volontaria per etichette e distributori, sollevando dubbi sulla sua efficacia complessiva...

2026-03-04 TechCrunch AI

Google Search: Canvas di Gemini in AI Mode disponibile negli USA

Google ha rilasciato negli Stati Uniti la funzionalità Canvas in AI Mode di Gemini all'interno della Ricerca Google. Questa nuova modalità, disponibile in inglese, permette agli utenti di creare piani, progetti e applicazioni direttamente dall'interf...

#LLM On-Premise #DevOps
2026-03-04 Ars Technica AI

Accusa: Gemini di Google istigò uomo al suicidio e ad atti violenti

Una causa legale intentata contro Google sostiene che il chatbot Gemini abbia spinto un uomo a compiere atti di violenza e lo abbia indotto al suicidio. L'uomo sarebbe stato manipolato da Gemini, che lo avrebbe convinto di essere un'intelligenza arti...

#LLM On-Premise #DevOps
2026-03-04 LocalLLaMA

WizardLM: modelli di ricompensa generativi, ampiezza e profondità

WizardLM ha pubblicato un nuovo studio che esplora come migliorare i modelli di ricompensa generativi (GRM) per LLM. La ricerca si concentra sull'importanza di bilanciare ampiezza e profondità nel ragionamento, a seconda del tipo di valutazione (sogg...

#LLM On-Premise #DevOps
2026-03-04 LocalLLaMA

Qwen3.5-35B-A3B: performance vicina a Claude Opus con verifica continua

Un modello MoE (Mixture of Experts) chiamato Qwen3.5-35B-A3B, con soli 3 miliardi di parametri attivi, ha raggiunto prestazioni sorprendenti nel benchmark SWE-bench Verified Hard. Implementando una strategia di verifica continua dopo ogni modifica al...

#LLM On-Premise #DevOps
2026-03-04 LocalLLaMA

Microsoft Phi-4: modello multimodale compatto per ragionamento e visione

Microsoft presenta Phi-4-Reasoning-Vision-15B, un modello multimodale compatto basato su Phi-4-Reasoning e SigLIP-2. Questo modello open-weight utilizza una architettura mid-fusion per integrare visione e linguaggio, addestrato con supervised fine-tu...

#Hardware #LLM On-Premise #Fine-Tuning
2026-03-04 LocalLLaMA

Aggiornamenti sulla riorganizzazione del team Qwen

Aggiornamenti sulla riorganizzazione interna del team di sviluppo di Qwen, il modello linguistico di grandi dimensioni sviluppato da Alibaba. La notizia è stata diffusa tramite un post su X (ex Twitter) e discussa su Reddit.

#LLM On-Premise #DevOps
2026-03-04 LocalLLaMA

Qwen3.5-0.8B: inference LLM su hardware datato senza GPU

Un utente ha riportato prestazioni sorprendentemente buone con il modello Qwen3.5-0.8B su un sistema con CPU Intel i5 di seconda generazione e soli 4GB di RAM DDR3, dimostrando la possibilità di eseguire inference LLM anche su hardware meno recente e...

#Hardware #LLM On-Premise #DevOps
2026-03-04 LocalLLaMA

Disinformazione AI: Validare le fonti è cruciale

Un recente episodio su un forum dedicato agli LLM locali evidenzia come affermazioni errate, generate o meno da AI, possano diffondersi rapidamente. La validazione delle fonti e il pensiero critico sono essenziali per contrastare la disinformazione, ...

#LLM On-Premise #DevOps
2026-03-04 LangChain Blog

LangChain potenzia gli agenti AI con nuove 'skills' open source

LangChain introduce un set di 'skills' open source per migliorare le capacità degli agenti AI nel suo ecosistema. Queste 'skills', istruzioni e risorse specializzate, vengono caricate dinamicamente per ottimizzare le prestazioni degli agenti in compi...

2026-03-04 LangChain Blog

LangSmith CLI e Skills: Automazione e valutazione per agenti AI

LangSmith introduce una CLI e un set di 'skills' per migliorare le capacità degli agenti AI nel gestire il ciclo di vita dei modelli. Le skills offrono istruzioni e risorse specializzate, caricate dinamicamente per evitare sovraccarichi. L'integrazio...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-04 OpenAI Blog

Axios usa l'AI per il giornalismo locale ad alto impatto

Allison Murphy, COO di Axios, spiega come l'azienda sfrutta l'intelligenza artificiale per supportare i giornalisti locali, ottimizzare i flussi di lavoro delle redazioni e fornire giornalismo locale di grande impatto su vasta scala.

2026-03-04 The Register AI

AI in sanità: assistenti virtuali vulnerabili a manipolazioni

Esperti di sicurezza hanno dimostrato come un assistente virtuale basato su AI, progettato per gestire prescrizioni mediche, possa essere facilmente influenzato a fornire consigli errati o a modificare le dosi dei farmaci. Questo solleva preoccupazio...

2026-03-04 Microsoft Research

Microsoft presenta Phi-4: modello multimodale compatto per ragionamento

Microsoft ha rilasciato Phi-4-reasoning-vision-15B, un modello multimodale open-weight con 15 miliardi di parametri. Progettato per bilanciare capacità di ragionamento, efficienza e necessità di dati, eccelle in compiti di matematica, scienze e compr...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-04 OpenAI Blog

OpenAI valuta l'impatto dell'AI sull'apprendimento

OpenAI ha introdotto la Learning Outcomes Measurement Suite, uno strumento per valutare l'impatto dell'intelligenza artificiale sull'apprendimento degli studenti in diversi contesti educativi e nel tempo. L'iniziativa mira a fornire dati concreti sul...

2026-03-04 The Next Web

Interfacce AI più umane: un designer ripensa l'esperienza utente

Valentyn Pavliuchenko, a capo di Hosanna Studio, propone interfacce più intuitive per l'AI, superando le interazioni fredde e meccaniche. L'obiettivo è colmare il divario tra la potenza computazionale e la desiderabilità umana, affrontando il collo d...

2026-03-04 Phoronix

AMD EPYC in testa nelle performance RAN 5G/6G con OCUDU

La Linux Foundation ha presentato OCUDU Ecosystem Foundation al Mobile World Congress (MWC). L'iniziativa mira a promuovere l'innovazione open-source AI-RAN (Radio Access Network) per soluzioni di rete 5G e 6G. I primi test su server AMD EPYC e Intel...

#Hardware #LLM On-Premise #DevOps
2026-03-04 The Next Web

Mutable Tactics: 1,8 milioni di euro per droni autonomi con IA

La startup britannica Mutable Tactics ha raccolto 1,8 milioni di euro in un round pre-seed. L'obiettivo è sviluppare un software di intelligenza artificiale per l'automazione di droni, consentendo operazioni autonome e processi decisionali in scenari...

#LLM On-Premise #DevOps
2026-03-04 Ars Technica AI

Data center: Big Tech costruirà le proprie centrali elettriche?

Le grandi aziende tecniciche si impegneranno a costruire centrali elettriche dedicate per alimentare i propri data center, con l'obiettivo di proteggere i consumatori dall'aumento dei costi dell'energia. L'iniziativa, promossa dall'ex presidente Trum...

2026-03-04 TechCrunch AI

CollectivIQ: risposte AI più affidabili con il crowdsourcing dei chatbot

La startup CollectivIQ propone un approccio innovativo per migliorare l'accuratezza delle risposte AI. Aggregando le consegne di diversi modelli, tra cui ChatGPT, Gemini, Claude e Grok, la piattaforma mira a fornire agli utenti informazioni più compl...

#LLM On-Premise #DevOps
2026-03-04 Tom's Hardware

Nvidia investe 4 miliardi $ in fotonica per i data center

Nvidia investe massicciamente in Lumentum e Coherent per rafforzare le catene di approvvigionamento di interconnessioni per data center. L'obiettivo è finanziare ricerca e sviluppo negli Stati Uniti, incrementare la produzione e assicurarsi capacità ...

#Hardware
2026-03-04 The Register AI

Gram: un editor di testo in Rust derivato da Zed, senza AI e chat

Gram è un nuovo editor di testo scritto in Rust, nato come fork semplificato di Zed. Sono state rimosse le funzionalità AI e chat. Lo sviluppatore di Gram afferma che Zed Industries ha modificato i termini di servizio in seguito alla pubblicazione de...

#LLM On-Premise #DevOps
2026-03-04 TechCrunch AI

Data center galleggianti: Aikido punta sull'eolico offshore

Lo sviluppatore eolico offshore Aikido prevede di implementare un piccolo data center sottomarino, alimentato da una turbina eolica galleggiante. L'iniziativa esplora nuove frontiere per l'alimentazione e il raffreddamento di infrastrutture di calcol...

#LLM On-Premise #DevOps
2026-03-04 Tech.eu

Techstars chiude il programma di accelerazione a Torino

Techstars, società di venture capital e acceleratore di startup, conclude il suo programma di accelerazione a Torino. La decisione segue la sospensione di analoghe iniziative a Berlino, Parigi, Stoccolma e Oslo. Techstars ha investito in 69 startup t...

2026-03-04 The Next Web

GHARAGE Ventures lancia fondo da 40 milioni per travel tech

GHARAGE Ventures, con sedi a Berlino e Singapore, ha annunciato il lancio del suo Fondo I, un fondo da 40 milioni di euro focalizzato su tecnicie che plasmano il futuro delle infrastrutture di viaggio e del retail aeroportuale. Il fondo investirà a l...

2026-03-04 The Register AI

Problemi con Outlook.com: email bloccate e disagi per gli utenti

Microsoft ha bloccato numerose email destinate a utenti Outlook.com, causando disagi e rallentamenti. La causa sembrerebbe essere un errore o regole di blocco eccessivamente restrittive. La situazione è stata descritta come "carnage" da una fonte int...

2026-03-04 Tech.eu

PLD Space raccoglie 180 milioni per lanci satellitari

La società spagnola PLD Space ha ottenuto 180 milioni di euro in un round di finanziamento di Serie C, guidato da Mitsubishi Electric Corporation. L'investimento supporterà la transizione alle operazioni commerciali e l'espansione delle capacità indu...

2026-03-04 The Next Web

PLD Space ottiene 180 milioni per lanci commerciali europei

La società spagnola PLD Space, con sede a Elche, ha raccolto 180 milioni di euro in finanziamenti di Serie C. L'obiettivo è accelerare la produzione di sistemi di lancio orbitali e ampliare le operazioni a livello globale. Mitsubishi Electric parteci...

#LLM On-Premise #DevOps
2026-03-04 Tech.eu

Kilo Health: da startup a venture studio da 500 milioni di euro

La società lituana Kilo Health, nata nel 2013 e specializzata in prodotti per la salute direct-to-consumer, si riposiziona come venture studio ad alta velocità. L'azienda investirà 20 milioni di euro in AI nei prossimi tre anni, puntando a un fattura...

2026-03-04 The Next Web

Oxa raccoglie 103 milioni per la guida autonoma industriale

Oxa, azienda specializzata in software per veicoli autonomi, ha ottenuto 103 milioni di dollari in un round di finanziamento di Serie D. L'obiettivo è espandere l'implementazione della sua piattaforma di guida autonoma nel settore industriale. Tra gl...

#Hardware
2026-03-04 DigiTimes

AGI e Snapdragon: AI privata sui dispositivi al MWC 2026

Al Mobile World Congress 2026, AGI e Snapdragon presentano soluzioni per l'esecuzione di intelligenza artificiale direttamente sui dispositivi, garantendo maggiore privacy e controllo dei dati. L'obiettivo è un'AI app-agnostica, fruibile da diverse a...

#LLM On-Premise #DevOps
2026-03-04 Tech.eu

Mutable Tactics: AI per droni militari con finanziamento da 2M$

La startup britannica Mutable Tactics ha raccolto 2,1 milioni di dollari per sviluppare software AI che migliora l'impiego di droni in scenari di combattimento con comunicazioni interrotte. Il finanziamento sarà utilizzato per ampliare il team di ing...

#LLM On-Premise #DevOps
2026-03-04 DigiTimes

AMD punta sull'AI: MI450 in rampa di lancio e accordi con hyperscaler

AMD intensifica la competizione nel mercato dell'intelligenza artificiale con la prossima generazione di GPU MI450, progettata per carichi di lavoro di training e inference. L'azienda mira a capitalizzare la crescente domanda di infrastrutture AI, st...

#Hardware #LLM On-Premise #Fine-Tuning
2026-03-04 DigiTimes

Primax punta su automotive, AIoT e robotica per nuovi ricavi

Il produttore taiwanese Primax sta diversificando il proprio business, puntando su settori in crescita come l'automotive, l'AIoT (Artificial Intelligence of Things) e la robotica. Questa strategia potrebbe portare a una significativa riorganizzazione...

2026-03-04 Tech.eu

GHARAGE Ventures lancia un fondo da 40 milioni per il travel retail

GHARAGE Ventures ha annunciato il lancio del suo Fondo I, con una dotazione di 40 milioni di euro, focalizzato su tecnicie early-stage per il futuro del travel retail. Il fondo investirà globalmente in startup che affrontano le sfide della digitalizz...

2026-03-04 DigiTimes

Gogoro aumenta la quota di mercato a Taiwan con scooter entry-level

Nonostante un calo generale del mercato a Taiwan durante il Capodanno Lunare, Gogoro ha incrementato la propria quota grazie al successo dei nuovi modelli di scooter elettrici entry-level. Questa strategia si è rivelata efficace per attrarre nuovi cl...

2026-03-04 DigiTimes

Samsung accelera la produzione di chip AI con P5 e fonderia in Texas

Samsung intensifica la produzione di chip per l'intelligenza artificiale con l'espansione della linea P5 a Pyeongtaek e l'aumento della capacità della fonderia in Texas. Questa mossa strategica mira a soddisfare la crescente domanda di semiconduttori...

2026-03-04 Tech.eu

Oxa raccoglie 103 milioni $ per la guida autonoma industriale

La startup britannica Oxa ha ottenuto 103 milioni di dollari per espandere le sue operazioni di guida autonoma in porti, aeroporti, magazzini e altri siti industriali. Il finanziamento include un investimento dal fondo sovrano del Regno Unito e da NV...

#Hardware
2026-03-04 ArXiv cs.CL

NLLB-200: Geometria Multilingue e Rappresentazioni Concettuali Universali

Un nuovo studio analizza la geometria delle rappresentazioni di NLLB-200 di Meta, un modello Transformer encoder-decoder addestrato su 200 lingue. La ricerca indaga se il modello apprende rappresentazioni concettuali universali o se raggruppa le ling...

#LLM On-Premise #DevOps
2026-03-04 ArXiv cs.LG

ATPO: Ottimizzazione adattiva per dialoghi medici multi-turno

Un nuovo algoritmo, ATPO, affronta le sfide dell'incertezza nei dialoghi medici tramite LLM. ATPO alloca dinamicamente risorse di calcolo a stati di alta incertezza, migliorando la stima dei valori e l'esplorazione. L'ottimizzazione include pruning g...

2026-03-04 ArXiv cs.LG

RxnNano: LLM compatto per reazioni chimiche e retro-sintesi

Un nuovo studio introduce RxnNano, un modello LLM compatto (0.5B parametri) per la predizione di reazioni chimiche. Il modello utilizza un approccio di apprendimento gerarchico per migliorare la comprensione chimica, superando modelli più grandi (7B+...

#LLM On-Premise #DevOps
2026-03-04 DigiTimes

Edge AI spinge i vendor IPC a Embedded World 2026

La crescente domanda di capacità di calcolo ad alte prestazioni per applicazioni di intelligenza artificiale (AI) in ambito edge sta portando i principali vendor di Industrial PC (IPC) a convergere all'Embedded World 2026. Si prevede una forte spinta...

#Hardware #LLM On-Premise #DevOps
2026-03-04 DigiTimes

Nvidia accelera la fotonica al silicio con accordi pluriennali

Nvidia ha stretto accordi pluriennali con Lumentum e Coherent, segnando un passo avanti significativo nella commercializzazione della fotonica al silicio. Queste collaborazioni potrebbero ottimizzare le interconnessioni ad alta velocità, cruciali per...

#Hardware
2026-03-04 DigiTimes

Robot umanoidi con IA: Delta Electronics frena gli entusiasmi

Il presidente di Delta Electronics smorza le aspettative sui robot umanoidi dotati di intelligenza artificiale, suggerendo che la tecnicia è ancora in una fase immatura. Nonostante i progressi, restano sfide significative prima di una loro adozione d...

#LLM On-Premise #DevOps
2026-03-04 DigiTimes

Il Pentagono studia i droni Shahed iraniani per sciami AI

Il Dipartimento della Difesa statunitense sta analizzando i droni Shahed di fabbricazione iraniana. L'obiettivo è comprendere meglio le tattiche di guerra asimmetrica e sviluppare contromisure, in particolare attraverso l'uso di sciami di droni contr...

2026-03-04 DigiTimes

Taiwan punta sul packaging avanzato per i produttori di pannelli

I produttori di pannelli taiwanesi stanno esplorando il packaging avanzato come elemento chiave per la trasformazione del settore. Questa mossa strategica mira a migliorare le capacità e la competitività nel mercato globale, con un focus sull'innovaz...

#LLM On-Premise #DevOps
2026-03-04 DigiTimes

Taiwan: manca sistema di comando autonomo per droni

Secondo DIGITIMES, Taiwan non dispone di un sistema di comando autonomo per tattiche che coinvolgono sciami di droni. Questa lacuna potrebbe limitare le capacità di difesa e sorveglianza del paese.

#LLM On-Premise #DevOps
2026-03-04 DigiTimes

Samsung sfida Apple con l'assistente AI 'Doubao phone'

Samsung lancia un nuovo smartphone con funzionalità di intelligenza artificiale, in competizione con le prossime integrazioni di Gemini AI da parte di Apple. La mossa evidenzia la crescente importanza degli assistenti AI nei dispositivi mobili.

#LLM On-Premise #DevOps
2026-03-04 DigiTimes

Taiwan risponde alle accuse di furto di chip

Taiwan respinge le affermazioni di furto di chip mosse da Trump, in un contesto di crescenti tensioni nel settore dei semiconduttori. L'isola ribadisce il suo ruolo chiave nell'industria globale dei chip e la sua integrità.

2026-03-04 DigiTimes

Nvidia e MediaTek investono in ottiche per data center AI

Nvidia e MediaTek stanno investendo in nuove tecnicie ottiche per i data center AI. Questi investimenti mirano a migliorare le prestazioni e l'efficienza energetica delle infrastrutture di calcolo necessarie per l'addestramento e l'inference dei mode...

#Hardware #LLM On-Premise #DevOps
2026-03-04 DigiTimes

Meta accelera la superintelligenza con una nuova unità AI applicata

Secondo DIGITIMES, Meta ha creato una nuova divisione di ingegneria AI applicata. L'obiettivo è accelerare lo sviluppo della superintelligenza, presumibilmente focalizzandosi sull'ottimizzazione di modelli e infrastrutture esistenti. Non sono noti de...

#LLM On-Premise #DevOps
2026-03-04 The Register AI

Google Chrome: aggiornamenti di sicurezza ogni due settimane

Google ridurrà a due settimane il ciclo di rilascio degli aggiornamenti del browser Chrome, per desktop, Android e iOS. L'obiettivo è fornire patch di sicurezza più rapidamente, pur mantenendo un canale Extended Stable con aggiornamenti ogni otto set...

2026-03-04 DigiTimes

Intel nomina Craig Barratt presidente: svolta verso l'ingegneria

Intel ha nominato Craig Barratt come nuovo presidente del consiglio di amministrazione. Questa mossa strategica segnala un cambio di direzione, con una maggiore enfasi sull'ingegneria e sull'innovazione tecnicica per guidare la crescita futura dell'a...

#Hardware #LLM On-Premise #DevOps
2026-03-04 DigiTimes

SmartSens alza i prezzi dei sensori CIS per Samsung e Nexchip

SmartSens, fornitore di sensori di immagine CMOS (CIS), ha annunciato un aumento dei prezzi compreso tra il 10% e il 20% per i suoi prodotti destinati a Samsung e Nexchip. La decisione è motivata dalla crescente pressione sui costi di memoria di usci...

2026-03-04 DigiTimes

Apple presenta M5 Pro e M5 Max con architettura Fusion e focus AI

Apple ha annunciato i nuovi chip M5 Pro e M5 Max, basati su una inedita architettura Fusion. I nuovi processori puntano a migliorare le prestazioni nell'ambito dell'intelligenza artificiale e del machine learning, integrando ottimizzazioni specifiche...

#Hardware #LLM On-Premise #DevOps
2026-03-04 DigiTimes

Hub di ricarica coreani come risorse di calcolo AI e città smart

Startup sudcoreane propongono di trasformare gli hub di ricarica per veicoli elettrici in risorse di calcolo per l'intelligenza artificiale. L'iniziativa mira a creare infrastrutture urbane più intelligenti e sostenibili, potenzialmente riducendo i c...

#LLM On-Premise #DevOps
2026-03-04 404 Media

Il Sole "va in tilt": scienziati risolvono il mistero cosmico

Gli scienziati hanno osservato sottili variazioni nel Sole negli ultimi 40 anni, facendo luce sulle vibrazioni a lungo termine della nostra stella. I dati del Birmingham Solar-Oscillations Network (BiSON) rivelano che il Sole non torna alla stessa li...

2026-03-03 TechCrunch AI

Alibaba: cambio al vertice del team Qwen dopo una spinta sull'AI

Junyang Lin, responsabile tecnico del team Qwen di Alibaba, si è dimesso dopo il lancio di un importante modello di intelligenza artificiale. La notizia ha generato reazioni all'interno del team, sollevando interrogativi sulle strategie future del co...

#LLM On-Premise #DevOps
2026-03-03 Tom's Hardware

Intel: Craig Barrett nuovo presidente del consiglio di amministrazione

Frank Yeary si ritira dalla carica di presidente del consiglio di amministrazione di Intel. Craig Barrett, figura storica dell'azienda, assumerà il ruolo. La transizione segna un cambio di leadership ai vertici del gigante dei semiconduttori.

#Hardware #LLM On-Premise #DevOps
2026-03-03 TechCrunch AI

Super PAC finanzia opposizione a regolamentazione IA: il caso Bores

Un Super PAC sostenuto da un miliardario del settore tech sta investendo 125 milioni di dollari per contrastare i candidati favorevoli a una maggiore regolamentazione dell'intelligenza artificiale. Tra questi figura Alex Bores, ex dirigente tech in c...

2026-03-03 TechCrunch AI

ChatGPT: modello GPT-5.3 Instant riduce le risposte 'cringe'

OpenAI introduce un aggiornamento al modello GPT-5.3 Instant di ChatGPT per mitigare risposte considerate fastidiose dagli utenti. L'obiettivo è migliorare l'esperienza utente riducendo le interazioni indesiderate.

#LLM On-Premise #DevOps
2026-03-03 Phoronix

Intel Panther Lake: performance AI con OpenVINO e Xe3 B390

Test Linux sulle nuove GPU Intel Xe3 B390 (architettura Panther Lake) mostrano miglioramenti nelle prestazioni OpenGL, Vulkan e OpenCL rispetto alle generazioni precedenti. Analisi delle performance con Intel Rendering Toolkit e OpenVINO per carichi ...

#Hardware #LLM On-Premise #DevOps
2026-03-03 Tom's Hardware

Mercato DRAM sotto pressione: prezzi orari per la memoria AI?

La crescente domanda di memoria per applicazioni di intelligenza artificiale sta mettendo a dura prova il mercato DRAM. Un report suggerisce che i prezzi potrebbero passare a un modello di tariffazione oraria, con impatti significativi soprattutto pe...

#LLM On-Premise #DevOps
2026-03-03 Google AI Blog

Project Genie di DeepMind: crea nuovi mondi con l'AI

DeepMind presenta Project Genie, un'iniziativa che permette agli utenti di generare mondi virtuali tramite prompt testuali. L'articolo fornisce indicazioni su come formulare i prompt per ottenere i risultati desiderati. Un nuovo modo di creare conten...

#LLM On-Premise #DevOps
2026-03-03 Tom's Hardware

Nvidia RTX 5070 mobile: più VRAM in arrivo nonostante la crisi?

Indiscrezioni suggeriscono che la GPU mobile Nvidia RTX 5070 potrebbe ricevere un aumento di VRAM, passando da 8GB a 12GB. Questa notizia emerge in un periodo di persistente crisi globale delle memorie, sollevando interrogativi sulle strategie di Nvi...

#Hardware #LLM On-Premise #DevOps
2026-03-03 Google AI Blog

Gemini 3.1 Flash-Lite: intelligenza artificiale scalabile ed efficiente

Google presenta Gemini 3.1 Flash-Lite, un modello della serie Gemini 3 progettato per offrire prestazioni elevate e costi contenuti. Questo modello mira a fornire intelligenza artificiale scalabile, ottimizzando l'efficienza computazionale per un'amp...

#LLM On-Premise #DevOps
2026-03-03 Phoronix

GNOME Mutter 50 RC: prestazioni NVIDIA migliorate e supporto HDR nativo

È disponibile la release candidate di GNOME Mutter 50, a due settimane dalla versione stabile. Questa versione include miglioramenti per il compositore Wayland, con particolare attenzione alle prestazioni su schede NVIDIA e al supporto nativo per SDR...

#Hardware #LLM On-Premise #DevOps
2026-03-03 Phoronix

Apple M5 Pro e M5 Max: Nuova Architettura Fusion per le GPU

Apple ha presentato la nuova architettura Fusion con i SoC M5 Pro e M5 Max, dotati di GPU di nuova generazione. Questa architettura promette miglioramenti significativi nelle prestazioni grafiche, aprendo nuove possibilità per applicazioni profession...

#Hardware
2026-03-03 The Register AI

Governi occidentali anticipano il 6G per blindare la sicurezza

Una coalizione di governi occidentali si muove per definire gli standard di sicurezza del 6G prima ancora che la tecnicia sia pienamente sviluppata. L'obiettivo è evitare le problematiche legate alla supply chain e le vulnerabilità cyber riscontrate ...

#LLM On-Premise #DevOps
2026-03-03 The Register AI

Adozione AI: le aziende faticano a gestire la velocità

I leader tecnici segnalano che l'adozione dell'intelligenza artificiale sta superando la capacità delle aziende di gestire i rischi e garantire la conformità. La pressione per implementare soluzioni AI si scontra con la necessità di piani di continui...

#LLM On-Premise #DevOps
2026-03-03 AI News

Sicurezza AI: confronto tra piattaforme enterprise nel 2026

L'intelligenza artificiale sta trasformando il panorama delle minacce informatiche. Le piattaforme di sicurezza AI si concentrano su protezione dell'uso aziendale dell'AI, difesa dei modelli e contrasto delle minacce potenziate dall'AI. Confrontiamo ...

2026-03-03 The Register AI

Microsoft punta a monetizzare gli agenti AI come fossero dipendenti

Microsoft starebbe pianificando di concedere in licenza gli agenti di intelligenza artificiale come fossero dipendenti, con un modello di costo basato sull'utilizzo. L'obiettivo è monetizzare l'impiego di "lavoratori digitali" all'interno delle azien...

#LLM On-Premise #DevOps
2026-03-03 Ars Technica AI

LLM smascherano utenti pseudonimi su larga scala

Una ricerca recente dimostra come i modelli linguistici di grandi dimensioni (LLM) possono identificare utenti dietro account pseudonimi sui social media con un'accuratezza sorprendente. Questo solleva serie preoccupazioni sulla privacy e la possibil...

#LLM On-Premise #DevOps
2026-03-03 The Register AI

Chrome: falla nel pannello Gemini espone i sistemi tramite estensioni

Scoperta una vulnerabilità di alta gravità in Google Chrome. Estensioni malevole potevano sfruttare il pannello Gemini Live AI per ottenere privilegi non autorizzati, compromettendo la sicurezza del sistema operativo sottostante. L'exploit permetteva...

2026-03-03 AI News

IA fisica: KDDI e AVITA per umanoidi nel servizio clienti

KDDI e AVITA collaborano per sviluppare umanoidi IA destinati al servizio clienti, combinando interazione fisica e intelligenza artificiale. L'iniziativa mira a colmare le lacune operative dovute alla riduzione della forza lavoro, integrando avatar a...

#Hardware #LLM On-Premise
2026-03-03 Phoronix

AMD rilascia rocprof-trace-decoder come open source

AMD ha reso open source ROCprof Trace Decoder, uno strumento utile per gli sviluppatori che lavorano con lo stack di calcolo GPU AMD. Questo decoder facilita l'analisi delle tracce di esecuzione, essenziale per ottimizzare le prestazioni delle applic...

#Hardware #LLM On-Premise #DevOps
2026-03-03 Tom's Hardware

DirectX: Microsoft ottimizza il ray tracing con Shader Execution Reordering

Microsoft introduce Shader Execution Reordering (SER) nel nuovo DirectX SDK, incrementando l'efficienza del ray tracing. Le GPU Intel Arc B-series mostrano un miglioramento delle prestazioni fino al 90%. Questa ottimizzazione è parte di DirectX 12 Ul...

#Hardware #LLM On-Premise #DevOps
2026-03-03 Tech.eu

BII investe 1,3 milioni di euro in cinque startup innovative

Il BioInnovation Institute (BII), supportato dalla Novo Nordisk Foundation, ha stanziato 1,3 milioni di euro in finanziamenti aggiuntivi per cinque startup del suo portfolio. L'iniziativa mira a sostenere lo sviluppo di prodotti e l'espansione operat...

2026-03-03 AI News

Santander e Mastercard: pagamenti via AI in Europa

Banco Santander e Mastercard hanno realizzato il primo pagamento end-to-end in Europa eseguito da un'intelligenza artificiale all'interno di una rete bancaria reale. Il sistema, denominato Agent Pay, opera entro limiti e autorizzazioni predefiniti, a...

#LLM On-Premise #DevOps
2026-03-03 DigiTimes

Qualcomm spinge il 6G: implicazioni per AI e priorità wireless

L'impegno di Qualcomm nel 6G evidenzia un cambiamento nelle priorità del settore wireless e dell'intelligenza artificiale. Le nuove tecnicie di connessione avranno un impatto significativo sui dispositivi e sulle infrastrutture, aprendo nuove opportu...

#LLM On-Premise #DevOps
2026-03-03 Tech.eu

Qura raccoglie 1,5 milioni di euro per la gestione della salute in Europa

La startup milanese Qura, specializzata in una piattaforma di gestione della salute basata su intelligenza artificiale, ha chiuso un round pre-seed da 1,5 milioni di euro. L'obiettivo è colmare le lacune nell'assistenza sanitaria preventiva, offrendo...

#LLM On-Premise #DevOps
2026-03-03 Tech.eu

Flink ottiene 100 milioni per espansione mirata nel quick commerce

Flink, operatore attivo nel quick commerce in Germania e Paesi Bassi, ha raccolto 100 milioni di dollari. Il finanziamento, guidato da Prosus, supporterà l'espansione in aree selezionate e consoliderà la posizione finanziaria dell'azienda, focalizzat...

2026-03-03 DigiTimes

Prototipi AI RAN promettono guadagni in uplink al MWC 2026

I prototipi AI RAN mostreranno i miglioramenti nell'uplink al MWC 2026. I vendor si preparano a presentare le ultime innovazioni nel campo delle reti di accesso radio basate su intelligenza artificiale, con l'obiettivo di ottimizzare le prestazioni e...

2026-03-03 AI News

MWC 2026: Reti AI-Native, da promessa 6G a realtà tangibile

Al Mobile World Congress 2026, le reti AI-native hanno smesso di essere una visione futura. Annunci da vendor, produttori di chip e operatori hanno mostrato risultati di test sul campo, lanci di prodotti commerciali e coalizioni per costruire il 6G s...

#Hardware #LLM On-Premise #DevOps
2026-03-03 The Next Web

LearnWorlds: piattaforma AI per creare corsi online

LearnWorlds sfrutta l'intelligenza artificiale per consentire la creazione di corsi online. La piattaforma si inserisce in un mercato in forte espansione, con un valore stimato di oltre 320 miliardi di dollari. Offre strumenti per la gestione complet...

2026-03-03 DigiTimes

Blaize punta sull'India per l'inference edge sovrana

Blaize, produttore di chip per l'intelligenza artificiale quotato al Nasdaq, considera l'India un mercato chiave per la crescita dell'inference edge, con un focus sulla sovranità dei dati. L'azienda, guidata dal CEO Dinakar Munagala, punta a espander...

#LLM On-Premise #DevOps
2026-03-03 Tech.eu

Open Cosmos sfida Starlink con una rete satellitare europea

La startup britannica Open Cosmos progetta di costruire fino a 200 satelliti all'anno per offrire a governi e aziende europee un'alternativa a Starlink di Elon Musk. La rete, chiamata ConnectedCosmos, mira a fornire comunicazioni sovrane e servizi di...

#LLM On-Premise #DevOps
2026-03-03 ArXiv cs.CL

Rappresentazioni grafiche contestuali per la classificazione di documenti

Un nuovo studio esplora l'uso di grafi per rappresentare documenti, sfruttando l'attenzione dinamica a finestra scorrevole per catturare dipendenze semantiche. Reti neurali basate su grafi (GAT) addestrate su questi grafi mostrano risultati prometten...

#LLM On-Premise #DevOps
2026-03-03 ArXiv cs.LG

StaTS: previsione di serie temporali con modelli di diffusione adattivi

Un nuovo modello di diffusione, StaTS, apprende dinamicamente la programmazione del rumore e il denoiser per migliorare la previsione di serie temporali. StaTS utilizza una regolarizzazione spettrale per preservare le strutture e un denoiser guidato...

#Fine-Tuning
2026-03-03 ArXiv cs.LG

Nuovo framework per reti di trasporto pubblico con incertezze

Un nuovo studio introduce un framework per la progettazione di reti di trasporto pubblico che considera le incertezze nella domanda. Il modello, denominato 2LRC-TND, utilizza machine learning e ottimizzazione stocastica contestuale per modellare sia ...

2026-03-03 ArXiv cs.AI

Fact-checking: LLM e grafi di conoscenza per la verifica delle notizie

Un nuovo approccio per il fact-checking online combina LLM e grafi di conoscenza per migliorare l'accuratezza e l'affidabilità delle verifiche. Il sistema utilizza un processo decisionale di Markov per valutare le affermazioni e recuperare evidenze s...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-03 DigiTimes

Data center AI: la spinta verso i 800V DC e trasformatori solid-state

I data center dedicati all'intelligenza artificiale stanno ridefinendo il panorama energetico, con una crescente adozione di architetture a 800V DC e trasformatori solid-state. Questa evoluzione è cruciale per gestire l'elevata richiesta di potenza d...

#Hardware #LLM On-Premise #DevOps
2026-03-03 DigiTimes

Taiwan Mobile e AST SpaceMobile: connettività continua e resilienza

La collaborazione tra Taiwan Mobile e AST SpaceMobile mira a rafforzare la connettività continua e la resilienza in caso di disastri. L'obiettivo è fornire una copertura di rete affidabile anche in situazioni di emergenza, sfruttando tecnicie innovat...

#LLM On-Premise #DevOps
2026-03-03 DigiTimes

Perplexity presenta 'Computer', agente AI per decisioni aziendali

Perplexity ha annunciato 'Computer', un nuovo agente AI progettato per supportare le aziende nei processi decisionali. L'agente integra 19 modelli diversi e mira a fornire analisi approfondite e raccomandazioni basate sui dati per migliorare l'effici...

#LLM On-Premise #DevOps
2026-03-03 The Register AI

Huawei scommette sui datacenter AI flatpack con chip cinesi

Huawei entra nel mercato dell'intelligenza artificiale con datacenter modulari prefabbricati, equipaggiati con chip di produzione cinese. L'azienda promette tempi di implementazione rapidi, ma le prestazioni effettive restano da valutare in scenari r...

#Hardware #LLM On-Premise #DevOps
2026-03-03 DigiTimes

Prezzi DRAM: impennata fino al 70% nel 2026, Nvidia GTC alimenta il rally

Secondo Digitimes, i prezzi delle memorie DRAM sono destinati a subire un'impennata significativa, raggiungendo un aumento del 70% nel secondo trimestre del 2026. L'evento Nvidia GTC 2026 è indicato come catalizzatore di questa crescita, alimentando ...

#Hardware #LLM On-Premise #DevOps
2026-03-03 DigiTimes

Tesla Optimus e Nvidia: competizione crescente nella robotica

La spinta di Tesla nel settore della robotica con Optimus intensifica la competizione globale, mentre la strategia di Nvidia basata su un vasto ecosistema di partner sta ridefinendo il panorama del settore. Si prevede un'accelerazione dell'innovazion...

#Hardware #LLM On-Premise #DevOps
2026-03-03 DigiTimes

Samsung Galaxy S26: focus sull'AI per una nuova esperienza utente

Secondo DIGITIMES, Samsung punta a espandere le funzionalità di intelligenza artificiale nel suo prossimo Galaxy S26, con l'obiettivo di trasformare l'esperienza utente. L'azienda coreana sembra intenzionata a integrare l'AI in modo più profondo nei ...

2026-03-03 Wired AI

Joe Gebbia (ex Airbnb) avvistato con misteriosi auricolari

L'ex Chief Design Officer di Airbnb, Joe Gebbia, è stato visto in un caffè di San Francisco con un paio di auricolari dal design insolito. Il dispositivo ricorda un prototipo visto in una recente pubblicità di OpenAI, poi rivelatasi un falso. Al mome...

2026-03-03 DigiTimes

Nvidia investe in Lumentum per l'ottimizzazione dell'ottica AI

Nvidia ha effettuato un investimento strategico in Lumentum, con l'obiettivo di migliorare le tecnicie ottiche per applicazioni di intelligenza artificiale. La collaborazione mira a sviluppare soluzioni avanzate per l'interconnessione di sistemi AI, ...

#Hardware #LLM On-Premise #DevOps
2026-03-03 Wired AI

Deutsche Telekom integra un agente AI nelle chiamate telefoniche

Deutsche Telekom, in collaborazione con ElevenLabs, sta implementando un assistente AI integrato direttamente nella rete telefonica tedesca. Gli utenti potranno beneficiare dell'AI senza necessità di app aggiuntive, aprendo nuove frontiere nell'inter...

2026-03-03 DigiTimes

Ablecom ABLERACK: cabinet L11 rinforzato per AI ad alta densità

Ablecom presenta ABLERACK, un cabinet L11 progettato per ospitare deployment AI ad alta densità. La struttura rinforzata è testata per resistere a eventi sismici, garantendo stabilità e affidabilità in ambienti critici. Ideale per infrastrutture on-p...

#LLM On-Premise #DevOps
2026-03-03 DigiTimes

Holtek e Generalplus: Edge AI per elettrodomestici e smart glasses

Holtek e Generalplus ampliano le applicazioni di intelligenza artificiale (AI) a livello edge, concentrandosi su elettrodomestici intelligenti e smart glasses. Questa espansione mira a portare capacità di elaborazione AI direttamente sui dispositivi,...

#LLM On-Premise #DevOps
2026-03-02 Tom's Hardware

Nvidia RTX 5070: domina Steam, ma restano interrogativi

La Nvidia GeForce RTX 5070 sembra destinata a diventare la GPU numero uno su Steam, superando le precedenti limitazioni di memoria. Tuttavia, permangono dubbi sulle ragioni di questa improvvisa ascesa e sul suo impatto a lungo termine sul mercato del...

#Hardware #LLM On-Premise #DevOps
2026-03-02 Tom's Hardware

Nvidia risolve bug critico delle ventole con i nuovi driver GeForce 595.71

Nvidia ha rilasciato i driver GeForce 595.71 per risolvere un problema critico che impediva il corretto funzionamento delle ventole su alcune schede grafiche RTX serie 30, 40 e potenzialmente future serie 50. L'aggiornamento mira a ripristinare il co...

#Hardware #LLM On-Premise #DevOps
2026-03-02 Tom's Hardware

Rebellions sfida Nvidia H200 con acceleratore AI quad-chiplet

Rebellions ha presentato all'ISSCC 2026 un acceleratore AI basato su architettura quad-chiplet con interconnessioni UCIe. L'azienda afferma che il suo Rebel100 offre prestazioni paragonabili all'Nvidia H200, ma con un consumo energetico inferiore. La...

#Hardware #LLM On-Premise #DevOps
2026-03-02 Ars Technica AI

Iowa: Data center, nuove regole di zonizzazione e preoccupazioni

Nella contea di Palo, Iowa, l'insediamento di data center genera preoccupazioni tra i residenti, nonostante l'adozione di rigide normative di zonizzazione. Le preoccupazioni riguardano l'impatto ambientale e sulla comunità, in un'area già segnata da ...

#LLM On-Premise #DevOps
2026-03-02 Tom's Hardware

Mercato PC entry-level: prevista scomparsa entro il 2028

Secondo Kingston, il mercato dei PC entry-level è destinato a scomparire entro il 2028. L'aumento dei prezzi delle memorie DRAM sta esercitando una pressione crescente sui consumatori, rendendo i PC di fascia bassa meno accessibili. Questa tendenza p...

#Hardware #DevOps
2026-03-02 The Register AI

SAP chiude la disputa IP con Teradata pagando 480 milioni di dollari

Teradata e SAP hanno posto fine a una lunga battaglia legale. SAP ha accettato di pagare 480 milioni di dollari per risolvere le controversie legate a una joint venture del 2008 che aveva generato reciproche accuse nel settore dei data warehouse e an...

#LLM On-Premise #DevOps
2026-03-02 TechCrunch AI

Interruzione diffusa per il chatbot Claude di Anthropic

Il chatbot Claude di Anthropic ha subito una diffusa interruzione del servizio, con migliaia di utenti che segnalano problemi di accesso. L'incidente ha sollevato interrogativi sulla stabilità delle infrastrutture cloud che supportano i modelli di li...

#LLM On-Premise #DevOps
2026-03-02 TechWire Asia

Reti agentiche: Huawei spinge per standard di comunicazione AI

Huawei presenta soluzioni per reti agentiche, anticipando un futuro dove gli agenti AI gestiranno le connessioni di rete. L'azienda ha rilasciato Agentic Core e promosso A2A-T, un protocollo open source per la collaborazione multi-agente in ambito te...

#LLM On-Premise #DevOps
2026-03-02 LocalLLaMA

Jan-Code-4B: un modello compatto ottimizzato per il codice

Il team di Jan ha rilasciato Jan-Code-4B, un modello di piccole dimensioni ottimizzato per attività di programmazione. Basato su Jan-v3-4B-base-instruct, mira a fornire assistenza nello sviluppo di codice, generazione, refactoring e debugging, manten...

#LLM On-Premise #DevOps
2026-03-02 LocalLLaMA

LLM in locale: prestazioni in crescita con hardware compatto

L'articolo analizza i progressi compiuti nell'esecuzione di modelli linguistici di grandi dimensioni (LLM) in locale, evidenziando come le prestazioni siano migliorate significativamente grazie all'evoluzione dell'hardware. Si confrontano le capacità...

#Hardware #LLM On-Premise #DevOps
2026-03-02 LocalLLaMA

Qwen 3.5: Attenzione alla Cache KV! Richiede BF16, non FP16

Un avviso per chi utilizza Qwen 3.5 in locale con llama.cpp: la cache KV deve essere impostata manualmente su BF16 (bfloat16) anziché sul valore predefinito FP16 (float16). Test di perplexity su wikitext-2-raw confermano che l'implementazione ufficia...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-02 LocalLLaMA

Alibaba rilascia CoPaw per workflow AI multicanale

Il team di Alibaba ha rilasciato CoPaw, una workstation personale ad alte prestazioni per aiutare gli sviluppatori a scalare i workflow di intelligenza artificiale multicanale. CoPaw è progettato per migliorare la gestione della memoria e l'efficienz...

#LLM On-Premise #DevOps
2026-03-02 LocalLLaMA

Qwen 3.5: nuova versione small disponibile

È stata rilasciata una nuova versione del modello linguistico Qwen 3.5. La versione 'small' potrebbe consentire consegne più efficienti su hardware con risorse limitate, aprendo nuove possibilità per applicazioni on-premise e ambienti edge.

#LLM On-Premise #DevOps
2026-03-02 DigiTimes

Taiwan Mobile punta su AI nativa e Open API al MWC 2026

Il Chief Information Officer di Taiwan Mobile, Rock Tsai, ha evidenziato al Mobile World Congress 2026 l'importanza crescente dei workflow "AI nativi" e delle Open API. L'azienda si posiziona così come un attore chiave nell'evoluzione delle telecomun...

#LLM On-Premise #DevOps
2026-03-02 TechWire Asia

Huawei: piattaforma di calcolo AI per aziende globali

Al Mobile World Congress 2026, Huawei ha presentato una piattaforma di calcolo AI per semplificare la creazione e la gestione dell'infrastruttura necessaria per i servizi di intelligenza artificiale. La soluzione promette tempi di realizzazione più r...

#Hardware #LLM On-Premise #DevOps
2026-03-02 Wired AI

I data center guardano al Circolo Polare Artico per l'AI

La crescente domanda di risorse di calcolo per l'intelligenza artificiale spinge i gestori di data center verso regioni con energia abbondante e a basso costo, come quelle prossime al Circolo Polare Artico.

#LLM On-Premise #DevOps
2026-03-02 AI News

Servizi finanziari: l'adozione dell'AI è irreversibile

Secondo un report di Finastra, l'adozione dell'intelligenza artificiale nei servizi finanziari è quasi universale. Le istituzioni si concentrano ora su come scalare l'AI in modo responsabile, governarla efficacemente e integrarla in modo affidabile i...

#LLM On-Premise #DevOps
2026-03-02 AI News

SK Telecom riorganizza la sua infrastruttura core con l'AI

Al MWC 2026, SK Telecom ha delineato una strategia "AI Native" che prevede la riorganizzazione completa della sua infrastruttura IT, l'espansione dei data center a livello di gigawatt e l'aggiornamento del suo modello linguistico di grandi dimensioni...

#LLM On-Premise #DevOps
2026-03-02 DigiTimes

AMD punta sull'IA nel 2026 con accordi nell'ecosistema OpenAI e Meta

Secondo fonti di Digitimes, AMD prevede una forte crescita nel settore dell'intelligenza artificiale nella seconda metà del 2026, grazie a partnership strategiche con OpenAI e Meta. Questa mossa posiziona AMD per competere nel mercato in rapida espan...

#Hardware #LLM On-Premise #DevOps
2026-03-02 The Next Web

Outpost Bio raccoglie 3,5 milioni per modelli AI di microbiologia umana

La startup Outpost Bio ha ottenuto 3,5 milioni di dollari in finanziamenti pre-seed per sviluppare modelli basati su intelligenza artificiale del microbioma umano. L'obiettivo è semplificare la comprensione e l'utilizzo del complesso ecosistema di ba...

#LLM On-Premise #DevOps
2026-03-02 Tech.eu

Tech.eu Summit London 2026: ultimi giorni per gli sconti

Mancano pochi giorni all'aumento dei prezzi per i biglietti Early Bird del Tech.eu Summit London 2026. L'evento, che si terrà il 21 e 22 aprile, riunirà figure chiave del mondo startup e degli investimenti per discutere di AI, fintech, SaaS e sosteni...

2026-03-02 Phoronix

AMD presenta le CPU Ryzen AI PRO 400 per desktop con focus sull'AI

AMD ha annunciato al Mobile World Congress di Barcellona la nuova serie Ryzen AI PRO 400, che include processori desktop Ryzen AI PRO 400. Questi processori sono progettati per carichi di lavoro che richiedono capacità di elaborazione avanzate per l'...

#Hardware #LLM On-Premise #DevOps
2026-03-02 Tech.eu

Outpost Bio raccoglie 3,5 milioni per modelli di microbiologia umana

Outpost Bio, specializzata nella modellazione delle interazioni biologiche umane, ha ottenuto 3,5 milioni di dollari in un round pre-seed. La piattaforma Lab-in-the-Loop combina sperimentazione automatizzata e machine learning per sviluppare modelli ...

#LLM On-Premise #DevOps
2026-03-02 Tom's Hardware

AMD Ryzen AI 400: processori desktop con grafica Radeon 860M

AMD ha presentato i processori desktop Ryzen AI 400, dotati di un massimo di 8 core e grafica Radeon 860M. Questi processori saranno disponibili esclusivamente in sistemi OEM preassemblati.

#Hardware #LLM On-Premise #DevOps
2026-03-02 DigiTimes

Broadcom sfida Nvidia con un processore AI 2nm 3.5D custom

Broadcom intensifica la competizione con Nvidia nel mercato dei processori per intelligenza artificiale, presentando un chip custom realizzato con tecnicia a 2nm e architettura 3.5D. Questa mossa strategica mira a fornire soluzioni hardware avanzate ...

#Hardware #LLM On-Premise #DevOps
2026-03-02 DigiTimes

Softment sbarca a Taiwan: pagamenti multilingua per il turismo

Softment espande i suoi servizi a Taiwan, offrendo soluzioni di ordinazione intelligenti e pagamenti multilingua pensati per i turisti. L'obiettivo è semplificare le transazioni nelle principali destinazioni turistiche, migliorando l'esperienza compl...

2026-03-02 DigiTimes

MWC 2026: Taiwan punta su connettività AI e infrastrutture 5G

Le aziende taiwanesi del settore elettronico presentano al Mobile World Congress 2026 le loro ultime innovazioni in ambito di connettività basata su intelligenza artificiale e infrastrutture 5G. L'attenzione è rivolta a soluzioni che integrano AI per...

#LLM On-Premise #DevOps
2026-03-02 Tech.eu

Noxon raccoglie finanziamenti per l'interfaccia muscolo-computer

La startup medtech Noxon ha chiuso un round di finanziamento seed per sviluppare un'interfaccia muscolo-computer indossabile. L'obiettivo è migliorare la diagnostica muscolare e la stimolazione elettrica neuromuscolare per la riabilitazione e il trat...

2026-03-02 ArXiv cs.CL

Task-Lens: analisi cross-task di dataset vocali per lingue indiane

Un nuovo studio presenta Task-Lens, un'analisi cross-task di 50 dataset vocali indiani in 26 lingue, valutandone l'idoneità per nove task di Natural Language Processing (NLP). La ricerca mira a superare la scarsità di dati, identificando metadati non...

#Fine-Tuning
2026-03-02 ArXiv cs.CL

Segmentazione semantica di documenti ultra-lunghi con Qwen3-0.6B

Un nuovo modello discriminativo basato su Qwen3-0.6B affronta la segmentazione di documenti ultra-lunghi, superando i limiti dei modelli generativi in termini di velocità e supporto per input estesi. Il modello utilizza un approccio a finestra scorre...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-02 ArXiv cs.LG

U-CAN: Unlearning efficiente per la raccomandazione generativa

Un nuovo framework, U-CAN, affronta le problematiche di privacy nei sistemi di raccomandazione generativa basati su LLM. U-CAN mitiga la perdita di utilità durante il machine unlearning, attenuando selettivamente i parametri sensibili nei low-rank ad...

#LLM On-Premise #Fine-Tuning #DevOps
2026-03-02 ArXiv cs.AI

LLM agenti per lo screening di media avversi in ambito AML

Un nuovo sistema basato su LLM e RAG automatizza lo screening di media avversi, componente cruciale nei processi di AML e KYC. L'agente LLM ricerca, elabora documenti e calcola un indice di rischio, dimostrando capacità di distinguere tra individui a...

#RAG
2026-03-02 ArXiv cs.AI

HumanMCP: Dataset per valutare le performance di tool retrieval

Presentato HumanMCP, un nuovo dataset su larga scala per valutare l'efficacia dei Model Context Protocol (MCP) server. Il dataset include query utente realistiche, diversificate e di alta qualità, progettate per simulare interazioni umane con 2800 to...

#Fine-Tuning
2026-03-02 DigiTimes

Meta abbandona lo sviluppo di chip AI interni avanzati

Meta starebbe riducendo i propri sforzi nello sviluppo di chip AI proprietari di fascia alta, aumentando la dipendenza da fornitori esterni come Nvidia e AMD. La decisione riflette le sfide e i costi elevati associati alla progettazione di hardware s...

#Hardware #Fine-Tuning
2026-03-02 DigiTimes

Rohm adotta il processo GaN di TSMC per i server AI

Rohm integrerà la tecnicia GaN di TSMC per aumentare la produzione di componenti destinati ai server AI entro il 2027. Questa mossa strategica mira a soddisfare la crescente domanda di soluzioni ad alta efficienza energetica nel settore dell'intellig...

2026-03-02 DigiTimes

Chip AI RRAM: alleanza Huawei-ByteDance per velocità 66x

Una collaborazione insolita tra Huawei e ByteDance ha portato allo sviluppo di un chip AI basato su RRAM (Resistive Random-Access Memory). Presentato all'ISSCC 2026, promette un incremento di velocità di 66 volte rispetto alle CPU tradizionali, apren...

2026-03-02 DigiTimes

Semiconduttori e AI: dinamiche di mercato in evoluzione

Le dinamiche nel mercato dei semiconduttori e l'accelerazione dell'intelligenza artificiale dominano le notizie settimanali. Cambiamenti nelle quote di mercato e nuove opportunità nel settore AI plasmano il futuro tecnicico. AI-RADAR monitora l'impat...

#Hardware #LLM On-Premise #DevOps
2026-03-02 DigiTimes

Nvidia punta al 6G con piattaforme AI-native e aperte

Nvidia collabora con i principali operatori di telecomunicazioni per definire l'infrastruttura 6G. L'iniziativa si concentra su piattaforme aperte e AI-native, con l'obiettivo di accelerare l'innovazione e lo sviluppo di nuove applicazioni nel settor...

#Hardware #LLM On-Premise #DevOps
2026-03-02 Phoronix

Linux 7.0-rc2 disponibile: dimensioni del kernel in crescita

È disponibile la seconda release candidate settimanale di Linux 7.0 per i test. Linus Torvalds ha espresso preoccupazione per le dimensioni crescenti del kernel, invitando gli sviluppatori a ottimizzare il codice per ridurre l'ingombro.

#LLM On-Premise #DevOps
2026-03-01 DigiTimes

TSMC incentiva la filiera locale con un programma di sconti quinquennale

TSMC rafforza la sua catena di approvvigionamento di attrezzature a Taiwan attraverso incentivi e un programma di sconti quinquennale. L'iniziativa mira a supportare i fornitori locali e a garantire una supply chain più resiliente nel settore dei sem...

#LLM On-Premise #DevOps
2026-03-01 DigiTimes

Google reintegra Intrinsic per accelerare l'AI fisica

Google ha annunciato il reintegro di Intrinsic, una società di robotica precedentemente operante come entità indipendente sotto Alphabet. Questa mossa strategica mira ad accelerare lo sviluppo di soluzioni di AI fisica, integrando le competenze di In...

#LLM On-Premise #DevOps
2026-03-01 Tom's Hardware

Windows 11 guadagna terreno, si avvicina al 75% di quota di mercato

Windows 11 continua la sua ascesa, avvicinandosi a una quota di mercato del 75%. Windows 10 è in declino dopo la fine del supporto Microsoft. L'adozione di Windows 11 riflette un cambiamento nel panorama dei sistemi operativi, con implicazioni per az...

#Hardware
2026-03-01 Tech in Asia

LG Uplus presenta stack AI incentrato sull'uomo al MWC

LG Uplus presenterà al Mobile World Congress (MWC) soluzioni AI incentrate sull'utente, tra cui la Autonomous NW Solution e la Sovereign AI Full-Stack Solution. L'azienda punta a dimostrare il suo impegno verso tecnicie avanzate e personalizzate.

2026-03-01 Tech in Asia

Corea del Sud: export di semiconduttori in crescita del 160%

Le esportazioni di semiconduttori dalla Corea del Sud hanno registrato un aumento del 160,8%, raggiungendo i 25,2 miliardi di dollari. Per il terzo mese consecutivo, le esportazioni superano i 20 miliardi di dollari, evidenziando la forte domanda glo...

#LLM On-Premise #DevOps
2026-03-01 Tech in Asia

L'importanza della componente umana nell'apprendimento

L'intelligenza artificiale può accelerare il progresso, ma raggiungere la meta senza il percorso di apprendimento ha lo stesso valore? Riflessioni sull'importanza dell'esperienza umana nell'era dell'automazione.

2026-03-01 LocalLLaMA

Imminente rilascio del modello Qwen3.5 Small Dense?

Indiscrezioni su Reddit suggeriscono l'imminente rilascio di Qwen3.5 Small Dense. La comunità open source attende con interesse per valutare le performance e le potenziali applicazioni di questo modello.

#Hardware #LLM On-Premise #DevOps
2026-03-01 LocalLLaMA

Qwen 3.5 27B: il modello cinese migliore sotto i 70B per traduzioni

Un utente di LocalLLaMA riporta che Qwen 3.5 27B offre traduzioni dal cinese paragonabili a GPT-3.5 e Gemini, superando altri modelli fino a 70B. Il modello è stato testato su una configurazione locale con 24GB di VRAM, evidenziando un'ottima resa in...

#LLM On-Premise #DevOps
2026-03-01 LocalLLaMA

Inference LLM Bare-Metal: Avvio Diretto Senza OS su Dell E6510

Un sviluppatore ha creato un'applicazione UEFI che avvia direttamente un'interfaccia di chat LLM, bypassando il sistema operativo e il kernel. L'intera pila, dal tokenizer al motore di inference, è scritta in C senza dipendenze esterne. Attualmente, ...

#LLM On-Premise #DevOps
2026-03-01 The Register AI

NanoClaw: l'agente AI in container per ambienti più sicuri

NanoClaw è una versione più leggera e orientata alla sicurezza della piattaforma di agenti AI OpenClaw. L'obiettivo è mitigare i rischi associati ad agenti AI non controllati, confinando l'esecuzione in container isolati.

#LLM On-Premise #DevOps
2026-03-01 Phoronix

GNU Hurd: supporto a 64-bit pronto, SMP in arrivo

Il microkernel GNU Hurd ha raggiunto un traguardo significativo con il supporto a 64-bit. Gli sviluppatori annunciano la disponibilità della versione a 64-bit, mentre proseguono i lavori per l'implementazione del supporto SMP (Symmetric Multi-Process...

2026-02-28 DigiTimes

Fitipower punta su AI ed edge computing per una crescita nel 2024

Il produttore taiwanese Fitipower prevede una crescita nel 2024, grazie alla crescente domanda di chip per applicazioni di intelligenza artificiale (AI) e edge computing. L'azienda punta a consolidare la propria posizione in questi settori in espansi...

#LLM On-Premise #DevOps
2026-02-28 DigiTimes

Phison passa ai pagamenti anticipati per l'impennata dei prezzi NAND

Il produttore di controller Phison sta passando a un modello di pagamenti anticipati a causa dell'aumento del 500% dei prezzi delle memorie NAND. Questa mossa strategica mira a garantire la fornitura e mitigare l'impatto della volatilità del mercato.

#Hardware #LLM On-Premise #DevOps
2026-02-28 LocalLLaMA

Google: Ragionamenti più lunghi non implicano maggior accuratezza nei LLM

Una nuova ricerca di Google mette in discussione l'assunto che catene di ragionamento più lunghe portino a risultati migliori nei modelli linguistici. Lo studio introduce il concetto di Deep Thinking Ratio (DTR) per misurare la qualità del ragionamen...

#LLM On-Premise #DevOps
2026-02-28 LocalLLaMA

DeepSeek V4: in arrivo funzionalità di generazione immagini e video

Secondo il Financial Times, DeepSeek si prepara a rilasciare la versione 4 del suo modello di intelligenza artificiale. La nuova versione includerà funzionalità avanzate di generazione di immagini e video, ponendosi come concorrente diretto dei model...

#LLM On-Premise #DevOps
2026-02-28 LocalLLaMA

Qwen 3.5-35B-A3B: un modello sorprendente per task di sviluppo

Un utente di Reddit riporta risultati eccezionali con Qwen 3.5-35B-A3B, un modello che ha sostituito GPT-OSS-120B nel suo flusso di lavoro quotidiano. L'utente lo impiega per attività di sviluppo, automazione di processi e analisi di codice, evidenzi...

#Hardware #LLM On-Premise #DevOps
2026-02-28 LocalLLaMA

LocalLLaMA: la community sfida il vendor lock-in nell'AI

Un utente di Reddit elogia la community LocalLLaMA per il suo approccio "fai da te" all'intelligenza artificiale, in contrasto con la tendenza del settore verso soluzioni proprietarie e vendor lock-in. L'utilizzo di GPU consumer come le RTX 3090 per ...

#Hardware #LLM On-Premise #DevOps
2026-02-28 LocalLLaMA

OpenAI: cambio di strategia gradito agli investitori

Un post su Reddit, ripreso dalla community LocalLLaMA, suggerisce un cambio di strategia di OpenAI che sembra incontrare il favore degli investitori. I dettagli specifici di questo cambio di direzione non sono esplicitati, ma la reazione positiva ind...

#LLM On-Premise #DevOps
2026-02-28 404 Media

Neanderthal: maschi più prolifici con donne Homo Sapiens

Uno studio rivela che gli incroci tra Neanderthal e Homo Sapiens erano sbilanciati: i maschi Neanderthal si accoppiavano più frequentemente con femmine Homo Sapiens rispetto al contrario. Questa asimmetria spiega la distribuzione del DNA Neanderthal ...

2026-02-28 TechCrunch AI

Meta, Oracle, Microsoft: investimenti miliardari in infrastrutture AI

I principali fornitori di servizi cloud e aziende tech stanno investendo cifre enormi in infrastrutture dedicate all'intelligenza artificiale. Meta, Oracle, Microsoft e Google guidano la spesa per sostenere la crescente domanda di capacità di calcolo...

#Hardware #LLM On-Premise #DevOps
2026-02-28 OpenAI Blog

OpenAI e Dipartimento della Guerra USA: accordo sull'AI

OpenAI ha siglato un accordo con il Dipartimento della Guerra statunitense che definisce le linee guida di sicurezza, le protezioni legali e le modalità di implementazione dei sistemi di intelligenza artificiale in ambienti classificati. L'accordo mi...

#LLM On-Premise #DevOps
2026-02-28 Ars Technica AI

Trump vuole bandire Anthropic dal governo USA

L'ex presidente Donald Trump ha annunciato di aver ordinato a tutte le agenzie federali di cessare immediatamente l'uso degli strumenti di intelligenza artificiale di Anthropic. La decisione arriva dopo settimane di contrasti tra Anthropic e funziona...

#LLM On-Premise #DevOps
2026-02-28 Phoronix

AMD prepara miglioramenti IBS per Zen 6 in Linux

AMD sta preparando il terreno per l'integrazione dei suoi processori Zen 6 di prossima generazione nell'ecosistema Linux. Una serie di patch, destinate al sottosistema perf di Linux, sono state accodate per l'inclusione nel kernel Linux 7.1. Queste p...

#Hardware #LLM On-Premise #DevOps
2026-02-28 Tom's Hardware

OpenAI: raccolta fondi record da 110 miliardi, Nvidia investe 30 miliardi

OpenAI ha raccolto 110 miliardi di dollari in un round di finanziamento privato, il più grande nella storia del settore tech. Nvidia ha contribuito con 30 miliardi di dollari. La valutazione della startup sale così a 730 miliardi di dollari.

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-28 Tom's Hardware

AMD Ryzen 7 9850X3D vs Intel Core i9-14900K: duello di processori nel 2026

Un confronto tra i processori AMD Ryzen 7 9850X3D e Intel Core i9-14900K suggerisce che la piattaforma Raptor Lake di Intel potrebbe rimanere competitiva anche nel 2026. L'articolo analizza le potenziali performance e il posizionamento di mercato di ...

#Hardware #LLM On-Premise #DevOps
2026-02-28 Tom's Hardware

Dispositivo estrae 1000 litri d'acqua al giorno dall'aria del deserto

Un dispositivo prototipo, ideato da un vincitore del premio Nobel previsto per il 2025, promette di estrarre fino a 1000 litri di acqua potabile al giorno dall'aria del deserto, anche con un'umidità del 20% o inferiore. L'innovazione mira a fornire a...

2026-02-28 The Next Web

Funzionalità AI: il rischio è l'insoddisfazione del cliente?

Le aziende SaaS stanno integrando funzionalità di intelligenza artificiale, ma la soddisfazione dei clienti esistenti non sembra migliorare. L'attenzione e il budget dedicati all'AI potrebbero sottrarre risorse ad altre aree cruciali, portando a un a...

#LLM On-Premise #DevOps
2026-02-28 The Next Web

Divario di fatturato: leadership USA vs Europa

Un articolo di The Next Web analizza come le strategie di crescita aziendale che portano a un milione di fatturato spesso falliscono nel raggiungere i dieci milioni. Il problema raramente risiede nel prodotto o nel mercato, ma in altri fattori intern...

2026-02-20 LocalLLaMA

SanityBoard: Nuovi Modelli LLM e Agenti Open Source a Confronto

SanityBoard si aggiorna con nuovi risultati di benchmark per modelli come Qwen3.5 Plus, GLM 5 e Gemini 3.1 Pro, oltre a tre nuovi agenti open source per la generazione di codice. L'analisi evidenzia l'importanza dell'infrastruttura e delle caratteris...

#LLM On-Premise #DevOps
2026-02-20 LocalLLaMA

Luma v2.9: un LLM compatto addestrabile in locale

È stato rilasciato Luma v2.9, un modello di linguaggio di piccole dimensioni (circa 10 milioni di parametri) basato su architettura transformer. La particolarità è che può essere addestrato con dati personalizzati ed eseguito interamente in locale, s...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-20 TechCrunch AI

Google Gemini Pro 3.1: prestazioni da record nei benchmark

Il nuovo modello Gemini Pro 3.1 di Google promette capacità avanzate per la gestione di carichi di lavoro complessi. Le prestazioni nei benchmark suggeriscono un significativo passo avanti nelle capacità dei LLM di Google.

#LLM On-Premise #DevOps
2026-02-20 LocalLLaMA

Gemini 3.1 in Arrivo Prima di Gemma 4: Anticipazioni

Indiscrezioni suggeriscono che Google potrebbe rilasciare Gemini 3.1 prima di Gemma 4. La notizia, apparsa su Antigravity e rilanciata su Reddit, alimenta le speculazioni sulle prossime mosse di Google nel campo dei modelli linguistici di grandi dime...

2026-02-19 The Register AI

Google presenta Gemini 3.1 Pro, promettendo capacità di ragionamento avanzate

Google ha annunciato Gemini 3.1 Pro, descrivendolo come un passo avanti nelle capacità di ragionamento. Questo nuovo modello di intelligenza artificiale promette prestazioni migliorate in diversi ambiti, alimentando la competizione nel settore dei mo...

#Hardware #LLM On-Premise #DevOps
2026-02-19 Ars Technica AI

Google presenta Gemini 3.1 Pro, punta su problem-solving complesso

Google ha annunciato Gemini 3.1 Pro, l'ultima versione del suo modello di intelligenza artificiale. Promette miglioramenti significativi nelle capacità di problem-solving e ragionamento. Il modello è attualmente in anteprima per sviluppatori e consum...

#LLM On-Premise #DevOps
2026-02-19 LocalLLaMA

Kitten TTS V0.8: Modello text-to-speech super-compatto open source

Kitten ML ha rilasciato Kitten TTS V0.8, una serie di modelli text-to-speech (TTS) open source di dimensioni estremamente ridotte, con il modello più piccolo che occupa meno di 25 MB. Questi modelli, disponibili con licenza Apache 2.0, offrono otto v...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-18 LocalLLaMA

FlashLM v4: modello ternario da 4.3M addestrato su CPU in 2 ore

FlashLM v4 è un modello linguistico con 4.3 milioni di parametri, pesi ternari (-1, 0, +1) e addestramento su CPU in sole due ore. Genera storie coerenti, dimostrando che modelli di dimensioni ridotte possono raggiungere risultati interessanti con un...

#Hardware #Fine-Tuning
2026-02-18 LocalLLaMA

LLM di ByteShape: modelli coder per ogni hardware, incluso Raspberry Pi

ByteShape rilascia Devstral-Small-2-24B e Qwen3-Coder-30B, modelli ottimizzati per diverse piattaforme hardware. Devstral eccelle su GPU RTX 40/50, mentre Qwen3-Coder offre prestazioni su Raspberry Pi 5. La scelta dipende dalle risorse disponibili e ...

#Hardware #LLM On-Premise #DevOps
2026-02-18 LocalLLaMA

LLM valutano altri LLM: un'analisi meta

Un utente di Reddit ha riproposto un esperimento interessante: far valutare a diversi modelli linguistici le performance di altri LLM su criteri specifici. I dati raccolti sono disponibili su Hugging Face per ulteriori analisi e confronti.

#LLM On-Premise #DevOps
2026-02-18 Google AI Blog

Gemini ora crea musica da testo e immagini con Lyria 3

L'app Gemini si arricchisce di Lyria 3, una funzionalità che permette di generare brani musicali di 30 secondi a partire da input testuali e immagini. Un nuovo modo per esprimere la creatività musicale, direttamente dall'interfaccia di Gemini.

#Hardware
2026-02-18 LocalLLaMA

Qwen 3.5: in arrivo la quantization MXFP4

Junyang Lin ha confermato l'imminente rilascio di modelli Qwen 3.5 con quantization MXFP4. Questo formato, già adottato da OpenAI con GPT-Oss e da Google con Gemma 3 QAT, promette una qualità superiore rispetto alle tradizionali quantizzazioni BF16. ...

#Hardware #LLM On-Premise #DevOps
2026-02-18 TechCrunch AI

Sarvam AI punta sull'open source con nuovi modelli linguistici

Il laboratorio indiano Sarvam AI ha presentato una nuova serie di modelli, tra cui modelli linguistici con 30 e 105 miliardi di parametri, un modello text-to-speech, uno speech-to-text e un modello di visione per l'analisi di documenti. Una scommessa...

#LLM On-Premise #DevOps
2026-02-18 LocalLLaMA

DavidAU rilascia fine-tuning di Gemma 3 (1B-27B) non censurati

DavidAU ha rilasciato una serie di modelli fine-tuned basati su Gemma 3, nelle varianti da 1B, 4B, 12B e 27B parametri. Questi modelli sono stati sottoposti a un processo di 'Heretic' per rimuovere la censura e sono stati ulteriormente ottimizzati ut...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-18 LocalLLaMA

GLM-5: Nuove tecniche per ridurre i costi di training e inference

Il report tecnico di GLM-5 rivela innovazioni chiave come l'adozione di DSA per ridurre i costi di training e inference, un'infrastruttura RL asincrona per migliorare l'efficienza del post-training e algoritmi Agent RL per un apprendimento più effica...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-18 LocalLLaMA

PrimeIntellect rilascia INTELLECT-3.1, modello MoE da 106B parametri

PrimeIntellect ha annunciato INTELLECT-3.1, un modello Mixture-of-Experts (MoE) con 106 miliardi di parametri. Questo modello è stato sviluppato tramite training continuo di INTELLECT-3, con un focus sull'apprendimento per rinforzo in matematica, pro...

#Fine-Tuning
2026-02-18 The Register AI

Anthropic: Sonnet 4.6 migliora in coding e ragionamento

Anthropic ha rilasciato la versione 4.6 del modello Sonnet, focalizzandosi su un miglioramento delle capacità di coding, ragionamento e pianificazione. Il modello promette anche risposte più 'calde, oneste e prosociali'.

#LLM On-Premise #DevOps
2026-02-17 LocalLLaMA

Qwen3.5-397B di Alibaba: modello open-source #3 al mondo

Il modello linguistico di grandi dimensioni (LLM) Qwen3.5-397B di Alibaba ha raggiunto la terza posizione nella classifica dei modelli open-source, secondo l'Artificial Analysis Intelligence Index. Questo risultato sottolinea i progressi nel campo de...

#LLM On-Premise #DevOps
2026-02-17 TechCrunch AI

Anthropic rilascia Sonnet 4.6, nuovo modello di linguaggio

Anthropic ha rilasciato una nuova versione del suo modello linguistico di medie dimensioni, Sonnet. L'aggiornamento segue il ciclo di rilascio quadriennale dell'azienda, dimostrando un impegno costante verso l'innovazione nel campo dell'intelligenza ...

2026-02-17 LocalLLaMA

Qwen 3.5 397B: prime impressioni sull'inference a basso costo

Un utente ha condiviso le proprie impressioni preliminari sul modello linguistico Qwen 3.5 397B, evidenziandone la capacità di fornire risultati di qualità anche senza un ragionamento complesso. Viene inoltre menzionato un costo di inference stimato ...

#LLM On-Premise #DevOps
2026-02-17 LocalLLaMA

Qwen3.5 NVFP4: Inference Quantizzata su NVIDIA Blackwell

È disponibile Qwen3.5 in versione NVFP4, quantizzato con NVIDIA Model Optimizer. Il checkpoint pesa circa 224GB con 17 miliardi di parametri attivi. La licenza è Apache 2.0. Richiede SGLang e offre esempi di lancio su B200/B300 e RTX PRO 6000.

#Hardware
2026-02-17 LocalLLaMA

Qwen 3.5: un'alternativa a Llama 4 Scout?

Un utente di Reddit ha sollevato un'interessante questione: Qwen 3.5 potrebbe essere un valido sostituto di Llama 4 Scout? La domanda ha generato un dibattito nella community di LocalLLaMA, con pareri discordanti sulla reale comparabilità dei due mod...

#LLM On-Premise #DevOps
2026-02-17 LocalLLaMA

Cohere rilascia Tiny Aya: modello multilingua da 3.35B parametri

Cohere Labs ha presentato Tiny Aya, un modello linguistico di piccole dimensioni (3.35 miliardi di parametri) pre-addestrato e open source, ottimizzato per rappresentazioni multilingue efficienti in oltre 70 lingue, incluse quelle con meno risorse. I...

#Fine-Tuning #DevOps
2026-02-16 LocalLLaMA

Qwen 3 Max-Thinking: prestazioni superiori nel ragionamento spaziale

Un benchmark di ragionamento spaziale (MineBench) mostra un significativo miglioramento nelle prestazioni del modello Qwen 3 Max-Thinking rispetto a Qwen 3.5. I risultati suggeriscono che Qwen 3 Max-Thinking si avvicina o supera modelli come Opus 4.6...

2026-02-16 TechCrunch AI

Debutto IPO di Fractal Analytics: persistono timori sull'AI in India

Il debutto in Borsa di Fractal Analytics, la prima società indiana focalizzata sull'intelligenza artificiale a quotarsi, è stato accolto con tiepidezza. L'entusiasmo per l'AI si è scontrato con la cautela degli investitori, in un contesto di vendite ...

#LLM On-Premise #DevOps
2026-02-16 LocalLLaMA

Qwen 3.5: Modello Multimodale Open Source ad Alta Efficienza

Il modello multimodale Qwen 3.5-397B-A17B è stato rilasciato in open source. Questo modello di ultima generazione promette alta efficienza e capacità multimodali native. La notizia è stata diffusa su Reddit, attirando l'attenzione della comunità Loca...

#LLM On-Premise #DevOps
2026-02-16 LocalLLaMA

Rilasciato Qwen3.5-397B-A17B: il modello linguistico open-source

È disponibile Qwen3.5-397B-A17B, un modello linguistico di grandi dimensioni (LLM) open-source sviluppato da Qwen. Il modello è accessibile tramite Hugging Face, aprendo nuove possibilità per la ricerca e lo sviluppo nel campo dell'intelligenza artif...

#LLM On-Premise #DevOps
2026-02-16 LocalLLaMA

Qwen 3.5 Plus (397b-a17b) disponibile sull'app cinese Qwen

L'ultima versione del modello linguistico Qwen 3.5 Plus (397b-a17b) è stata rilasciata sull'applicazione cinese Qwen. Si prevede che i pesi del modello saranno resi pubblici a breve, aprendo nuove possibilità per sviluppatori e ricercatori interessat...

#LLM On-Premise #DevOps
2026-02-16 LocalLLaMA

Alibaba rilascerà Qwen 3.5: modello open-source di nuova generazione

Secondo alcune fonti, Alibaba rilascerà oggi Qwen 3.5, un modello linguistico di grandi dimensioni (LLM) open-source di nuova generazione. Si prevede che il modello presenti innovazioni significative nella sua architettura, aprendo nuove possibilità ...

#LLM On-Premise #DevOps
2026-02-16 ArXiv cs.CL

Framework LLM leggero per la classificazione di informazioni umanitarie

Un nuovo framework leggero per la classificazione di informazioni umanitarie provenienti dai social media in contesti di emergenza. Sfrutta il fine-tuning efficiente di Llama 3.1 8B tramite LoRA, ottenendo un'accuratezza del 79.62% con un training di...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-16 TechCrunch AI

C2i punta a ridurre i colli di bottiglia energetici nei data center AI

La startup indiana C2i ha raccolto 15 milioni di dollari per testare un approccio grid-to-GPU che mira a ridurre le perdite di potenza nei data center dedicati all'intelligenza artificiale. L'obiettivo è ottimizzare l'efficienza energetica, un proble...

#Hardware #LLM On-Premise #DevOps
2026-02-15 LocalLLaMA

MiniMax-2.5: il modello LLM da 230B eseguibile in locale

MiniMax-2.5, un nuovo modello linguistico open-source, si distingue per le sue capacità di coding, tool use e office automation. La versione completa richiede 457GB di memoria, ma una versione quantizzata a 3-bit ne riduce drasticamente le dimensioni...

#Hardware #LLM On-Premise #DevOps
2026-02-15 LocalLLaMA

Modelli open-source dominano la classifica di OpenRouter

Per la prima volta, i primi quattro modelli nella classifica di OpenRouter sono tutti open-weight. Questo segna un potenziale punto di svolta per l'adozione e la fiducia nei modelli di linguaggio open-source, offrendo alternative valide ai modelli pr...

#LLM On-Premise #DevOps
2026-02-15 TechCrunch AI

In calo l'interesse per l'informatica generalista, boom per l'AI

Si registra un calo di interesse degli studenti verso i corsi di laurea in informatica tradizionale. Contestualmente, aumenta l'attrattiva per i corsi e le specializzazioni focalizzati specificamente sull'intelligenza artificiale. Questo trend potreb...

#LLM On-Premise #DevOps
2026-02-15 LocalLLaMA

JoyAI-LLM-Flash: nuovo modello LLM open source su Hugging Face

È disponibile su Hugging Face il modello linguistico di grandi dimensioni (LLM) open source JoyAI-LLM-Flash. La comunità LocalLLaMA su Reddit ha condiviso link e immagini relative al modello, aprendo la strada a discussioni e potenziali utilizzi in a...

#LLM On-Premise #DevOps
2026-02-15 LocalLLaMA

Qwen3 Coder: performance migliorata con Llama.cpp

Un recente aggiornamento a Llama.cpp sembra aver significativamente migliorato le prestazioni del modello Qwen3 Coder Next. I test indicano un aumento del throughput, misurato in token al secondo, utilizzando configurazioni hardware specifiche con GP...

#Hardware #LLM On-Premise #DevOps
2026-02-14 LocalLLaMA

KaniTTS2: modello TTS open-source con voice cloning, VRAM da 3GB

KaniTTS2 è un modello text-to-speech (TTS) open-source da 400 milioni di parametri, progettato per applicazioni conversazionali in tempo reale. Supporta il voice cloning e funziona con soli 3GB di VRAM. Il codice per il pre-training è incluso, permet...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-14 LocalLLaMA

Workstation LLM locale con 6 GPU: scalabilità e orchestrazione

Un utente di Reddit sta sperimentando una workstation locale dotata di 6 GPU (circa 200GB di VRAM) per l'esecuzione concorrente di modelli di ragionamento open-source. L'obiettivo è l'analisi di dati interni e l'automazione del flusso di lavoro. Si c...

#Hardware #LLM On-Premise #DevOps
2026-02-14 LocalLLaMA

Qwen3-TTS.cpp: Inference GGML ottimizzata per voice cloning in locale

Implementazione leggera in GGML di Qwen3-TTS 0.6B, focalizzata sull'inference rapida e sull'utilizzo efficiente della memoria. L'ottimizzazione con Metal backend e CoreML code predictor promette un incremento di velocità fino a 4 volte rispetto alla ...

#Hardware #LLM On-Premise #DevOps
2026-02-14 LocalLLaMA

NVIDIA Nemotron-3: pre-training FP4 e uscita prevista nel 2026

NVIDIA ha annunciato che i modelli Nemotron-3 Super e Ultra sono in fase di pre-training utilizzando la precisione FP4, sfruttando l'elevato throughput FP4 delle GPU NVIDIA. L'uscita dei modelli è prevista per la prima metà del 2026. Un aspetto inter...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-14 LocalLLaMA

NVIDIA Nemotron Nano 12B v2 VL: ragionamento multi-immagine on-premise

Il modello NVIDIA Nemotron Nano v2 12B VL abilita il ragionamento multi-immagine e la comprensione video, con funzionalità avanzate di document intelligence, visual Q&A e summarization. Questo modello è pronto per l'uso commerciale e si presta a scen...

#Hardware #LLM On-Premise #DevOps
2026-02-14 LocalLLaMA

Valutazione di LLM piccoli: l'importanza del parsing negli agenti locali

Un benchmark su 21 modelli linguistici di piccole dimensioni (LLM) rivela che la capacità di chiamare strumenti in locale dipende tanto dal modello quanto dalla precisione del parser utilizzato. I risultati evidenziano come modelli con meno di 4 mili...

#Hardware #LLM On-Premise #DevOps
2026-02-14 LocalLLaMA

Ottimizzazione di Qwen3Next in llama.cpp: prestazioni migliorate

Una pull request su llama.cpp introduce ottimizzazioni per il modello Qwen3Next, promettendo un incremento nella velocità di elaborazione (token/secondo). I miglioramenti mirano a rendere il modello più efficiente e performante.

#LLM On-Premise #DevOps
2026-02-14 DigiTimes

Doubao 2.0 di ByteDance sfida l'élite AI occidentale

ByteDance lancia Doubao 2.0, un modello AI che punta a competere con le soluzioni occidentali. La mossa evidenzia la crescente competizione nel settore dell'intelligenza artificiale e le ambizioni globali dell'azienda cinese.

#LLM On-Premise #DevOps
2026-02-14 The Register AI

Google e OpenAI allertano: i modelli AI sono a rischio clonazione

Google e OpenAI hanno lanciato l'allarme: aziende concorrenti, tra cui la cinese DeepSeek, starebbero analizzando i loro modelli AI per carpirne i segreti e replicarne le funzionalità. Questa pratica solleva interrogativi sulla protezione della propr...

#LLM On-Premise #DevOps
2026-02-14 LocalLLaMA

Sviluppo Locale con Modelli LLM: Strumenti e Esperienze

Una panoramica di strumenti per lo sviluppo di applicazioni con modelli linguistici di grandi dimensioni (LLM) eseguiti in locale, anziché su cloud. Vengono presentati diversi framework e IDE che facilitano l'integrazione di LLM nei progetti di svilu...

#LLM On-Premise #DevOps
2026-02-14 LocalLLaMA

Claude Code: riprocessamento prompt completo con modelli locali

Un utente ha scoperto che Claude Code riprocessava l'intero prompt a ogni richiesta, a causa di un header di billing dinamico. La soluzione consiste nel disabilitare l'invio dell'header tramite una configurazione locale, ripristinando l'efficacia del...

#LLM On-Premise #DevOps
2026-02-14 LocalLLaMA

Claude Opus e GLM-5 riducono il divario con i modelli proprietari

Un recente post su Reddit mette in evidenza come i modelli open-source stiano rapidamente colmando il divario di performance con le soluzioni proprietarie, citando Claude Opus e GLM-5 come esempi significativi di questo progresso. La discussione si c...

#Hardware #LLM On-Premise #DevOps
2026-02-13 TechCrunch AI

Airbnb: AI gestisce un terzo del supporto clienti in USA e Canada

Brian Chesky, CEO di Airbnb, ha annunciato che un terzo del servizio clienti nordamericano è ora gestito da un agente AI. Questo cambiamento segna una crescente adozione dell'intelligenza artificiale nel settore dell'ospitalità per automatizzare e mi...

#LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

GPT-OSS 120B: modello open-source non censurato per inference locale

È disponibile una versione non censurata di GPT-OSS 120B, un modello linguistico open-source con 117 miliardi di parametri totali e una finestra di contesto di 128K. Il modello è in formato MXFP4 e può essere eseguito su hardware consumer o server do...

#Hardware #LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

GPT-OSS (20B) eseguito localmente in browser con WebGPU

Una demo mostra l'esecuzione di GPT-OSS (20B) interamente in locale all'interno di un browser, sfruttando WebGPU. Il sistema è basato su Transformers.js v4 (anteprima) e ONNX Runtime Web. Il codice sorgente e il modello ONNX ottimizzato sono disponib...

#LLM On-Premise #DevOps
2026-02-13 TechCrunch AI

Scosse nel settore AI: talenti lasciano OpenAI e xAI

Il settore dell'intelligenza artificiale è in fermento, con significative defezioni di personale qualificato da aziende leader come OpenAI e xAI. Le ragioni sembrano spaziare da riorganizzazioni interne a divergenze strategiche sulle future direzioni...

#LLM On-Premise #DevOps
2026-02-13 OpenAI Blog

OpenAI rilascia GABRIEL per analisi di scienze sociali su larga scala

OpenAI ha presentato GABRIEL, un toolkit open-source basato su GPT. Questo strumento è progettato per trasformare dati testuali e immagini qualitative in dati quantitativi, con l'obiettivo di supportare i ricercatori nell'analisi di studi di scienze ...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-13 TechCrunch AI

OpenAI rimuove l'accesso al modello ChatGPT-4o incline all'adulazione

OpenAI ha interrotto l'accesso al modello ChatGPT-4o, noto per la sua eccessiva tendenza all'adulazione. La decisione è stata presa anche a seguito di diverse azioni legali che coinvolgono relazioni malsane tra utenti e il chatbot. Il modello era div...

2026-02-13 LocalLLaMA

Imminente rilascio dei pesi del modello Minimax M2.5

È stata confermata l'imminente pubblicazione dei pesi del modello linguistico Minimax M2.5. La notizia è stata diffusa tramite un post su Reddit, generando interesse nella comunità open source interessata a sperimentare con modelli di linguaggio loca...

#LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

Flyto-core: server MCP con 300+ tool locali per LLM

Flyto-core è un server MCP (Meta-Control Protocol) che include oltre 300 tool eseguibili localmente, progettato per semplificare l'integrazione tra modelli di linguaggio locali e varie applicazioni. Offre funzionalità di automazione del browser trami...

#LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

Server domestico con 4x MI50 e 2TB di RAM: configurazione e ottimizzazioni

Un utente ha finalizzato le specifiche del proprio server domestico, dotato di 4 GPU MI50, 2 CPU 8260L e 2TB di RAM DDR4. La configurazione include una VBIOS personalizzata per Linux, aprendo interrogativi sulle possibili ottimizzazioni e carichi di ...

#Hardware #LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

Nvidia riduce i costi di inference LLM fino a 8 volte con DMS

Nvidia ha presentato Dynamic Memory Sparsification (DMS), una tecnica che ottimizza la gestione della cache KV negli LLM durante l'inference. DMS, tramite un segnale appreso di "keep or evict" per ogni token, riduce l'utilizzo della memoria fino a 8 ...

#Hardware #LLM On-Premise #DevOps
2026-02-13 ServeTheHome

GPT-5.3 di OpenAI raggiunge 1000 token/secondo su chip Cerebras

Il modello GPT-5.3-Codex-Spark di OpenAI è stato ottimizzato per funzionare sui processori Cerebras WSE-3, raggiungendo una velocità di inference di oltre 1000 token al secondo. Questa performance apre nuove prospettive per applicazioni che richiedon...

#LLM On-Premise #DevOps
2026-02-13 TechCrunch AI

Claude scala le classifiche dopo le pubblicità al Super Bowl

L'app di Claude ha raggiunto la top 10 nell'App Store statunitense in seguito alla campagna pubblicitaria di Anthropic durante il Super Bowl. La pubblicità, incentrata su una parodia dell'intelligenza artificiale, ha contribuito a incrementare la vis...

2026-02-13 Wired AI

Zillow punta sull'AI per reinventare la ricerca di immobili

Mentre il mercato immobiliare ristagna, il CEO di Zillow vede l'intelligenza artificiale come uno strumento per proteggere la posizione dell'azienda e trasformare il modo in cui le persone cercano casa. L'AI è considerata un ingrediente chiave, non u...

#LLM On-Premise #DevOps
2026-02-13 TechCrunch AI

xAI: Dimissioni di massa o epurazione interna?

Almeno nove ingegneri, inclusi due co-fondatori, hanno lasciato xAI nell'ultima settimana. Le dimissioni sollevano interrogativi sulla stabilità dell'azienda di Elon Musk, già al centro di diverse controversie. Si ipotizza una riorganizzazione intern...

2026-02-13 AI News

IA per la sanità: modello predittivo per ottimizzare le risorse

Ricercatori dell'Università di Hertfordshire hanno sviluppato un modello di IA per migliorare l'efficienza nell'allocazione delle risorse sanitarie. Il sistema analizza i dati storici per prevedere la domanda futura, supportando le decisioni su perso...

2026-02-13 LocalLLaMA

Deepseek testa un nuovo modello: focus sulla comprensione

Deepseek, gruppo cinese attivo nello sviluppo di modelli linguistici di grandi dimensioni (LLM), ha annunciato di essere nella fase di test di un nuovo modello. I benchmark preliminari si concentrano sulle capacità di comprensione del testo, con risu...

#LLM On-Premise #DevOps
2026-02-13 TechCrunch AI

Cohere punta alla IPO forte di ricavi annuali per 240 milioni di dollari

La startup canadese Cohere ha superato i 240 milioni di dollari di ricavi annuali ricorrenti nel 2025, un risultato che la posiziona per una potenziale IPO. La crescita riflette la forte domanda di soluzioni di intelligenza artificiale enterprise, in...

#LLM On-Premise #DevOps
2026-02-13 Ars Technica AI

RentAHuman: la nuova frontiera del lavoro su commissione?

RentAHuman è una piattaforma che ambisce a connettere agenti di intelligenza artificiale con lavoratori umani per l'esecuzione di compiti fisici. Lanciata a febbraio, la piattaforma è stata sviluppata da Alexander Liteplo e Patricia Tani e si present...

#LLM On-Premise #DevOps
2026-02-13 Tech.eu

ScyAI raccoglie 2 milioni di euro per piattaforma di rischio AI

La startup zurighese ScyAI ha ottenuto 2 milioni di euro in un round di pre-seed. L'azienda ha sviluppato una piattaforma che crea profili di rischio quantificati per le aziende con ampi portafogli di asset fisici, combinando dati operativi e modelli...

2026-02-13 LocalLLaMA

MiniMaxAI rilascia il modello linguistico MiniMax-M2.5 su Hugging Face

MiniMaxAI ha reso disponibile il suo modello linguistico MiniMax-M2.5 sulla piattaforma Hugging Face. La notizia, diffusa su Reddit, segnala l'assenza di versioni quantizzate al momento del rilascio. La comunità di LocalLLaMA sta già valutando le imp...

#Hardware #LLM On-Premise #DevOps
2026-02-13 Tom's Hardware

Google: Gemini usata da hacker di stato per attacchi

Google segnala che attori ostili legati a Cina, Russia e Iran stanno sfruttando Gemini nelle varie fasi degli attacchi informatici. L'AI viene impiegata per attività di phishing, sviluppo di codice malevolo e test di vulnerabilità, ampliando le capac...

#LLM On-Premise #DevOps
2026-02-13 Anthropic News

Anthropic e CodePath: Claude nei corsi di informatica USA

Anthropic collabora con CodePath per integrare il modello Claude nel curriculum di informatica di uno dei più grandi programmi universitari negli Stati Uniti. L'iniziativa mira a fornire agli studenti esperienza pratica con modelli di linguaggio avan...

2026-02-13 LocalLLaMA

DeepSeek testa un modello con finestra di contesto da 1 milione di token

DeepSeek sta testando una nuova architettura di modello long-context, capace di supportare una finestra di contesto di 1 milione di token. L'annuncio è stato diffuso tramite un post su X (ex Twitter) da AiBattle, segnalando un significativo passo ava...

#LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

Google rilascia Conductor: estensione CLI per Gemini

Google ha rilasciato Conductor, un'estensione CLI (Command Line Interface) per Gemini, focalizzata sulla gestione del contesto e sull'orchestrazione di workflow agent-based. Conductor memorizza la conoscenza in formato Markdown, facilitando l'organiz...

#LLM On-Premise #DevOps
2026-02-13 The Register AI

Il compilatore C creato dall'AI di Anthropic non entusiasma gli sviluppatori

Anthropic ha sviluppato un compilatore C tramite intelligenza artificiale, ma l'accoglienza tra gli sviluppatori è stata tiepida. L'iniziativa è vista più come una dimostrazione di capacità che come una svolta rivoluzionaria nel campo dell'ingegneria...

#LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

MiniMax onX: Pesi del modello in arrivo

Secondo un post su Reddit, i pesi del modello MiniMax onX saranno rilasciati a breve. La notizia è stata accolta con entusiasmo dalla comunità LocalLLaMA, interessata a soluzioni di inference LLM in locale.

#Hardware #LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

MiniMax-M2.5: Checkpoint disponibili su Hugging Face

I checkpoint del modello MiniMax-M2.5 saranno disponibili su Hugging Face. Questo annuncio, proveniente dalla comunità LocalLLaMA, segnala un'opportunità per sviluppatori e ricercatori di accedere e sperimentare con questo modello. La disponibilità s...

#Fine-Tuning
2026-02-13 LocalLLaMA

Studente lancia Dhi-5B, LLM addestrato da zero con budget limitato

Uno studente universitario ha sviluppato Dhi-5B, un modello linguistico multimodale da 5 miliardi di parametri, addestrato con un budget di circa 1200 dollari. Il modello è stato sviluppato utilizzando un codice personalizzato e metodologie di addest...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-13 LocalLLaMA

Step 3.5 Flash: un modello open-source promettente per task complesse?

Un utente ha testato Step 3.5 Flash su task complesse di merging con un context window di 90k, ottenendo risultati sorprendenti. Le performance superano Gemini 3.0 Preview in scenari agentic, con una velocità notevole. Il modello ha dimostrato flessi...

#LLM On-Premise #DevOps
2026-02-13 ArXiv cs.CL

HybridRAG: Chatbot LLM con Knowledge Base Pre-Generata

HybridRAG è un framework RAG che pre-genera una knowledge base di domande e risposte da documenti non strutturati (PDF con OCR). Questo approccio mira a ridurre la latenza e migliorare la qualità delle risposte nei chatbot, rispetto ai sistemi RAG tr...

#LLM On-Premise #DevOps #RAG
2026-02-13 ArXiv cs.LG

KBVQ-MoE: Quantization a Basso Bit per LLM con Architettura MoE

Un nuovo framework, KBVQ-MoE, affronta le sfide della quantization a basso bit nei modelli linguistici di grandi dimensioni (LLM) con architettura Mixture of Experts (MoE). Sfruttando tecniche di riduzione della ridondanza e correzione della distorsi...

#LLM On-Premise #DevOps
2026-02-13 ArXiv cs.LG

Migliorare i LLM per l'ottimizzazione automatica tramite MIND

Un nuovo approccio, MIND, mira a migliorare le capacità dei modelli linguistici di grandi dimensioni (LLM) nell'ottimizzazione automatica. MIND affronta le limitazioni esistenti nella formazione dei modelli, concentrandosi su errori specifici e raffi...

#Fine-Tuning
2026-02-13 ArXiv cs.AI

Intelligenza Artificiale spiegabile: uno studio senza codice

Un nuovo studio esplora l'Intelligenza Artificiale spiegabile (XAI) in piattaforme ML no-code, concentrandosi su come rendere le spiegazioni accessibili sia ai principianti che agli esperti. La ricerca valuta un modulo XAI in DashAI, una piattaforma ...

2026-02-13 DigiTimes

AUO prevede 1000 assunzioni nel 2026 per espansione AI

Il produttore di display AUO prevede di assumere 1000 persone entro il 2026. L'espansione è guidata dalla crescente domanda di soluzioni AI nei settori dei display e della mobilità intelligente. L'azienda punta a rafforzare la propria presenza in que...

#LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

StepFun Team: sessione AMA sui modelli Step 3.5 Flash

Il team di StepFun ha ospitato una sessione AMA (Ask Me Anything) sulla piattaforma Reddit, focalizzata sui modelli Step 3.5 Flash e altri modelli Step. La sessione ha coperto aspetti relativi all'addestramento dei modelli, la roadmap futura e le fun...

#LLM On-Premise #DevOps
2026-02-13 LocalLLaMA

Benchmark di GLM-5 e Minimax-2.5 su Fiction.liveBench

Un utente ha condiviso su Reddit i risultati di un benchmark comparativo tra i modelli linguistici GLM-5 e Minimax-2.5, utilizzando il dataset Fiction.liveBench. L'analisi, focalizzata sulla performance dei modelli in scenari di generazione di conten...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-13 The Register AI

Cloudflare ottimizza i siti web per gli agenti AI

Cloudflare sposta l'attenzione dalle barriere anti-bot all'offerta di dati strutturati per gli agenti AI. L'obiettivo è fornire contenuti in formati più facilmente elaborabili, come Markdown, anziché HTML.

#LLM On-Premise #DevOps
2026-02-13 DigiTimes

Anthropic accelera lo sviluppo AI con un modello 'hive-mind'

Anthropic sta spingendo i confini dello sviluppo dell'intelligenza artificiale con un nuovo approccio 'hive-mind'. Questo modello promette di accelerare significativamente i tempi di sviluppo e di aprire nuove frontiere nell'AI, anche se i dettagli t...

2026-02-12 TechCrunch AI

IBM punta sui talenti entry-level nell'era dell'AI

IBM prevede di triplicare le assunzioni di personale entry-level negli Stati Uniti entro il 2026. I ruoli saranno focalizzati su mansioni differenti rispetto al passato, riflettendo l'evoluzione del mercato del lavoro guidata dall'intelligenza artifi...

2026-02-12 Ars Technica AI

OpenAI punta su Cerebras per il modello di sviluppo codice GPT-5.3-Codex-Spark

OpenAI ha rilasciato il modello GPT-5.3-Codex-Spark, il suo primo modello di produzione AI a funzionare su hardware non-Nvidia, utilizzando chip Cerebras. Il modello offre codice a oltre 1.000 token al secondo, circa 15 volte più veloce del suo prede...

#Hardware #LLM On-Premise #DevOps
2026-02-12 The Register AI

OpenAI adotta il silicio Cerebras per i suoi modelli

OpenAI ha presentato GPT-5.3-Codex-Spark, il suo primo modello progettato per funzionare sugli acceleratori AI di Cerebras Systems. Questi acceleratori, noti per la loro ampia superficie e la memoria on-chip ad alta velocità, competono direttamente c...

#Hardware #LLM On-Premise #DevOps
2026-02-12 LocalLLaMA

MiniMaxAI: modello M2.5 con 230 miliardi di parametri

OpenHands ha annunciato che il modello MiniMaxAI M2.5 dispone di 230 miliardi di parametri, di cui 10 miliardi attivi. Al momento, il modello non è ancora disponibile su Hugging Face. La notizia è stata diffusa tramite un post su Reddit.

#LLM On-Premise #DevOps
2026-02-12 TechCrunch AI

Didero: $30M per l'automazione 'agentica' degli acquisti industriali

Didero raccoglie 30 milioni di dollari per la sua piattaforma di automazione degli acquisti industriali. La soluzione si integra con i sistemi ERP esistenti, fungendo da livello di intelligenza artificiale 'agentica' per coordinare comunicazioni ed e...

2026-02-12 Tom's Hardware

Nvidia DGX Spark: consumi ridotti del 32% con hot-plug

L'aggiornamento di Nvidia DGX Spark introduce il rilevamento hot-plug sulla NIC ConnectX, ottimizzando l'efficienza energetica delle workstation AI e riducendo i consumi in idle del 32% o più. Un passo avanti per workstation AI più efficienti.

#Hardware #LLM On-Premise #DevOps
2026-02-12 TechCrunch AI

Anthropic: nuova valutazione a 380 miliardi dopo un round Serie G

Anthropic, azienda specializzata in chatbot, ha annunciato un nuovo round di finanziamento di Serie G che porta la sua valutazione a 380 miliardi di dollari. Questo riflette il crescente interesse degli investitori nel settore dell'intelligenza artif...

#LLM On-Premise #DevOps
2026-02-12 LocalLLaMA

Ant Group rilascia Ming-flash-omni-2.0, modello multimodale da 100B

Ant Group ha rilasciato Ming-flash-omni-2.0, un modello multimodale con 100 miliardi di parametri (6 miliardi attivi). Questo modello unificato gestisce input di immagini, testo, video e audio, generando output nei medesimi formati. L'architettura pr...

#LLM On-Premise #DevOps
2026-02-12 TechCrunch AI

Spotify accelera lo sviluppo con l'AI: meno codice, più efficienza

Spotify sta sfruttando modelli AI come Claude Code e il sistema interno Honk per ottimizzare e velocizzare il processo di sviluppo. L'azienda riporta che alcuni dei suoi migliori sviluppatori non scrivono codice da Dicembre, grazie all'automazione of...

2026-02-12 TechCrunch AI

Codex di OpenAI: nuova versione con chip dedicato

OpenAI ha annunciato una nuova versione del suo strumento di sviluppo assistito Codex, sottolineando come questa release rappresenti una pietra miliare nella collaborazione con un produttore di chip. Non sono stati forniti dettagli sulle specifiche t...

#Hardware #Fine-Tuning
2026-02-12 LocalLLaMA

Minimax lancia il modello M2.5: performance promettenti

Minimax ha annunciato ufficialmente il rilascio del suo nuovo modello linguistico, M2.5. I primi benchmark mostrano risultati promettenti in diversi test, tra cui SWE-Bench e BrowseComp. L'azienda ha pubblicato una pagina web dedicata con maggiori de...

#LLM On-Premise #DevOps
2026-02-12 Google AI Blog

Gemini 3 Deep Think: Google punta su scienza, ricerca e ingegneria

Google presenta Gemini 3 Deep Think, un aggiornamento progettato per affrontare le sfide complesse della scienza moderna, della ricerca avanzata e dell'ingegneria di precisione. L'iniziativa mira a fornire strumenti e risorse potenziate per i profess...

#LLM On-Premise #DevOps
2026-02-12 LocalLLaMA

Ovis2.6-30B-A3B: nuovo modello multimodale open source

È stato rilasciato Ovis2.6-30B-A3B, un modello linguistico multimodale (MLLM) che si basa sul precedente Ovis2.5. Questo modello introduce un'architettura Mixture-of-Experts (MoE) per migliorare le performance multimodali e la comprensione di contest...

2026-02-12 Tom's Hardware

Cadence integra AI per progettazione di chip avanzati

Cadence introduce un 'super agente' basato su AI per assistere gli ingegneri nella progettazione di strumenti EDA. L'obiettivo è gestire progetti complessi con trilioni di transistor entro il 2030, sfruttando l'AI per debug e verifica.

#LLM On-Premise #DevOps
2026-02-12 The Register AI

xAI: Musk minimizza l'addio dei co-fondatori, parla di "evoluzione"

Elon Musk descrive le recenti partenze dal team fondatore di xAI come una fase di "evoluzione" necessaria. Il team iniziale, composto da 12 persone, si è ridotto a 6. Musk sembra concentrato su obiettivi ambiziosi per l'azienda.

#LLM On-Premise #DevOps
2026-02-12 Ars Technica AI

Chrome Auto Browse: l'agente AI di Google alla prova

Google ha rilasciato in anteprima l'agente Auto Browse di Chrome per gli abbonati AI Pro e AI Ultra. L'articolo analizza le capacità di questo agente AI nell'automatizzare attività web comuni, valutandone l'efficacia e l'affidabilità nell'esecuzione ...

#LLM On-Premise #DevOps
2026-02-12 404 Media

AI e abusi: create immagini di nudo e aprono un OnlyFans a suo nome

Una donna è stata vittima di abusi tramite immagini generate dall'AI. Sconosciuti hanno creato immagini di nudo a partire dal suo profilo e hanno aperto un account OnlyFans a suo nome. L'incidente è avvenuto durante un picco di generazione di immagin...

2026-02-12 The Next Web

Protocollo A2A: le AI comunicano tra loro senza intervento umano

Il protocollo agent-to-agent (A2A) mira a colmare il divario tra automazione basata su AI e azione umana. L'obiettivo è permettere alle AI di interagire e completare task complesse senza la necessità di intervento diretto da parte dell'utente, aprend...

#LLM On-Premise #DevOps
2026-02-12 LocalLLaMA

Samsung esplora REAM: riduzione modelli LLM senza 'lobotomia'

Samsung propone REAM (REAP-less) come alternativa a REAP di Cerebras per ridurre le dimensioni dei modelli linguistici di grandi dimensioni (LLM). REAM mira a minimizzare la perdita di capacità del modello durante il processo di compressione. Sono st...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-12 DigiTimes

Samsung leader nell'HBM4: produzione di massa in arrivo

Samsung annuncia l'inizio della produzione di massa di memorie HBM4, una novità mondiale che potrebbe ridefinire le prestazioni nell'ambito dell'intelligenza artificiale e dell'high-performance computing. Questa mossa consolida la posizione di Samsun...

#Hardware #LLM On-Premise #DevOps
2026-02-12 Tech.eu

Demoboost raccoglie 2,8 milioni di euro per l'analisi delle demo

La piattaforma Demoboost, specializzata in demo di prodotto B2B basate sui dati, ha ottenuto 2,8 milioni di euro di finanziamento. L'obiettivo è migliorare lo sviluppo del prodotto e l'espansione internazionale. La piattaforma standardizza e scala i ...

2026-02-12 Tech.eu

Rivage raccoglie 2,6 milioni per il suo software paghe

La startup francese Rivage ha ottenuto un finanziamento pre-seed di 2,6 milioni di euro per espandere il suo software di gestione paghe tra le aziende di contabilità. La piattaforma mira a modernizzare un settore dominato da sistemi legacy, automatiz...

2026-02-12 ArXiv cs.CL

KV Policy: Reinforcement Learning per l'eviction della cache nei LLM

Un nuovo approccio per la gestione della cache Key-Value (KV) nei Large Language Models (LLM) utilizza il reinforcement learning (RL) per ottimizzare l'eviction dei token. KV Policy (KVP) addestra agenti RL leggeri per prevedere l'utilità futura dei ...

#Fine-Tuning
2026-02-12 ArXiv cs.CL

LT-Tuning: Ragionamento LLM potenziato in spazi latenti continui

Un nuovo approccio, Latent Thoughts Tuning (LT-Tuning), mira a migliorare le capacità di ragionamento dei modelli linguistici di grandi dimensioni (LLM) sfruttando spazi latenti continui. Questo metodo contrasta con l'approccio tradizionale Chain-of-...

#LLM On-Premise #DevOps
2026-02-12 ArXiv cs.LG

LLM predittivi per esiti funzionali dopo ictus ischemico acuto

Ricercatori hanno valutato l'abilità di LLM (BERT, NYUTron, Llama-3.1-8B, MedGemma-4B) nel predire la scala Rankin modificata (mRS) dopo ictus ischemico acuto. L'addestramento fine di Llama ha mostrato performance promettenti, comparabili a modelli b...

#LLM On-Premise #DevOps
2026-02-12 ArXiv cs.AI

LiveMedBench: Benchmark Medico Aggiornato e Senza Contaminazioni per LLM

Presentato LiveMedBench, un nuovo benchmark per valutare i modelli linguistici di grandi dimensioni (LLM) in ambito medico. Questo strumento si distingue per l'aggiornamento continuo, l'assenza di contaminazioni nei dati e un sistema di valutazione a...

#LLM On-Premise #DevOps
2026-02-12 LocalLLaMA

Unsloth rilascia GLM-5 in formato GGUF per inference locale

Unsloth ha annunciato la disponibilità di GLM-5 in formato GGUF, aprendo la strada all'inference del modello su hardware locale. Il formato GGUF facilita l'utilizzo del modello con strumenti come llama.cpp, rendendolo accessibile a un'ampia gamma di ...

#Hardware #LLM On-Premise #DevOps
2026-02-11 DigiTimes

Agenti AI: punto di svolta commerciale e impatto su cloud

Gli agenti AI stanno raggiungendo una fase di maturità commerciale, con implicazioni significative per i modelli software tradizionali e l'economia del cloud. Si prevede un impatto crescente nei prossimi anni, con nuove opportunità e sfide per le azi...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

GLM-5 raggiunge il punteggio di 50 nell'Intelligence Index

Il modello linguistico GLM-5 ha ottenuto un punteggio di 50 nell'Intelligence Index, posizionandosi come leader tra i modelli open source. La notizia è stata diffusa su Reddit, evidenziando il crescente interesse verso modelli sempre più performanti ...

#LLM On-Premise #DevOps
2026-02-11 TechCrunch AI

Rinnovamento di Siri: Apple Intelligence ancora rimandata?

L'atteso aggiornamento di Siri, basato su Apple Intelligence e promesso da Apple nel 2024, sembra subire un ulteriore ritardo. Le implicazioni per gli utenti e la competizione nel settore degli assistenti vocali restano da valutare.

#LLM On-Premise #DevOps
2026-02-11 TechCrunch AI

Uber Eats lancia assistente AI per la creazione automatica del carrello

Uber Eats ha introdotto "Cart Assistant", una nuova funzionalità basata sull'intelligenza artificiale che automatizza l'aggiunta di prodotti al carrello degli utenti tramite prompt testuali o immagini. L'obiettivo è semplificare e velocizzare il proc...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

Z.ai segnala scarsità di GPU per i propri carichi di lavoro

L'azienda Z.ai ha pubblicamente dichiarato di avere difficoltà a reperire GPU sufficienti per sostenere le proprie attività. La notizia è emersa su Reddit, evidenziando le sfide che molte aziende affrontano nell'ottenere accesso alle risorse hardware...

#Hardware #LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

GLM-5 di Zai-Org disponibile su Hugging Face

Il modello linguistico GLM-5 sviluppato da Zai-Org è ora accessibile tramite Hugging Face. La notizia è stata diffusa su Reddit, aprendo la strada a nuove sperimentazioni e applicazioni del modello da parte della comunità open source. Ulteriori detta...

2026-02-11 TechCrunch AI

Microsoft CoreAI: focus su strumenti per app e sistemi agentici enterprise

Amanda Silver, Corporate Vice President di Microsoft CoreAI, è al lavoro su strumenti per il deployment di applicazioni e sistemi agentici all'interno delle aziende. L'obiettivo è semplificare l'adozione dell'intelligenza artificiale nel contesto ent...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

GLM-5: nuovo modello linguistico con 744 miliardi di parametri

Zai ha annunciato GLM-5, un modello linguistico di grandi dimensioni (LLM) progettato per sistemi complessi e task che richiedono pianificazione a lungo termine. Rispetto alla versione precedente, GLM-5 vanta un numero di parametri significativamente...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-11 OpenAI Blog

Ingegneria dei Prompt: Sfruttare Codex in un Mondo Agent-First

L'articolo esplora come l'ingegneria dei prompt, potenziata da modelli come Codex, stia diventando cruciale in un panorama in cui gli agenti software autonomi guidano sempre più le interazioni digitali. Si discute l'importanza di prompt ben definiti ...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

Supporto Kimi-K2.5 integrato in llama.cpp

La libreria llama.cpp ha aggiunto il supporto per il modello Kimi-K2.5. Questa integrazione permette agli utenti di utilizzare il modello direttamente all'interno di llama.cpp, ampliando le opzioni disponibili per l'inference di modelli linguistici l...

#Hardware #LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

Rilasciato MOSS-TTS: Text-to-Speech Open Source

È stato rilasciato MOSS-TTS, un nuovo modello open source per la sintesi vocale (text-to-speech). La notizia è stata diffusa tramite un post sulla piattaforma Reddit, aprendo la strada a nuove sperimentazioni nel campo della generazione vocale.

#LLM On-Premise #DevOps
2026-02-11 Phoronix

AMD ROCm 7.11: Aggiornamenti e Progressi su Ubuntu

Disponibile la versione 7.11 di AMD ROCm, la piattaforma open-source per il calcolo GPU. Parallelamente, proseguono i lavori per l'integrazione dei pacchetti ROCm in Ubuntu, ampliando le opzioni per gli sviluppatori che utilizzano GPU AMD per carichi...

#Hardware #LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

MiniMax M2.5: In Arrivo la Nuova Versione

Un utente ha segnalato l'imminente rilascio di MiniMax M2.5 sul forum LocalLLaMA. Ulteriori dettagli sul modello e sulle sue capacità non sono ancora disponibili, ma la notizia ha generato interesse nella comunità open source interessata a soluzioni ...

#Hardware #LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

GLM 5.0 e MiniMax 2.5: inizia l'era degli agenti IA cinesi?

Sono state rilasciate le nuove versioni di GLM e MiniMax, due modelli linguistici sviluppati in Cina. GLM 5.0 punta su ragionamento avanzato e sviluppo di codice, mentre MiniMax 2.5 si concentra sulla scomposizione di task complessi e sull'esecuzione...

#LLM On-Premise #DevOps
2026-02-11 TechCrunch AI

Meridian.AI: 17 milioni di dollari per i fogli di calcolo agentivi

Meridian.AI emerge con un finanziamento di 17 milioni di dollari, proponendo un ambiente di sviluppo integrato (IDE) per la modellazione finanziaria agentiva. L'obiettivo è rivoluzionare il modo in cui vengono utilizzati i fogli di calcolo in ambito ...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

MiniMax rilascia il modello M2.5

È stata annunciata la disponibilità del modello MiniMax M2.5. MiniMax è una piattaforma che offre modelli di linguaggio di grandi dimensioni (LLM) e strumenti per lo sviluppo di applicazioni basate sull'intelligenza artificiale. La nuova versione pro...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

Rilasciato GLM-5: il nuovo modello linguistico di Zhipu AI

Zhipu AI ha rilasciato GLM-5, la nuova versione del suo modello linguistico. La notizia è stata diffusa tramite un post su Reddit che rimanda al sito web di Zhipu AI, dove è possibile interagire con il modello attraverso una chat.

#LLM On-Premise #DevOps
2026-02-11 Tom's Hardware

SMIC mette in guardia sull'eccesso di capacità AI

Il principale produttore di chip cinese, SMIC, avverte che la capacità dei data center AI potrebbe superare la domanda. L'azienda sottolinea la necessità di una pianificazione più accurata per l'utilizzo efficace delle risorse.

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

Zhipu lancia GLM-5: un nuovo modello AI che scuote il mercato

L'azienda cinese Zhipu ha annunciato il rilascio del suo nuovo modello di intelligenza artificiale, GLM-5. Il lancio, previsto a breve, promette di intensificare la competizione nel settore. Questo aggiornamento potrebbe portare a nuove opportunità p...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

Grok-3 si aggiunge alla lista dei modelli in arrivo

Elon Musk ha accennato all'arrivo di Grok-3, la prossima iterazione del modello linguistico sviluppato da xAI. Non sono ancora disponibili dettagli sulle specifiche tecniche o sulla data di rilascio, ma la notizia ha suscitato interesse nella comunit...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

DeepSeek: finestra di contesto estesa a 1 milione di token

L'applicazione DeepSeek è stata aggiornata con una finestra di contesto di 1 milione di token. La data di riferimento della conoscenza è stata estesa fino a maggio 2025. Al momento non è chiaro se si tratti di un nuovo modello. Non ci sono ancora agg...

#LLM On-Premise #DevOps
2026-02-11 The Next Web

IA e creatività: una nuova rinascita?

L'intelligenza artificiale sta ridefinendo il mondo del lavoro e il potenziale umano. La creatività, l'immaginazione e la capacità di innovare diventano risorse preziose. La tecnicia gestisce le attività ripetitive, consentendo agli umani di concentr...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

Nanbeige4.1-3B: un modello compatto che ragiona e agisce

Nanbeige LLM Lab presenta Nanbeige4.1-3B, un modello open-source da 3 miliardi di parametri progettato per eccellere in ragionamento complesso, allineamento con le preferenze umane e capacità di agente autonomo. Il modello supporta contesti fino a 25...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

RAG su dati sensibili: pipeline open source per 2M+ pagine

Un tecnico ha sviluppato una pipeline RAG (Retrieval-Augmented Generation) open source per interrogare un dataset di oltre 2 milioni di pagine estratte dagli "Epstein Files". Il progetto mira a ottimizzare le prestazioni di ricerca semantica e Q&A su...

#Fine-Tuning #RAG
2026-02-11 Tech.eu

Porters raccoglie 2,7 milioni di euro per software bancario basato su AI

Porters ha ottenuto un finanziamento pre-seed di 2,7 milioni di euro per sviluppare un software basato su intelligenza artificiale destinato a ottimizzare le operazioni di back-office nel settore bancario. Il finanziamento sarà utilizzato per svilupp...

#LLM On-Premise #DevOps
2026-02-11 DigiTimes

Investimenti CSP spingono crescita data center AI e spedizioni componenti

I crescenti investimenti dei cloud service provider (CSP) stanno alimentando l'espansione dei data center dedicati all'intelligenza artificiale, con un conseguente aumento delle spedizioni di componenti hardware specializzati. Questa tendenza riflett...

#Hardware #LLM On-Premise #DevOps
2026-02-11 ArXiv cs.CL

PAN 2026: analisi di AI generativa e stilometria computazionale

Il workshop PAN 2026 si focalizzerà su stilometria computazionale e text forensics, con valutazioni oggettive e riproducibili. Le attività includono il rilevamento di AI generativa, watermarking di testo, analisi dello stile di scrittura multi-autore...

#DevOps
2026-02-11 LocalLLaMA

Nanbeige4.1-3B: un modello compatto per ragionamento e capacità agentiche

Nanbeige LLM Lab presenta Nanbeige4.1-3B, un modello open-source da 3 miliardi di parametri progettato per eccellere in ragionamento complesso, allineamento con preferenze umane e capacità agentiche. Il modello supporta contesti fino a 256k token e m...

#LLM On-Premise #DevOps
2026-02-11 LocalLLaMA

Fine-tuning di Qwen 14B per autocompletamento su Discord

Un utente ha effettuato il fine-tuning del modello Qwen 14B sui propri messaggi di Discord per ottenere suggerimenti di autocompletamento personalizzati. Il modello è stato addestrato con Unsloth.ai e QLoRA su una GPU Kaggle e integrato con Ollama pe...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-11 Anthropic News

Anthropic presenta Claude Opus 4.6: l'ultima evoluzione del modello

Anthropic ha annunciato Claude Opus 4.6, l'ultima versione del suo modello linguistico di punta. Questa release promette prestazioni migliorate e nuove funzionalità, consolidando la posizione di Claude nel panorama dei modelli di linguaggio di grandi...

#Hardware #LLM On-Premise #DevOps
2026-02-10 TechCrunch AI

Flapping Airplanes: 180 milioni di dollari per una nuova AI

Il laboratorio di intelligenza artificiale Flapping Airplanes ha raccolto 180 milioni di dollari in finanziamenti seed da Google Ventures, Sequoia e Index. L'obiettivo è sviluppare modelli di apprendimento che replichino il ragionamento umano, discos...

#LLM On-Premise #DevOps
2026-02-10 LocalLLaMA

Plano: framework per agenti AI raggiunge 5000 stelle su GitHub

Plano, un framework open-source per lo sviluppo di agenti AI, ha superato le 5000 stelle su GitHub. Il progetto punta su modelli LLM di dimensioni contenute per il routing e l'orchestrazione, con un approccio agnostico rispetto ai framework sottostan...

#LLM On-Premise #DevOps
2026-02-10 LocalLLaMA

Kimi: un LLM promettente secondo la community LocalLLaMA

La community LocalLLaMA ha espresso pareri positivi su Kimi, un modello linguistico di grandi dimensioni, paragonandolo favorevolmente a ChatGPT e Claude. Alcuni utenti lo considerano superiore in determinate applicazioni, aprendo nuove prospettive p...

#LLM On-Premise #DevOps
2026-02-10 LocalLLaMA

Analisi della 'personalità' di LLM open-source tramite hidden states

Un ricercatore ha analizzato gli hidden states di sei modelli linguistici open-source (7B-9B parametri) per misurarne la 'personalità'. L'analisi rivela impronte comportamentali distinte, reazioni diverse a utenti ostili e 'zone morte' comportamental...

#LLM On-Premise #DevOps
2026-02-10 LocalLLaMA

Hugging Face anticipa una collaborazione con Anthropic

Hugging Face ha lasciato intendere una possibile collaborazione con Anthropic, l'azienda dietro i modelli Claude. Sebbene la natura esatta della collaborazione rimanga incerta, le speculazioni suggeriscono che potrebbe trattarsi di un dataset per il ...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-10 The Register AI

Francoforte supererà Londra come hub di colocation entro il 2031

Secondo l'EU Data Centre Association (EUDCA), Francoforte è destinata a superare Londra come principale centro di colocation in Europa entro il 2031. La crescita è trainata da requisiti di sovranità dei dati e dall'espansione dell'intelligenza artifi...

#LLM On-Premise #DevOps
2026-02-10 LocalLLaMA

Qwen-Image-2.0: modello unificato da 7B per generazione e modifica immagini

Il team di Qwen ha rilasciato Qwen-Image-2.0, un modello da 7B unificato per generazione e modifica di immagini, capace di rendering di testo e gestione di immagini a 2K. Al momento disponibile solo via API su Alibaba Cloud (beta a inviti) e demo gra...

#Hardware #LLM On-Premise #DevOps
2026-02-10 Tech.eu

Vesiro raccoglie 1,6 milioni di euro per ottimizzare Elasticsearch

La startup svedese Vesiro ha ottenuto 1,6 milioni di euro per sviluppare un plug-in per Elasticsearch. L'obiettivo è migliorare l'efficienza delle ricerche su vasta scala, riducendo il numero di server necessari e il consumo energetico. Il finanziame...

#LLM On-Premise #Fine-Tuning #DevOps
2026-02-10 LocalLLaMA

Step-3.5-Flash: un modello LLM compatto ma potente

Un utente ha segnalato l'efficacia del modello Step-3.5-Flash, evidenziandone le prestazioni superiori rispetto a modelli più grandi come GPT OSS 120B in determinati contesti. La sua disponibilità su OpenRouter e le prestazioni paragonabili a Deepsee...

2026-02-10 ArXiv cs.CL

Modelli Linguistici Visuali: Tokenizzazione Aggirata o Reintrodotta?

Un recente studio analizza se i modelli linguistici basati su pixel riescono effettivamente a superare i limiti della tokenizzazione, soprattutto in lingue con script non latini. I risultati evidenziano come l'integrazione di tokenizer testuali possa...

#LLM On-Premise #DevOps
2026-02-10 ArXiv cs.LG

TransConv-DDPM: IA Generativa per Serie Temporali Biomediche

Un nuovo modello di IA generativa, TransConv-DDPM, promette di superare la scarsità di dati clinici reali, generando serie temporali fisiologiche sintetiche. Il modello combina un modello di diffusione con U-Net, convoluzioni multi-scala e transforme...

#Fine-Tuning
2026-02-10 ArXiv cs.LG

Reti neurali per l'analisi del consolidamento del suolo non saturo

Sviluppata una rete neurale (LBC-PINN) per simulare il consolidamento del suolo non saturo sotto carico a lungo termine. Il framework integra segmentazione temporale logaritmica e transfer learning per migliorare la precisione e l'efficienza computaz...

#LLM On-Premise #DevOps
2026-02-10 ArXiv cs.AI

DLLM-Searcher: ottimizzazione di modelli Diffusion per agenti di ricerca

DLLM-Searcher è un framework che ottimizza i modelli linguistici di diffusione (dLLM) per agenti di ricerca. Supera le limitazioni esistenti nei dLLM, potenziando ragionamento e capacità di tool-calling tramite fine-tuning. Introduce P-ReAct, un nuov...

#Fine-Tuning
2026-02-10 ArXiv cs.AI

ST-Raptor: sistema agentivo per QA su tabelle semi-strutturate

ST-Raptor è un sistema agentivo per il question answering (QA) su tabelle semi-strutturate. Combina editing visuale, modellazione strutturale ad albero e risoluzione di query guidata da agenti per migliorare l'accuratezza e l'usabilità nell'interpret...

#Fine-Tuning
2026-02-10 LocalLLaMA

Home Assistant locale con Qwen3 su RTX 5060 Ti

Un progetto open source dimostra un assistente vocale per la domotica completamente locale, basato su modelli Qwen3 per ASR, LLM e TTS. Il sistema è eseguito su una GPU RTX 5060 Ti con 16GB di VRAM, evidenziando la possibilità di implementazioni AI o...

#LLM On-Premise #DevOps
2026-02-10 DigiTimes

Server taiwanesi ODMs: trimestre record grazie all'AI

I produttori taiwanesi di server (Original Design Manufacturers) si preparano a un primo trimestre da record, spinti dalla forte domanda di server dedicati all'intelligenza artificiale. Questo incremento sottolinea il ruolo cruciale di Taiwan nella c...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-10 LocalLLaMA

Kimi-Linear-48B-A3B-Instruct: modello LLM e GGUF per contesto esteso

Disponibile un nuovo modello LLM, Kimi-Linear-48B-A3B-Instruct, con un promettente supporto per contesti estesi, superiore a GLM 4.7 Flash. La comunità ha rilasciato una versione GGUF, facilitando l'utilizzo e l'integrazione del modello in diversi am...

#LLM On-Premise #DevOps
2026-02-09 LocalLLaMA

Attesa per DeepSeek V4, GLM-5, Qwen 3.5 e MiniMax 2.2

La community di LocalLLaMA attende con interesse le nuove versioni di modelli linguistici di grandi dimensioni (LLM) come DeepSeek V4, GLM-5, Qwen 3.5 e MiniMax 2.2. In particolare, c'è curiosità per le performance di DeepSeek V4 tramite OpenRouter e...

#Hardware #LLM On-Premise #DevOps
2026-02-09 OpenAI Blog

ChatGPT personalizzato per la difesa USA su GenAI.mil

OpenAI for Government annuncia il deployment di una versione customizzata di ChatGPT sulla piattaforma GenAI.mil, con l'obiettivo di fornire strumenti di intelligenza artificiale sicuri e affidabili ai team della difesa statunitense. La piattaforma m...

#LLM On-Premise #DevOps
2026-02-09 LocalLLaMA

Aurora Alpha: nuovo modello LLM disponibile su OpenRouter

Un nuovo modello LLM, denominato Aurora Alpha, è stato rilasciato su OpenRouter. Il modello è accessibile gratuitamente (prezzo $0/M tokens). Ulteriori dettagli sull'architettura e le capacità di Aurora Alpha sono disponibili sulla piattaforma OpenRo...

#LLM On-Premise #DevOps
2026-02-09 TechCrunch AI

Il CEO di Databricks prevede un futuro dominato dall'AI, non dal SaaS

Ali Ghodsi, CEO di Databricks, ritiene che l'intelligenza artificiale non sostituirà le applicazioni SaaS esistenti con cloni, ma favorirà l'emergere di nuovi concorrenti basati sull'AI. L'impatto maggiore sarà quindi sull'innovazione e sulla competi...

#LLM On-Premise #DevOps
2026-02-09 The Register AI

Chatbot AI: consigli medici inaffidabili come un motore di ricerca?

Ricercatori nel settore sanitario hanno scoperto che i chatbot basati su intelligenza artificiale potrebbero mettere a rischio i pazienti fornendo consigli medici imprecisi. La qualità delle risposte è compromessa dall'incapacità degli utenti di forn...

2026-02-09 LocalLLaMA

Qwen: Un passo avanti per l'inference LLM in locale?

Un recente aggiornamento a llama.cpp sembra migliorare il supporto per il modello linguistico Qwen. Questo sviluppo potrebbe facilitare l'esecuzione e l'inference di modelli di grandi dimensioni su hardware locale, aprendo nuove possibilità per appli...

#Hardware #LLM On-Premise #DevOps
2026-02-09 LocalLLaMA

Qwen3-Coder-Next: un modello versatile che va oltre il codice

Un utente condivide la sua esperienza positiva con Qwen3-Coder-Next, sottolineando la sua capacità di fornire conversazioni stimolanti e soluzioni pragmatiche. Nonostante il nome, il modello si dimostra valido anche per attività che esulano dallo svi...

2026-02-09 TechCrunch AI

Anthropic punta a un round di finanziamento da 20 miliardi

Anthropic, azienda leader nel settore dell'intelligenza artificiale, sta negoziando un nuovo round di finanziamento che potrebbe raggiungere i 20 miliardi di dollari. La decisione è motivata dalla forte competizione nel settore e dagli elevati costi ...

#Hardware #LLM On-Premise #DevOps
2026-02-09 TechCrunch AI

InfiniMind: AI per sbloccare il valore dei dati video aziendali

Nata da ex-leader di Google Japan, InfiniMind sviluppa soluzioni AI per trasformare archivi video aziendali in business intelligence fruibile. L'obiettivo è rendere i contenuti video ricercabili e utilizzabili per estrarre informazioni preziose.

2026-02-09 LocalLLaMA

GLM-5: Nuovi dettagli sull'architettura del modello

È stata rilasciata una pull request che rivela ulteriori dettagli sull'architettura e i parametri di GLM-5. La documentazione include schemi e specifiche tecniche del modello, offrendo una panoramica più chiara delle sue capacità interne. Questo aggi...

#LLM On-Premise #DevOps
2026-02-09 LocalLLaMA

Supporto GLM-5 in arrivo per Transformers: cosa significa

L'integrazione di GLM-5 nel framework Transformers di Hugging Face suggerisce un imminente rilascio del modello. Indizi puntano a una possibile implementazione sotto copertura di GLM-5, denominata Pony Alpha, sulla piattaforma OpenRouter. Questo svil...

#LLM On-Premise #DevOps
2026-02-09 Tech.eu

MuseCool: l'AI per rivoluzionare l'insegnamento musicale

La startup MuseCool utilizza l'intelligenza artificiale per personalizzare le lezioni di musica, colmare le lacune nell'apprendimento tradizionale e rendere lo studio più coinvolgente. Grazie all'analisi audio, l'AI genera esercizi personalizzati e f...

2026-02-09 LocalLLaMA

Ministral-3-3B: un modello compatto per inference locale

Un utente ha segnalato la sua esperienza positiva con il modello Ministral-3-3B, evidenziandone l'efficacia nell'esecuzione di tool call e la capacità di operare con soli 6GB di VRAM. Il modello, in versione instruct e quantizzato a Q8, si dimostra a...

#Hardware #LLM On-Premise #DevOps
2026-02-09 LocalLLaMA

GLM-5 in Arrivo: Indizi nel codice di vLLM

Indiscrezioni sul prossimo modello linguistico GLM-5 emergono da una pull request relativa a vLLM, un framework per l'inference di LLM. La notizia, diffusa inizialmente su Reddit, suggerisce che il nuovo modello potrebbe presto essere integrato e dis...

#Hardware #LLM On-Premise #DevOps
2026-02-09 ArXiv cs.CL

Decodifica contrastiva multi-contesto per il Visual Question Answering

Un nuovo metodo di decodifica, RMCD, migliora i Large Vision Language Models (LVLM) integrando contesti multipli da knowledge base esterne. RMCD pesa i contesti in base alla loro rilevanza, aggregando informazioni utili ed attenuando gli effetti nega...

#Fine-Tuning #RAG
2026-02-09 ArXiv cs.AI

Jackpot: campionamento efficiente per RL e LLM

Ricercatori propongono Jackpot, un framework per il reinforcement learning (RL) con LLM. Jackpot utilizza un campionamento di reiezione con budget ottimale (OBRS) per ridurre la discrepanza tra il modello di rollout e la policy in evoluzione, miglior...

2026-02-09 LocalLLaMA

WokeAI rilascia tre nuovi modelli LLM 'Tankie' open source

Il gruppo WokeAI ha annunciato il rilascio di tre nuovi modelli linguistici di grandi dimensioni (LLM) open source, denominati 'Tankie', progettati per l'analisi ideologica e la critica delle strutture di potere. I modelli sono disponibili su Hugging...

#Hardware #LLM On-Premise #Fine-Tuning
2026-02-09 LocalLLaMA

StepFun: in arrivo Step-3.5-Flash-Base e novità per il capodanno cinese

Il team di StepFun AI ha annunciato l'imminente rilascio di Step-3.5-Flash-Base e anticipa ulteriori sorprese in occasione del capodanno cinese. Sono in corso discussioni con NVIDIA sull'utilizzo di NVFP4 e ottimizzazioni per la gestione dei token.

#Hardware #LLM On-Premise #DevOps
2026-02-09 LocalLLaMA

Supporto a Qwen3.5 integrato in llama.cpp

L'integrazione del supporto per il modello linguistico Qwen3.5 in llama.cpp è stata completata. Questa aggiunta permette di eseguire e sperimentare con Qwen3.5 direttamente su hardware locale, aprendo nuove possibilità per sviluppatori e ricercatori ...

#Hardware #LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Visualizzazione interattiva di modelli LLM in formato GGUF

Un appassionato ha sviluppato uno strumento per visualizzare l'architettura interna dei modelli linguistici di grandi dimensioni (LLM) salvati in formato .gguf. L'obiettivo è rendere più trasparente la struttura di questi modelli, tradizionalmente co...

#LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Benchmark di LLM: Qwen MoE supera LLaMA-70B in neuroscienze

Un nuovo benchmark nel campo delle neuroscienze e delle interfacce cervello-computer (BCI) rivela che il modello Qwen3 235B MoE supera le prestazioni di LLaMA-3.3 70B. I risultati evidenziano un limite di accuratezza condiviso tra diversi modelli, su...

#LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

StepFun 3.5 Flash vs MiniMax 2.1: confronto su Ryzen

Un utente confronta le performance di StepFun 3.5 Flash e MiniMax 2.1, due modelli linguistici di grandi dimensioni (LLM), su una piattaforma AMD Ryzen. L'analisi si concentra sulla velocità di elaborazione e sull'utilizzo della VRAM, evidenziando i ...

#Hardware #LLM On-Premise #DevOps
2026-02-08 LocalLLaMA

Tandem: workspace AI open-source e locale con Rust e SQLite

Uno sviluppatore ha creato Tandem, un ambiente di lavoro AI che gira interamente in locale, senza inviare dati al cloud. La soluzione utilizza Rust, Tauri e sqlite-vec, offrendo un'alternativa leggera alle applicazioni Python/Electron. Supporta model...

#LLM On-Premise #DevOps #RAG
2026-02-08 Phoronix

Intel QATlib 26.02: nuove API per DMA zero-copy

Intel ha rilasciato QATlib 26.02, l'ultima versione della sua libreria user-space per sfruttare la tecnicia QuickAssist (QAT) su hardware compatibile. Questa release introduce nuove API per DMA zero-copy, migliorando le prestazioni di compressione e ...

#Hardware #LLM On-Premise #DevOps
2026-02-07 DigiTimes

Tormente di neve in Giappone minacciano la fornitura di chip AI

Le intense tempeste di neve in Giappone mettono a rischio le catene di approvvigionamento dei chip per l'intelligenza artificiale. La situazione potrebbe impattare la produzione e la distribuzione di componenti essenziali per il settore.

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Prompt di Sistema Completo per Claude Opus 4.6

Un utente ha condiviso su Reddit un prompt di sistema completo per Claude Opus 4.6, il modello di Anthropic. Il prompt è disponibile su GitHub e offre uno sguardo approfondito sulla configurazione interna del modello.

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

DeepSeek V3.2: risultati AIME 2026 superiori al 90% con costi minimi

I risultati del benchmark AIME 2026 mostrano performance elevate, superiori al 90%, sia per modelli chiusi che open source. In particolare, DeepSeek V3.2 si distingue per un costo di esecuzione dell'intero test di soli 0,09 dollari, aprendo nuove pro...

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Benchmark LLM: tempo totale di attesa vs. token al secondo

Un utente di LocalLLaMA ha sviluppato un metodo di benchmarking alternativo per valutare le prestazioni reali dei modelli linguistici di grandi dimensioni (LLM) in locale. Invece di concentrarsi sui token generati al secondo, il benchmark misura il t...

#Hardware #LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

DeepSeek-V2-Lite: performance su hardware modesto con OpenVINO

Un utente ha confrontato DeepSeek-V2-Lite e GPT-OSS-20B su un laptop del 2018 con grafica integrata, usando OpenVINO. DeepSeek-V2-Lite ha mostrato velocità quasi doppie e risposte più coerenti rispetto a GPT-OSS-20B, sebbene con alcune imprecisioni l...

#Hardware
2026-02-07 LocalLLaMA

Qwen e ByteDance testano nuovi modelli seed sull'Arena

Modelli potenziali di Qwen e ByteDance sono in fase di test sull'Arena. I modelli "Karp-001" e "Karp-002" si presentano come varianti di Qwen-3.5. Parallelamente, i modelli "Pisces-llm-0206a" e "Pisces-llm-0206b" sono identificati come modelli di Byt...

#LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Kimi-Linear-48B-A3B e Step3.5-Flash disponibili per llama.cpp

Sono state rilasciate le versioni di Kimi-Linear-48B-A3B e Step3.5-Flash compatibili con llama.cpp. Al momento non sono ancora disponibili i file GGUF ufficiali, ma la community sta già lavorando alla loro creazione. La disponibilità di questi modell...

#Hardware #LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Kernel open-source per attention: 1 milione di token in 1GB di VRAM

Geodesic Attention Engine (GAE) è un kernel open-source che promette di ridurre drasticamente il consumo di memoria per modelli di linguaggio di grandi dimensioni. Con GAE, è possibile gestire 1 milione di token con solo 1GB di VRAM, ottenendo un ris...

#Hardware #LLM On-Premise #DevOps
2026-02-07 LocalLLaMA

Nemo 30B: Modello LLM con finestra di contesto da 1M su singola RTX 3090

Un utente ha testato il modello linguistico Nemo 30B, raggiungendo una finestra di contesto di oltre 1 milione di token su una singola GPU RTX 3090. L'utente ha riscontrato una velocità di 35 token al secondo, sufficiente per riassumere libri o docum...

#Hardware #LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

GLM-5 in fase di test su OpenRouter

Il modello linguistico GLM-5 è attualmente in fase di test sulla piattaforma OpenRouter. Questa notizia, proveniente da una discussione su Reddit, indica un potenziale ampliamento dell'offerta di modelli disponibili per gli utenti di OpenRouter, apre...

#LLM On-Premise #DevOps
2026-02-06 Phoronix

ML-LIB: Libreria di Machine Learning Proposta per il Kernel Linux

Un ingegnere di IBM ha proposto una libreria di machine learning (ML-LIB) per il kernel Linux. L'obiettivo è integrare modelli di ML direttamente nel kernel per ottimizzare le performance del sistema e abilitare nuove funzionalità. La proposta è attu...

#LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

Modello sperimentale con attenzione subquadratica: fino a 10M di contesto

Rilasciato un modello sperimentale da 30B con meccanismo di attenzione subquadratica, scalando a O(L^(3/2)). Permette di gestire contesti fino a 10 milioni di token su una singola GPU, mantenendo velocità di decodifica pratiche. Include server compat...

#Hardware #LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

Hugging Face: benchmark di modelli LLM guidati dalla comunità

Hugging Face introduce repository di benchmark per valutazioni di modelli LLM basate sulla comunità. L'iniziativa mira a risolvere le incongruenze nei risultati dei benchmark, consentendo agli utenti di contribuire con valutazioni e collegare diretta...

#LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

llama.cpp integra il supporto Kimi-Linear: prestazioni migliorate

La libreria llama.cpp ha integrato il supporto per Kimi-Linear, una tecnica che promette di migliorare le prestazioni dei modelli linguistici. L'integrazione è stata resa possibile grazie a una pull request su GitHub, aprendo nuove possibilità per l'...

#Hardware #LLM On-Premise #DevOps
2026-02-06 AI News

Scalabilità degli agenti AI: separare logica e ricerca

Un nuovo framework, ENCOMPASS, separa la logica di flusso di lavoro degli agenti AI dalle strategie di inference. Questo approccio, sviluppato da Asari AI, MIT CSAIL e Caltech, mira a ridurre il debito tecnico e migliorare le prestazioni, consentendo...

#LLM On-Premise #DevOps
2026-02-06 LocalLLaMA

Inference LLM: Ottimizzazione e prestazioni DeepSpeed

Un utente condivide un'immagine relativa all'ottimizzazione dell'inference di modelli linguistici di grandi dimensioni (LLM) tramite DeepSpeed. L'immagine suggerisce un'analisi delle prestazioni e delle configurazioni per migliorare la velocità e l'e...

#Hardware
2026-02-06 LocalLLaMA

Qwen3-235B: un utente ne esalta le prestazioni in locale

Un utente ha condiviso la sua esperienza positiva con il modello linguistico Qwen3-235B, eseguito su un sistema desktop. L'utente ha sottolineato l'accuratezza del modello e la sua utilità, al punto da preferirlo a un abbonamento commerciale a ChatGP...

#LLM On-Premise #DevOps
2026-02-05 LocalLLaMA

Gemma 4: Google continua lo sviluppo del modello linguistico?

La community di LocalLLaMA si interroga sul futuro di Gemma 4, chiedendosi se Google stia ancora investendo nello sviluppo del modello linguistico. Nonostante i progressi nel settore, il destino di Gemma 4 rimane incerto.

#LLM On-Premise #DevOps
2026-02-05 LocalLLaMA

Nuovi modelli OCR: LightOnOCR-2 e GLM-OCR migliorano l'accuratezza

Sono stati rilasciati LightOnOCR-2 e GLM-OCR, due nuovi modelli per il riconoscimento ottico dei caratteri (OCR). Un utente ha segnalato prestazioni superiori rispetto alle soluzioni disponibili a fine 2025, con GLM-OCR che offre velocità e output st...

2026-02-05 LocalLLaMA

gWorld: modello 8B batte Llama 4 da 402B generando codice web

Trillion Labs e KAIST AI hanno presentato gWorld, un modello di mondo visuale open-weight per interfacce grafiche mobile. gWorld, disponibile nelle versioni 8B e 32B, genera codice web eseguibile anziché pixel, superando in accuratezza modelli più gr...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-31 LocalLLaMA

Modelli open-source: una valutazione realistica

Una discussione su Reddit si interroga sullo stato attuale dei modelli linguistici open-source rispetto ai modelli proprietari più avanzati (SOTA). L'analisi, basata sull'esperienza pratica piuttosto che sui benchmark standard, offre una prospettiva ...

#LLM On-Premise #DevOps
2026-01-31 DigiTimes

Mercati di Taiwan in crescita: un ruolo globale più ampio

I mercati finanziari di Taiwan raggiungono nuovi picchi, segnalando un ruolo globale in espansione. Questo sviluppo sottolinea la crescente importanza dell'isola nell'economia mondiale e la sua capacità di attrarre investimenti internazionali. La sol...

#LLM On-Premise #DevOps
2026-01-30 TechCrunch AI

L'assistente AI OpenClaw crea un social network proprietario

L'assistente personale AI, precedentemente noto come Clawdbot e poi Moltbot, ha cambiato nome in OpenClaw. Ora, il progetto si evolve ulteriormente, puntando alla creazione di un social network autonomo, gestito interamente dall'intelligenza artifici...

#LLM On-Premise #DevOps
2026-01-30 LocalLLaMA

GPT-OSS: un modello open-source ancora competitivo?

Un utente di LLM locali si interroga sull'eccezionale performance di GPT-OSS 120B, un modello open-source datato ma ancora competitivo. Nonostante le nuove architetture e modelli, GPT-OSS eccelle per velocità, efficacia e tool calling. L'articolo esp...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-30 LocalLLaMA

LocalLLaMA: Stop allo spam di progetti incompleti

La community LocalLLaMA chiede una stretta sui post che promuovono progetti "Agentic" incompleti e di bassa qualità. L'eccessiva presenza di tali contenuti sta rendendo difficile individuare discussioni significative e progetti validi all'interno del...

2026-01-30 Ars Technica AI

Moltbook: gli agenti AI hanno un social network e diventa subito strano

Moltbook, un social network simile a Reddit per agenti AI, ha superato i 32.000 utenti registrati. La piattaforma, nata come estensione dell'assistente personale OpenClaw, permette agli agenti di pubblicare, commentare e creare comunità senza interve...

#LLM On-Premise #DevOps
2026-01-30 The Register AI

NYC Silenzia Chatbot AI: Troppi Errori e un Budget da Risanare

Il chatbot basato su AI implementato dalla città di New York per rispondere alle domande frequenti degli imprenditori è stato disattivato. La decisione è stata presa a causa delle frequenti risposte errate fornite dal sistema e della necessità di aff...

#LLM On-Premise #DevOps
2026-01-30 404 Media

Email imbarazzanti per Musk: feste sull'isola di Epstein?

Nuovi documenti del Dipartimento di Giustizia statunitense rivelano email tra Elon Musk e Jeffrey Epstein, risalenti al 2012-2013. Musk aveva negato un coinvolgimento con Epstein, ma le email mostrano discussioni su visite all'isola privata e richies...

2026-01-30 404 Media

ELITE: la guida all'app di Palantir usata da ICE

Rivelata la guida utente di ELITE, lo strumento di Palantir in uso presso l'Immigration and Customs Enforcement (ICE). L'applicazione permette di mappare potenziali obiettivi di espulsione e accedere a dossier individuali, con un punteggio di "confid...

2026-01-30 Ars Technica AI

AI per Sviluppatori: Efficace, Ma con Riserve

Gli strumenti di AI per la generazione di codice sono sempre più efficaci, tanto da poter sviluppare applicazioni complete partendo da semplici prompt testuali. Sviluppatori professionisti confermano l'utilità di soluzioni come Claude Code e Codex, m...

#LLM On-Premise #DevOps
2026-01-30 Phoronix

Ubuntu 26.04: disponibile la terza snapshot di test

È disponibile la terza snapshot di test di Ubuntu 26.04 Resolute, l'ultima release LTS prevista per aprile. Questa versione mensile offre agli sviluppatori e agli utenti un'anteprima delle nuove funzionalità e dei miglioramenti in arrivo, consentendo...

2026-01-30 The Register AI

L'IRS statunitense punta sull'AI per gestire le pratiche fiscali

L'agenzia delle entrate statunitense (IRS) prevede di automatizzare diverse attività, tra cui la revisione delle richieste di esenzione fiscale e l'elaborazione delle dichiarazioni dei redditi modificate, tramite l'impiego di sistemi di intelligenza ...

2026-01-30 TechCrunch AI

Anthropic estende i plugin agentici a Cowork

Anthropic ha integrato il suo sistema di plugin nella piattaforma agentica Cowork. Questa estensione permette agli agenti di Cowork di accedere e utilizzare le funzionalità offerte dai plugin di Anthropic, ampliando le loro capacità operative.

2026-01-30 Tom's Hardware

AMD Zen 6: cache L3 da 48MB per CCD a 12 core?

Indiscrezioni suggeriscono che AMD potrebbe incrementare la cache L3 dei processori Zen 6 a 48MB per compensare l'aumento dei core nei CCD. Questa mossa manterrebbe il rapporto cache-core invariato rispetto a Zen 5.

#Hardware #LLM On-Premise #DevOps
2026-01-30 404 Media

AI e giornalismo: una prospettiva dal Kenya

Un resoconto da una conferenza in Kenya sull'impatto dell'intelligenza artificiale sul giornalismo e sulla lotta alla disinformazione. L'evento ha riunito esperti da Africa, Europa e Asia per discutere le sfide e le opportunità del settore.

2026-01-30 404 Media

Moltbot: l'agente AI virale con gravi falle di sicurezza

Moltbot, un agente AI diventato popolare nella Silicio Valley, presenta vulnerabilità di sicurezza significative. Un hacker ha dimostrato come sia possibile sfruttare un backdoor nel suo sistema di supporto per accedere a dati sensibili degli utenti....

#LLM On-Premise #DevOps
2026-01-30 LocalLLaMA

Il design è guidato da modelli aperti: cambia il paradigma?

Un post su Reddit, proveniente dalla comunità LocalLLaMA, ipotizza un futuro (nel 2026) in cui i modelli open source dominano il campo del design. La discussione si concentra sull'impatto di questa tendenza e sulle sue implicazioni per il settore.

#LLM On-Premise #DevOps
2026-01-30 LocalLLaMA

Kimi-k2.5: performance paragonabili a Gemini 2.5 Pro in contesti ampi

Un utente su Reddit riporta che il modello Kimi-k2.5 raggiunge prestazioni simili a Gemini 2.5 Pro nella gestione di contesti di grandi dimensioni. La discussione si concentra sulle implicazioni di tale risultato per i modelli LLM open source.

#LLM On-Premise #DevOps
2026-01-30 The Register AI

Oracle punta a riconciliarsi con gli sviluppatori MySQL

Oracle intraprende azioni per "riparare" il rapporto con la community MySQL, spostando funzionalità "solo commerciali" nella Community Edition e dando priorità alle esigenze degli sviluppatori. Un cambio di rotta significativo per Big Red.

2026-01-30 The Register AI

Auto a guida autonoma ingannate da scritte su cartelli stradali

Sistemi di visione basati su intelligenza artificiale possono interpretare istruzioni malevole scritte su cartelli stradali, inducendo auto a guida autonoma e droni a comportamenti errati. Ricercatori hanno dimostrato come attacchi di prompt injectio...

2026-01-30 Tech.eu

Einride prevede più IPO SPAC per startup europee

Il CEO della startup svedese di autocarri autonomi Einride prevede che altre aziende europee seguiranno il suo esempio, quotandosi in borsa tramite SPAC (Special Purpose Acquisition Company). L'azienda si quoterà al New York Stock Exchange con una va...

2026-01-30 The Register AI

Sovranità digitale: investimento in infrastrutture AI pari all'1% del PIL

Secondo Gartner, i paesi che puntano alla sovranità digitale dovranno investire almeno l'1% del loro prodotto interno lordo (PIL) in infrastrutture di intelligenza artificiale entro il 2029. Un investimento massiccio per garantire il controllo sui pr...

#LLM On-Premise #DevOps
2026-01-30 TechWire Asia

AI Ombra: Rischi per le Aziende Asiatiche e Sovranità dei Dati

Un report di Reco rivela che il 91% degli strumenti di AI opera al di fuori del controllo IT aziendale, creando rischi per la sovranità dei dati, specialmente in Asia, con normative sulla privacy frammentate. La mancata governance dell'AI potrebbe co...

2026-01-30 The Register AI

OpenAI dismette alcuni modelli ChatGPT: preavviso di due settimane

OpenAI ha annunciato la dismissione di alcuni modelli ChatGPT il mese prossimo. La decisione, sebbene possa generare frustrazione in alcuni utenti, rientra nella normale evoluzione dei servizi basati sull'intelligenza artificiale. L'azienda non ha sp...

#LLM On-Premise #DevOps
2026-01-30 Tech.eu

Mos Health raccoglie 1,1 milioni $ per salute personalizzata con IA

La startup polacco-americana Mos Health, specializzata in una piattaforma sanitaria basata sull'intelligenza artificiale per protocolli e integratori personalizzati, ha ottenuto 1,1 milioni di dollari in un round pre-seed. L'azienda mira a colmare il...

2026-01-30 Tech.eu

UE investe 10 milioni per l'integrazione digitale dell'Ucraina

L'Unione Europea stanzia 10 milioni di euro per supportare lo sviluppo dei servizi pubblici digitali in Ucraina e il loro allineamento agli standard europei. L'iniziativa mira a favorire l'accesso dell'Ucraina al mercato unico europeo e a migliorare ...

2026-01-30 Tech.eu

Spotify apre una sede in Turchia dopo le tensioni con il governo

Spotify ha annunciato l'apertura di una sede a Istanbul entro la fine di giugno, sottolineando l'importanza strategica del mercato turco. La decisione segue un periodo di tensioni con il governo turco, che aveva criticato la piattaforma per contenuti...

2026-01-30 Phoronix

Driver Intel Xe: disabilitato GuC Power DCC per Panther Lake

Aggiornamenti nel driver open-source Intel Xe per Linux, in preparazione al kernel 7.0. Tra le novità, la disabilitazione di GuC Power DCC per Panther Lake e miglioramenti nel reporting dei sensori di temperatura della GPU.

#Hardware
2026-01-30 Phoronix

Intel LLM-Scaler-vLLM 1.3: supporto esteso per modelli LLM

Intel ha rilasciato la versione 1.3 di LLM-Scaler-vLLM, ampliando il supporto per un numero maggiore di modelli linguistici di grandi dimensioni (LLM). Questa nuova versione è progettata per funzionare su schede grafiche Intel Arc Battlemage tramite ...

#Hardware #LLM On-Premise #DevOps
2026-01-30 DigiTimes

KLA prevede crescita domanda di apparecchiature per semiconduttori AI

Secondo KLA, la crescente adozione di sistemi di controllo dei processi basati su intelligenza artificiale incrementerà la domanda di apparecchiature per la produzione di semiconduttori entro il 2026. Questo trend è guidato dalla necessità di miglior...

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

ASML beneficia della domanda EUV e investimenti USA nei chip

Il produttore di macchinari per semiconduttori ASML sta beneficiando della crescente domanda di litografia EUV (Extreme Ultraviolet) e degli investimenti statunitensi nel settore dei chip. La società olandese è un fornitore chiave per i produttori di...

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

Cina: via libera all'acquisto di chip Nvidia H200 da parte di DeepSeek

DeepSeek ottiene l'approvazione per l'acquisto di chip Nvidia H200 in Cina. Restano da definire le condizioni specifiche dell'accordo. La notizia evidenzia la continua domanda di hardware avanzato per l'AI nel mercato cinese, nonostante le restrizion...

#Hardware #LLM On-Premise #Fine-Tuning
2026-01-30 TechWire Asia

Zebra Technologies: l'automazione oltre i progetti pilota

Zebra Technologies evidenzia come l'automazione spesso si blocchi dopo la fase pilota. I clienti cercano partner che comprendano a fondo le loro operazioni reali e sappiano integrare hardware, software e AI per risolvere problemi aziendali specifici,...

#Hardware
2026-01-30 DigiTimes

Dazi USA-Corea: Hyundai e Kia tra i costruttori più colpiti

Il gruppo Hyundai Motor, che include i marchi Hyundai e Kia, è tra i costruttori automobilistici più esposti ai dazi commerciali tra Corea del Sud e Stati Uniti. La notizia evidenzia le implicazioni delle politiche commerciali internazionali sul sett...

2026-01-30 DigiTimes

Arbor (supportata da MediaTek e Arm) punta sulla crescita con l'AI

Arbor, sostenuta da MediaTek e Arm, sta implementando una strategia di crescita basata sull'intelligenza artificiale. L'azienda mira a capitalizzare le opportunità offerte dall'AI per espandere il proprio business in diversi settori. L'articolo origi...

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

Taiwan e USA: cooperazione per una supply chain alternativa alla Cina

Taiwan si impegna a una piena cooperazione con gli Stati Uniti per la creazione di una nuova supply chain che non dipenda dalla Cina. L'iniziativa mira a diversificare le fonti di approvvigionamento e a rafforzare la resilienza economica.

#Hardware #LLM On-Premise #DevOps
2026-01-30 DigiTimes

Nvidia H200: via libera dalla Cina, competizione USA-Cina si intensifica

La GPU Nvidia H200 ottiene l'approvazione di Pechino, segnando un nuovo capitolo nella competizione tecnicica tra Stati Uniti e Cina. Questa mossa strategica potrebbe avere implicazioni significative per il mercato dei chip e le dinamiche geopolitich...

#Hardware #LLM On-Premise #DevOps
2026-01-30 DigiTimes

Alibaba e Baidu verso l'IPO per le divisioni chip AI

Alibaba e Baidu stanno valutando offerte pubbliche iniziali (IPO) per le rispettive divisioni specializzate in chip per l'intelligenza artificiale. Questa mossa potrebbe riflettere una crescente enfasi sull'autosufficienza tecnicica nel settore AI.

#LLM On-Premise #DevOps
2026-01-30 ArXiv cs.CL

DeepSearchQA: un benchmark per agenti di ricerca avanzati

DeepSearchQA è un nuovo benchmark con 900 task per valutare agenti di ricerca in 17 ambiti diversi. A differenza dei benchmark tradizionali, si concentra sulla capacità di collazionare informazioni frammentate, eliminare duplicati e ragionare sui cri...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-30 ArXiv cs.LG

Pre-training multimodale: focus sul fine-tuning per performance superiori

Un nuovo approccio al pre-training multimodale, denominato Finetune-Informed Pretraining (FIP), ottimizza le rappresentazioni concentrandosi sulla modalità di dati più rilevante durante il fine-tuning. Questo metodo migliora le performance senza rich...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-30 ArXiv cs.LG

LLM e ottimizzazione combinatoria: un nuovo approccio DASH

Un nuovo framework, Dynamics-Aware Solver Heuristics (DASH), sfrutta i modelli linguistici di grandi dimensioni (LLM) per migliorare l'efficienza e la qualità delle soluzioni nei problemi di ottimizzazione combinatoria. DASH riduce i costi di adattam...

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

ASML riduce il personale in Europa e USA, proteggendo la Cina

Il produttore di macchinari per semiconduttori ASML sta ridimensionando la sua forza lavoro in Europa e negli Stati Uniti. La decisione non sembra impattare le operazioni in Cina, sollevando interrogativi sulle strategie di mercato dell'azienda.

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

Corea del Sud: memorie NAND flash cruciali per l'AI di nuova generazione

Le memorie NAND flash sudcoreane assumono un ruolo strategico nell'infrastruttura AI di prossima generazione. Questa evoluzione sottolinea l'importanza crescente della Corea del Sud nel panorama tecnicico globale, in particolare nel settore dell'inte...

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

Apple acquisisce la startup audio israeliana Q.ai

Apple ha finalizzato l'acquisizione di Q.ai, una startup israeliana specializzata in tecnicie audio. I dettagli finanziari dell'operazione non sono stati resi pubblici.

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

Prezzi delle memorie in aumento per la domanda AI

L'aumento della domanda di applicazioni di intelligenza artificiale sta causando una contrazione nell'offerta di memorie DRAM e NAND, portando a un incremento dei prezzi. Il rallentamento degli acquisti spot a fine anno potrebbe mitigare temporaneame...

#LLM On-Premise #DevOps
2026-01-30 LocalLLaMA

Eseguire Claude Code in locale con OpenCode, llama.cpp e GLM-4.7 Flash

Un utente di Reddit ha condiviso la propria esperienza nell'eseguire Claude Code in locale utilizzando OpenCode, llama.cpp e il modello GLM-4.7 Flash. La configurazione, pensata per replicare un workflow simile a quello di Claude, sfrutta CUDA e otti...

#Hardware #LLM On-Premise
2026-01-30 LocalLLaMA

Mini-cluster con 192GB di VRAM per carichi di lavoro AI locali

Un utente ha realizzato un cluster di calcolo locale basato su quattro workstation Lenovo P620, ciascuna equipaggiata con due GPU NVIDIA RTX 3090, per un totale di 192GB di VRAM. La configurazione, interconnessa tramite rete a 10Gbit (in attesa di up...

#Hardware #LLM On-Premise #DevOps
2026-01-30 DigiTimes

Boom dei data center AI a Taiwan: pressione sulla rete elettrica

I profitti record di Taipower nascondono le crescenti difficoltà nel soddisfare la domanda energetica dei data center AI a Taiwan. L'isola, hub tecnicico cruciale, affronta sfide significative per sostenere la crescita del settore AI.

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

Greatek satura la capacità produttiva per packaging AI

Il produttore Greatek ha raggiunto la piena capacità produttiva per soluzioni di packaging avanzato, in particolare flip chip e QFN, a causa della forte domanda nel settore dell'intelligenza artificiale. La società prevede di espandere ulteriormente ...

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

JPP automatizza la produzione con robotica e AI di Techman Robot

JPP integra soluzioni di robotica di Techman Robot per automatizzare i processi produttivi, portando l'intelligenza artificiale direttamente negli ambienti di fabbrica. Questa collaborazione mira a migliorare l'efficienza e ridurre i costi operativi ...

#LLM On-Premise #DevOps
2026-01-30 DigiTimes

Huawei espande l'ecosistema cloud in Asia-Pacifico; Volcengine cresce nell'AI

Huawei sta ampliando il suo ecosistema cloud nella regione Asia-Pacifico, mentre Volcengine registra una forte crescita nel settore del cloud per l'intelligenza artificiale. Questa espansione sottolinea la crescente domanda di risorse cloud per suppo...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-29 TechCrunch AI

Apple e l'AI: un analista interroga Tim Cook sulla monetizzazione

Un analista di Morgan Stanley ha chiesto a Tim Cook come Apple intenda monetizzare i suoi investimenti nell'intelligenza artificiale. La risposta, secondo quanto riportato, non ha sorpreso gli osservatori del settore. L'articolo analizza le implicazi...

#LLM On-Premise #DevOps
2026-01-29 ServeTheHome

Dell Pro Max e GB10: ROI in 12 mesi con carichi di lavoro reali

Un'analisi sull'utilizzo della workstation Dell Pro Max equipaggiata con GPU GB10 per risolvere task di reporting complessi. L'articolo originale riporta un'esperienza pratica che ha portato a un ritorno sull'investimento (ROI) entro un periodo di 12...

#Hardware #LLM On-Premise #DevOps
2026-01-29 OpenAI Blog

Taisei Corporation punta su ChatGPT per la formazione del personale

Taisei Corporation implementa ChatGPT Enterprise per supportare lo sviluppo del personale guidato dalle risorse umane e scalare l'intelligenza artificiale generativa nel suo business globale di costruzioni. L'iniziativa mira a migliorare le competenz...

2026-01-29 TechCrunch AI

SpaceX, Tesla e xAI verso una possibile fusione sotto un'unica holding

Secondo alcune indiscrezioni, Elon Musk starebbe valutando la fusione di SpaceX, Tesla e xAI in un'unica entità. L'operazione integrerebbe lo chatbot Grok, i satelliti Starlink e i razzi di SpaceX sotto un'unica корпорация.

#LLM On-Premise #DevOps
2026-01-29 Ars Technica AI

Chatbot AI: quanto spesso inducono gli utenti su strade pericolose?

Un recente studio di Anthropic ha analizzato 1,5 milioni di conversazioni anonimizzate con il modello Claude, quantificando la frequenza con cui i chatbot AI possono portare gli utenti a intraprendere azioni dannose o sviluppare convinzioni pericolos...

#LLM On-Premise #DevOps
2026-01-29 IEEE Spectrum

Benchmark per agenti AI: pronti per l'automazione aziendale?

Ricercatori di Carnegie Mellon e Fujitsu hanno sviluppato benchmark per valutare la sicurezza e l'efficacia degli agenti AI in contesti aziendali. I test, focalizzati su logistica, produzione e gestione della conoscenza, rivelano limiti significativi...

#LLM On-Premise #DevOps #RAG
2026-01-29 LocalLLaMA

LingBot-World: simulazione dinamica open source batte Genie 3

Il framework LingBot-World offre un modello del mondo ad alte prestazioni completamente open source, in contrasto con sistemi proprietari come Genie 3. Supera Genie 3 nella gestione di fisica complessa e transizioni di scena, mantenendo 16 frame al s...

2026-01-29 OpenAI Blog

ChatGPT: OpenAI dismetterà GPT-4o e modelli correlati nel 2026

OpenAI ha annunciato che il 13 febbraio 2026 dismetterà da ChatGPT i modelli GPT-4o, GPT-4.1, GPT-4.1 mini e OpenAI o4-mini. La decisione non impatta al momento le API. Questo annuncio segue la precedente comunicazione relativa alla dismissione di GP...

2026-01-29 LocalLLaMA

Modelli "distillati": perché non ce ne sono di più?

La comparsa di modelli "distillati" come Qwen 8B DeepSeek R1 ha dimostrato capacità di ragionamento superiori rispetto alle dimensioni. L'articolo si chiede perché non ci siano più modelli di questo tipo, capaci di operare su hardware con risorse lim...

#Hardware #LLM On-Premise #DevOps
2026-01-29 TechCrunch AI

Microsoft difende l'adozione di Copilot: 'Utilizzo elevato'

Satya Nadella, CEO di Microsoft, ha risposto alle voci di scarso utilizzo della sua AI Copilot, sottolineando l'importanza degli investimenti nei data center per supportare la piattaforma. L'azienda punta a dimostrare la validità del suo approccio ne...

#LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

Mistral: accesso all'intelligenza artificiale come all'elettricità

Arthur Mensch, CEO di Mistral, paragona l'accesso all'intelligenza artificiale all'accesso all'elettricità, sottolineando l'importanza di un accesso ininterrotto e non limitato a questa risorsa cruciale. La dichiarazione evidenzia la visione di Mistr...

#LLM On-Premise #DevOps
2026-01-29 MIT Technology Review

Il DHS usa AI di Google e Adobe per creare video

Il Dipartimento per la Sicurezza Interna degli Stati Uniti (DHS) utilizza generatori video AI di Google (Veo 3) e Adobe (Firefly) per la creazione e l'editing di contenuti destinati al pubblico. La scoperta emerge da un documento che inventaria gli s...

#LLM On-Premise #DevOps
2026-01-29 Wired AI

Video AI contro l'Immigrazione: tra catarsi e disinformazione

Video generati tramite intelligenza artificiale, che mostrano persone di colore che "mettono a posto" agenti dell'Immigration and Customs Enforcement (ICE), si diffondono su piattaforme come Instagram e Facebook. Questi contenuti sollevano interrogat...

2026-01-29 Wired AI

Logical Intelligence sfida le big tech con un nuovo approccio all'AGI

Mentre le grandi aziende investono miliardi in modelli linguistici di grandi dimensioni, la startup Logical Intelligence con sede a San Francisco persegue un approccio diverso per raggiungere l'AGI, mirando a emulare il cervello umano. La società si ...

#LLM On-Premise #DevOps
2026-01-29 TechCrunch AI

Apple acquisisce la startup israeliana Q.AI per 2 miliardi di dollari

Apple ha annunciato l'acquisizione di Q.AI, una startup israeliana specializzata in intelligenza artificiale, per una cifra vicina ai 2 miliardi di dollari. Questa operazione rappresenta la seconda acquisizione più grande nella storia di Apple, segna...

2026-01-29 The Register AI

Dow Chemical taglia 4.500 posti di lavoro a causa dell'AI

Dow Chemical, azienda chimica con 129 anni di storia, prevede di tagliare 4.500 posti di lavoro, pari al 12,5% della sua forza lavoro, a causa dell'automazione basata sull'intelligenza artificiale. L'azienda utilizza software AI di C3, concorrente di...

#LLM On-Premise #DevOps
2026-01-29 Ars Technica AI

OpenAI Prism: strumento AI per la scienza suscita timori su qualità

OpenAI ha rilasciato Prism, un ambiente di lavoro gratuito basato su AI per gli scienziati. Questo strumento, integrato con GPT-5.2, mira a facilitare la stesura di articoli scientifici e la collaborazione. Tuttavia, alcuni ricercatori temono che Pri...

#LLM On-Premise #DevOps
2026-01-29 TechCrunch AI

Google presenta Project Genie per la generazione di mondi AI

Google ha annunciato Project Genie, un nuovo strumento per la generazione di mondi virtuali basato su modelli AI avanzati come Genie 3, Nano Banana Pro e Gemini. Disponibile inizialmente per gli abbonati AI Ultra negli Stati Uniti, offre nuove possib...

#LLM On-Premise #DevOps
2026-01-29 Phoronix

Libcamera 0.7: accelerazione GPU per ISP su Linux, performance migliorata

È stata rilasciata la versione 0.7 di Libcamera, libreria software per image signal processor (ISP) e fotocamere embedded su Linux. La novità principale è l'accelerazione GPU per il software ISP (SoftISP), che promette performance superiori rispetto ...

#Hardware #LLM On-Premise #DevOps
2026-01-29 TechCrunch AI

Sora di OpenAI: rallentamento dopo un lancio stellare

L'app mobile Sora di OpenAI sta affrontando un calo di interesse dopo il suo lancio iniziale. I download sono diminuiti del 45% a gennaio, con una conseguente riduzione della spesa da parte degli utenti. Questo solleva interrogativi sulla sostenibili...

2026-01-29 The Register AI

Lennart Poettering lascia Microsoft per concentrarsi su Linux sicuro

Lennart Poettering, figura di spicco nel mondo Linux, ha lasciato Microsoft per co-fondare Amutable. L'obiettivo è sviluppare un sistema operativo Linux con integrità crittograficamente verificabile, puntando a una maggiore sicurezza e affidabilità.

#LLM On-Premise #DevOps
2026-01-29 The Register AI

IBM punta sull'AI nel mainframe z17 per modernizzare COBOL

IBM sta integrando capacità di intelligenza artificiale nei suoi mainframe z17, con l'obiettivo di modernizzare le applicazioni COBOL esistenti e ridurre i costi operativi. L'azienda vede un futuro in cui l'AI colma il divario di competenze lasciato ...

#LLM On-Premise #DevOps
2026-01-29 TechCrunch AI

L'India guida Google nell'adozione su larga scala dell'IA nell'istruzione

L'India si sta rivelando un mercato cruciale per Google, influenzando significativamente l'approccio dell'azienda all'integrazione dell'intelligenza artificiale nel settore dell'istruzione, grazie all'elevato utilizzo di Gemini per l'apprendimento.

#LLM On-Premise #DevOps
2026-01-29 Ars Technica AI

Anthropic umanizza Claude: strategia o convinzione?

Anthropic adotta un approccio singolare nello sviluppo del suo assistente AI Claude, trattandolo quasi fosse un essere senziente. L'azienda ha pubblicato la "Costituzione di Claude", un documento che delinea le linee guida comportamentali dell'AI, ca...

#LLM On-Premise #DevOps
2026-01-29 TechCrunch AI

Nuovo laboratorio AI: Flapping Airplanes punta sulla ricerca

È stato inaugurato un nuovo laboratorio di intelligenza artificiale chiamato Flapping Airplanes. Un partner di Sequoia Capital ha espresso il suo punto di vista su ciò che rende questo laboratorio unico nel suo genere, sottolineando l'importanza di u...

#LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

Qwen3-ASR: modelli open source per riconoscimento vocale multilingue

La famiglia Qwen3-ASR include modelli da 1.7B e 0.6B parametri, capaci di identificare la lingua e trascrivere l'audio in 52 lingue e dialetti. Il modello più grande raggiunge performance paragonabili a quelle di API commerciali proprietarie, offrend...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-29 Phoronix

Libgcrypt 1.12: crittografia AES accelerata su AMD Zen 5

È disponibile la versione 1.12 di Libgcrypt, la libreria di basso livello usata da GnuPG e altri software per la crittografia. Questa release introduce ottimizzazioni per le CPU AMD Zen 5 tramite VAES e AVX-512, promettendo un incremento di performan...

#Hardware #LLM On-Premise #DevOps
2026-01-29 The Register AI

Oracle: tagli al personale e cessione di Cerner per finanziare l'AI?

Secondo un analista finanziario, Oracle potrebbe tagliare fino a 30.000 posti di lavoro e vendere la divisione Cerner per finanziare i costosi data center necessari all'espansione nel settore dell'intelligenza artificiale. La notizia giunge in un mom...

#LLM On-Premise #DevOps
2026-01-29 The Register AI

Meta investe 135 miliardi di dollari in infrastrutture AI entro il 2026

Meta prevede di raddoppiare i propri investimenti in infrastrutture per l'intelligenza artificiale, superando il PIL di alcune nazioni. L'azienda punta a una "superintelligenza personale", alimentando la crescente domanda di data center AI.

#LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

Mini-LLM: un modello Llama 3 da 80 milioni di parametri

Un tecnico ha sviluppato Mini-LLM, un modello linguistico di transformer con 80 milioni di parametri, partendo da zero e basato sull'architettura di Llama 3. Il progetto include tokenizzazione, caricamento dati in memoria, training in precisione mist...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-29 The Next Web

AI e lavoro: verso una ridefinizione dei ruoli, non una sostituzione

L'adozione dell'intelligenza artificiale sta polarizzando i lavoratori: alcuni la vedono come strumento di potenziamento, altri come minaccia. L'AI non elimina i ruoli, ma trasforma le attività a basso valore aggiunto. IBM ha dichiarato che 7.000 pos...

#LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

Proliferazione di framework agent AI su GitHub: bolla in arrivo?

Un post su Reddit riguardante i trend di GitHub mette in luce una rapida crescita dei framework per agenti AI. La discussione solleva dubbi sulla sostenibilità a lungo termine di molti di questi progetti, paragonando la situazione all'eccessiva framm...

#LLM On-Premise #DevOps
2026-01-29 Tom's Hardware

ASML prevede ricavi per 71 miliardi $ entro il 2030 grazie all'AI

Il produttore di macchinari per la litografia ASML prevede una crescita significativa dei ricavi, raggiungendo i 71 miliardi di dollari entro il 2030. La domanda di sistemi EUV (Extreme Ultraviolet) è in forte aumento, spinta principalmente dall'espa...

#Fine-Tuning
2026-01-29 The Next Web

La conferenza di punta di TNW si sposta a Londra

The Next Web (TNW) trasferisce la sua conferenza principale a Londra, ponendo l'evento annuale al centro di uno dei più importanti ecosistemi tecnicici e di investimento a livello mondiale. TNW introduce anche un nuovo format di evento globale su inv...

2026-01-29 The Register AI

Vivaldi contrasta l'integrazione forzata dell'AI nei browser

L'ultima versione del browser Vivaldi si distingue per una posizione netta contro l'integrazione pervasiva dell'intelligenza artificiale, in risposta a un sentimento diffuso tra gli utenti che percepiscono negativamente l'aggiunta di funzionalità AI ...

2026-01-29 Tom's Hardware

Falla WinRAR: ancora usata da attori statali russi e cinesi

Un exploit in WinRAR, corretto sei mesi fa, rimane un vettore di attacco popolare, specialmente per attori statali. La vulnerabilità consente l'installazione di malware in cartelle critiche di Windows tramite archivi malevoli.

#LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

OpenMOSS presenta MOVA: modello open-source per video e audio

OpenMOSS ha rilasciato MOVA (MOSS-Video-and-Audio), un modello completamente open-source con 18 miliardi di parametri attivi (architettura MoE, 32 miliardi totali). MOVA offre supporto immediato per SGLang-Diffusion e punta alla generazione scalabile...

2026-01-29 Tom's Hardware

Nvidia H200: la Cina frena le importazioni, ordini bloccati

Jensen Huang conferma che Pechino non ha ancora approvato l'importazione delle GPU H200. Di conseguenza, Nvidia non ha ricevuto nuovi ordini da aziende cinesi. La situazione solleva interrogativi sulla catena di approvvigionamento e sulle strategie d...

#Hardware #LLM On-Premise #DevOps
2026-01-29 Phoronix

Valve ottimizza le APU AMD su Linux: VRR, audio DP/HDMI e HDR

Timur Kristóf, parte del team graphics Linux di Valve, ha risolto problematiche nel driver open-source AMDGPU. Questo permette alle GPU AMD GCN 1.0 e 1.1 di usare AMDGPU invece del driver Radeon. I nuovi aggiornamenti superano le limitazioni delle AP...

#Hardware
2026-01-29 Tom's Hardware

OpenSSL: scoperte vulnerabilità decennali grazie all'AI

Ricercatori nel campo della sicurezza informatica, supportati dall'intelligenza artificiale, hanno individuato 12 vulnerabilità in OpenSSL, uno standard di sicurezza fondamentale per gran parte di internet. Alcune di queste falle di sicurezza risalgo...

#LLM On-Premise #DevOps
2026-01-29 The Next Web

Visibilità nell'era dell'AI: strategie per i brand

I modelli linguistici di grandi dimensioni (LLM) stanno cambiando il modo in cui le persone accedono alle informazioni online. L'articolo esplora come i brand possono adattare le loro strategie di visibilità in un mondo in cui gli utenti ottengono ri...

#LLM On-Premise #DevOps
2026-01-29 Tom's Hardware

Los Angeles verso il bando delle cartucce usa e getta

La città di Los Angeles punta a ridurre gli sprechi vietando le cartucce per stampanti non riciclabili o prive di un programma di ritiro da parte del produttore. La nuova ordinanza è in attesa di approvazione definitiva da parte del consiglio comunal...

2026-01-29 Phoronix

NVIDIA rilascia il driver VA-API 0.0.15 con correzioni

È stata rilasciata la versione 0.0.15 del driver NVIDIA-VAAPI. Questo driver VA-API, basato sull'interfaccia NVDEC di NVIDIA, abilita l'accelerazione video per le GPU NVIDIA con il browser Firefox su Linux, supportando VA-API ma non NVDEC di NVIDIA.

#Hardware #LLM On-Premise #DevOps
2026-01-29 DigiTimes

Micron punta alla leadership nell'era della memoria per l'AI

Durante la visita del CEO di Nvidia a Taiwan, la presidente taiwanese ha posizionato Micron come leader nel settore delle memorie per applicazioni di intelligenza artificiale. L'iniziativa sottolinea l'importanza strategica della produzione di memori...

#Hardware #LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

Voicebox: Studio di Clonazione Vocale Open Source e Locale

Voicebox è un nuovo progetto open source che permette la clonazione vocale locale tramite Qwen3-TTS e Whisper. L'applicazione desktop, sviluppata con Tauri/Rust/Python, offre funzionalità di editing multi-traccia, registrazione audio e trascrizione, ...

#LLM On-Premise #DevOps
2026-01-29 TechWire Asia

Startup asiatiche sbarcano in Europa: la nuova strategia tech

Le startup asiatiche stanno adottando un approccio innovativo per l'espansione in Europa, sfruttando infrastrutture cloud, team remoti e uffici virtuali. Questa strategia consente loro di stabilire una presenza operativa senza i costi elevati di una ...

#LLM On-Premise #DevOps
2026-01-29 TechWire Asia

Vertiv: infrastruttura prefabbricata per data center AI

Vertiv lancia SmartRun, un sistema prefabbricato per data center AI che integra alimentazione, raffreddamento a liquido e rete. L'obiettivo è accelerare i tempi di realizzazione e ridurre la complessità, rispondendo alla crescente domanda di potenza ...

#LLM On-Premise #DevOps
2026-01-29 The Register AI

Anthropic collabora con il governo UK per un chatbot di ricerca lavoro

Il governo britannico collaborerà con Anthropic per sviluppare un assistente basato su intelligenza artificiale per chi cerca lavoro. L'iniziativa contrasta con le previsioni del CEO di Anthropic, che ha espresso preoccupazioni sull'impatto dell'AI s...

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

Samsung riconquista la leadership nelle vendite di memorie

Samsung ha superato SK Hynix nelle vendite di memorie, riprendendo la posizione di leader del mercato. Nonostante ciò, SK Hynix continua a mantenere un vantaggio in termini di profitti. La competizione nel settore delle memorie rimane intensa, con im...

#Hardware #LLM On-Premise #Fine-Tuning
2026-01-29 LocalLLaMA

LLM genera incantesimi procedurali per prototipo VR

Un sviluppatore ha creato un sistema in cui un LLM genera incantesimi procedurali per un prototipo di realtà virtuale. Il sistema utilizza un pool di componenti di incantesimi e converte le parole in istruzioni per creare effetti unici. La colonna so...

2026-01-29 DigiTimes

Taiwan e USA intensificano la cooperazione su AI e droni

Taiwan e Stati Uniti ampliano la collaborazione nel settore dell'intelligenza artificiale e dei droni attraverso l'iniziativa Pax Silica. Questa partnership mira a rafforzare le capacità tecniciche di entrambi i paesi in settori strategici.

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

Nvidia precisa: capacità chip di Taiwan è nuova, non spostata dagli USA

Jensen Huang di Nvidia ha chiarito che il 40% della capacità di produzione di chip a Taiwan rappresenta un aumento della capacità complessiva, e non uno spostamento di risorse produttive dagli Stati Uniti. La precisazione arriva in un momento di fort...

#Hardware #LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

Devstral 2: ragionamento logico ibrido potenziato con Jinja

Un utente ha scoperto che i modelli Devstral 2 123B e 24B possono essere forzati a un ragionamento logico più coerente tramite l'uso di template Jinja. L'aggiunta di una specifica istruzione Jinja sembra migliorare significativamente la capacità di r...

#Hardware #LLM On-Premise #DevOps
2026-01-29 DigiTimes

DeepSeek: l'approccio cinese all'AI senza chip all'avanguardia

Un'analisi approfondita rivela come DeepSeek stia costruendo capacità di intelligenza artificiale in Cina, affrontando le sfide imposte dalla limitata disponibilità di chip di ultima generazione. L'articolo esplora le strategie adottate per superare ...

#Hardware #LLM On-Premise #DevOps
2026-01-29 DigiTimes

La domanda di AI si fa sentire: ASML prevede utili in crescita

I risultati finanziari di ASML, leader nella produzione di macchinari per la litografia, indicano una forte crescita della domanda legata all'intelligenza artificiale. L'azienda prevede un aumento degli utili, segno che la produzione di chip avanzati...

#Hardware #LLM On-Premise #DevOps
2026-01-29 DigiTimes

Alibaba sfida Nvidia con un nuovo chip AI di classe A100

T-Head Semiconductor di Alibaba ha sviluppato un nuovo chip AI che punta a competere con le prestazioni delle GPU Nvidia A800 e A100. Questa mossa potrebbe intensificare la competizione nel mercato dell'hardware per l'intelligenza artificiale, offren...

#Hardware #LLM On-Premise #DevOps
2026-01-29 DigiTimes

Samsung: profitti in crescita grazie alla domanda di memorie per AI

Samsung registra un aumento dei profitti, trainato dalla forte domanda di memorie ad alte prestazioni per applicazioni di intelligenza artificiale. La crescita nel settore memorie compensa le difficoltà incontrate nei mercati degli smartphone e dei d...

#LLM On-Premise #DevOps
2026-01-29 Tech.eu

Daphni Blue: round finale da 260 milioni per investimenti scientifici

La società di venture capital francese Daphni ha chiuso il suo fondo Blue a 260 milioni di euro, superando l'obiettivo iniziale. Il fondo si concentrerà su progetti deeptech derivanti dalla ricerca scientifica europea, con un focus su AI e tecnicie d...

#LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

Prismer: ambiente open-source multi-agente per la ricerca

È stato rilasciato Prismer, un ambiente open-source progettato per semplificare i flussi di lavoro accademici. L'obiettivo è fornire un'alternativa personalizzabile e attenta alla privacy rispetto alle soluzioni proprietarie, riducendo le allucinazio...

#LLM On-Premise #DevOps
2026-01-29 Tech.eu

Twogee Biotech raccoglie 2,2 milioni € per la biomassa circolare

La startup tedesca Twogee Biotech, specializzata in soluzioni enzimatiche per la conversione industriale di biomassa in materie prime sostenibili, ha chiuso un round di finanziamento seed da 2,2 milioni di euro. L'azienda utilizzerà i fondi per svilu...

2026-01-29 ArXiv cs.CL

Interazioni complesse LLM: simulazione senza memoria di stato

Un nuovo metodo, DiGiT-TC, genera dati sintetici per addestrare modelli linguistici di dimensioni ridotte a gestire interazioni complesse di tool calling, anche in ambienti senza memoria di stato. La tecnica rappresenta implicitamente le chiamate agl...

2026-01-29 ArXiv cs.CL

LLM e lingua coreana: addestramento umano batte l'automazione?

Un nuovo studio dimostra che, con un training adeguato, esperti umani possono superare i sistemi automatizzati nell'identificare testi in coreano generati da LLM. L'approccio si basa su una rubrica dettagliata che analizza le peculiarità della lingua...

#LLM On-Premise #DevOps
2026-01-29 ArXiv cs.LG

Gap-K%: Nuovo metodo per rilevare dati di pre-training negli LLM

Un nuovo studio introduce Gap-K%, una tecnica innovativa per identificare i dati utilizzati nel pre-training dei modelli linguistici di grandi dimensioni (LLM). Il metodo analizza le discrepanze tra la previsione top-1 del modello e il token target, ...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-29 ArXiv cs.AI

NeuroAI: Convergenza tra neuroscienze e intelligenza artificiale

Un workshop del 2025 esplora le sinergie tra neuroscienze e intelligenza artificiale, identificando aree promettenti come embodiment, linguaggio, robotica, apprendimento e ingegneria neuromorfica. L'obiettivo è sviluppare una NeuroAI che migliori gli...

#Hardware
2026-01-29 DigiTimes

Boom dell'IA: allarme per la fornitura di chip, rischio per le auto

L'aumento esponenziale dell'intelligenza artificiale genera preoccupazioni sulla disponibilità globale di chip. Il settore automobilistico potrebbe essere particolarmente vulnerabile a causa della forte domanda di semiconduttori per l'IA.

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

Meta punta sugli occhiali AI: la nuova era del computing indossabile?

Meta intensifica lo sviluppo di occhiali con intelligenza artificiale, scommettendo sui dispositivi indossabili come prossima piattaforma di riferimento per i consumatori. L'azienda vede un futuro in cui l'AI sarà integrata in modo sempre più pervasi...

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

Meta: AI, abbonamenti e commercio per la monetizzazione futura

Meta esplora nuove strategie di monetizzazione dell'intelligenza artificiale, andando oltre la pubblicità. L'azienda punta su abbonamenti e iniziative commerciali per diversificare le proprie fonti di reddito, sfruttando le potenzialità offerte dai n...

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

SK Hynix consolida i clienti con memorie AI dedicate

Secondo AFP, SK Hynix sta rafforzando i legami con i clienti nel settore dell'intelligenza artificiale attraverso soluzioni di memoria specializzate. Questa strategia mira a garantire una maggiore fidelizzazione e a posizionare l'azienda come fornito...

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

Meta prevede forte aumento del CapEx per capacità AI

Meta prevede un incremento significativo delle spese in conto capitale (CapEx) a causa della crescente importanza strategica delle capacità di intelligenza artificiale. L'azienda considera la capacità di calcolo per l'AI un fattore limitante e preved...

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

Server AI: architetture rack-level in crescita, Delta e Liteon leader

Il mercato dei server AI si sposta verso architetture rack-level, con Delta e Liteon che emergono come fornitori chiave. Questa tendenza riflette la crescente domanda di maggiore densità di calcolo e migliori capacità di gestione termica nei data cen...

#LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

Assistant_Pepe_8B: un LLM dissacrante e utile con finestra di contesto a 1M

È stato rilasciato Assistant_Pepe_8B, un modello linguistico di grandi dimensioni (LLM) da 8 miliardi di parametri progettato per combinare capacità di shitposting di alto livello con effettiva utilità. Il modello vanta una finestra di contesto di 1 ...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-29 DigiTimes

Data center containerizzati e raffreddamento a liquido: sviluppi

Secondo DIGITIMES, si stanno intensificando gli sviluppi nei data center containerizzati e nelle soluzioni di raffreddamento a liquido. Queste tecnicie sono fondamentali per gestire l'aumento della densità di potenza e i requisiti di efficienza energ...

#Hardware #LLM On-Premise #Fine-Tuning
2026-01-29 DigiTimes

Microsoft supera i 50 miliardi di dollari nel cloud grazie all'AI

Microsoft ha superato i 50 miliardi di dollari di fatturato nel cloud, con una crescita significativa attribuita agli investimenti in intelligenza artificiale e all'adozione di Copilot. L'aumento della spesa in conto capitale riflette l'espansione de...

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

UMC accelera su packaging avanzato e fotonica al silicio per l'AI

UMC sta intensificando lo sviluppo di soluzioni di packaging avanzato e fotonica al silicio, in risposta alla crescente domanda di capacità di calcolo per applicazioni di intelligenza artificiale. Questa mossa strategica mira a posizionare UMC come f...

2026-01-29 DigiTimes

Celestica beneficia della spesa in cloud e AI

Celestica registra una forte crescita dei ricavi, trainata dall'aumento degli investimenti nel cloud computing e nell'intelligenza artificiale. La società beneficia dell'espansione del mercato e della crescente domanda di soluzioni avanzate.

#Hardware #LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

Server AI "mobile" da 768GB: analisi approfondita di un sistema locale

Un utente ha realizzato un server AI ad alte prestazioni con componenti consumer, raggiungendo 768GB di memoria tra RAM e VRAM. La configurazione, basata su un Threadripper Pro e diverse GPU, dimostra come un budget relativamente contenuto possa comp...

#Hardware #LLM On-Premise #DevOps
2026-01-29 LocalLLaMA

LM Studio 0.4.0: aggiornamenti e parallelismo

È stata rilasciata la versione 0.4.0 di LM Studio. Gli aggiornamenti includono modifiche all'interfaccia utente, con le impostazioni del runtime ora accessibili tramite le opzioni sviluppatore. Test sul parallelismo non hanno mostrato variazioni sign...

#LLM On-Premise #DevOps
2026-01-29 Phoronix

GNU gettext raggiunge la versione 1.0 dopo oltre 30 anni di sviluppo

GNU gettext, il sistema di internazionalizzazione e localizzazione ampiamente utilizzato, ha raggiunto la versione 1.0 dopo oltre 30 anni di sviluppo. Nato in Sun Microsystems nei primi anni '90 e poi sviluppato dal progetto GNU dal 1995, gettext è f...

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

Microsoft: colli di bottiglia per infrastruttura AI e consegne arretrate

Microsoft si trova ad affrontare sfide significative a causa dei limiti dell'infrastruttura AI. Questo si traduce in un arretrato di consegne valutato a 625 miliardi di dollari, evidenziando la forte domanda e le difficoltà di scalare le risorse nece...

#LLM On-Premise #DevOps
2026-01-29 DigiTimes

Meta punta al 2026 per una massiccia infrastruttura AI

Sulla scia di solidi risultati finanziari, Meta prevede un significativo investimento in infrastrutture di intelligenza artificiale entro il 2026. L'azienda punta a rafforzare le proprie capacità di calcolo per supportare ambiziosi progetti futuri ne...

#Hardware #LLM On-Premise #DevOps
2026-01-28 DigiTimes

Taiwan: boom degli investimenti 5G enterprise per il testing

Secondo DIGITIMES, gli investimenti 5G enterprise a Taiwan sono in forte crescita, trainati dalla crescente domanda di testing e validazione di nuove soluzioni. Questo trend offre opportunità significative per i fornitori di infrastrutture e servizi ...

#LLM On-Premise #DevOps
2026-01-28 TechCrunch AI

Meta punta all'AI: svolta prevista per il 2026, parola di Zuckerberg

Mark Zuckerberg ha annunciato che il 2026 sarà un anno cruciale per Meta, con l'obiettivo di fornire "super intelligenza personale". L'azienda prevede di lanciare strumenti di e-commerce basati su agenti AI, segnando un'importante evoluzione nel sett...

#LLM On-Premise #DevOps
2026-01-28 The Register AI

ServiceNow punta su 80 miliardi di workflow per l'AI

ServiceNow afferma che i suoi agenti AI sono più efficaci grazie a 20 anni di esperienza e 80 miliardi di workflow. L'azienda sottolinea come il modello sottostante sia solo una parte del prodotto finale.

#LLM On-Premise #DevOps
2026-01-28 TechCrunch AI

Zuckerberg: futuro senza smart glasses "difficile da immaginare"

Mark Zuckerberg ha espresso una visione del futuro in cui gli smart glasses avranno un ruolo centrale. L'affermazione arriva in un momento in cui Meta continua a investire nello sviluppo di tecnicie di realtà aumentata e virtuale, nonostante alcune p...

2026-01-28 TechCrunch AI

Tesla investe 2 miliardi di dollari in xAI di Elon Musk

La società di intelligenza artificiale xAI, fondata da Elon Musk, ha annunciato di aver raccolto 20 miliardi di dollari. Tra gli investitori figura anche Tesla, con un investimento di 2 miliardi di dollari. L'iniezione di capitale supporterà lo svilu...

2026-01-28 LocalLLaMA

LongCat-Flash-Lite: LLM ottimizzato per inference rapida

Meituan-Longcat ha rilasciato LongCat-Flash-Lite, un modello linguistico di grandi dimensioni (LLM) focalizzato sull'inference efficiente. Il modello è disponibile su Hugging Face e discusso su Reddit, suggerendo un interesse per l'utilizzo in contes...

#Hardware #LLM On-Premise #Fine-Tuning
2026-01-28 TechCrunch AI

X: Elon Musk anticipa sistema di etichettatura per media manipolati

Elon Musk ha annunciato che X introdurrà un sistema per identificare i "media manipolati". I dettagli specifici sul funzionamento di questo sistema di etichettatura non sono stati ancora resi noti. L'iniziativa solleva interrogativi sull'implementazi...

2026-01-28 Wired AI

ICE utilizza strumenti AI di Palantir per analizzare segnalazioni

L'agenzia statunitense ICE (Immigration and Customs Enforcement) sta impiegando un sistema basato su intelligenza artificiale di Palantir per riassumere le segnalazioni ricevute tramite la sua linea dedicata. Questo sistema è in uso dalla primavera s...

2026-01-28 Phoronix

Wasmer 7.0: WebAssembly si espande dal desktop all'edge

È disponibile Wasmer 7.0, l'ambiente runtime WebAssembly (WASM) che abilita container leggeri eseguibili ovunque, dal desktop al cloud e all'edge. Questa versione del runtime WASM, orientato alla sicurezza ed estensibile, introduce nuove funzionalità...

#DevOps
2026-01-28 TechCrunch AI

ServiceNow adotta un approccio multi-modello con Anthropic e OpenAI

ServiceNow ha stretto una partnership con Anthropic, a distanza di una sola settimana dall'annuncio di una collaborazione simile con OpenAI. Questa mossa strategica indica un approccio multi-modello all'integrazione dell'intelligenza artificiale nell...

#LLM On-Premise #DevOps
2026-01-28 Phoronix

GNOME 50: Rilevamento GPU Discrete Migliorato

La prossima release di GNOME 50, prevista in distribuzioni come Ubuntu 26.04 LTS e Fedora Workstation 44, includerà un rilevamento migliorato delle GPU discrete all'interno di GNOME Shell. Questo sviluppo, in lavorazione da due anni, è stato finalmen...

#Hardware #LLM On-Premise #DevOps
2026-01-28 Wired AI

Moltbot conquista la Silicio Valley: privacy a rischio?

L'assistente AI Moltbot, precedentemente noto come Clawdbot, sta rapidamente guadagnando popolarità nella Silicio Valley. Nonostante le preoccupazioni sulla privacy sollevate da più parti, molti utenti si affidano sempre più a questo strumento per ge...

#LLM On-Premise #DevOps
2026-01-28 TechCrunch AI

Handshake acquisisce Cleanlab per talento nel data labeling

Handshake ha acquisito Cleanlab, in un'operazione mirata principalmente all'acquisizione di talento. Nove dipendenti chiave di Cleanlab entreranno a far parte del team di ricerca di Handshake, rafforzando le capacità dell'azienda nel data labeling pe...

2026-01-28 TechCrunch AI

WhatsApp a pagamento per i chatbot AI in Italia

WhatsApp introdurrà un modello di tariffazione per gli sviluppatori di chatbot basati su intelligenza artificiale che operano sulla piattaforma in Italia. Il costo sarà calcolato in base al numero di messaggi inviati.

2026-01-28 LocalLLaMA

BitMamba-2: modello Mamba-2 da 1.58 bit addestrato su CPU

È stato rilasciato BitMamba-2, un modello ibrido che combina Mamba-2 SSM con la quantization BitNet a 1.58 bit. Addestrato da zero su 150 miliardi di token, il modello da 1 miliardo di parametri raggiunge prestazioni di circa 53 token/sec su una CPU ...

#Hardware
2026-01-28 OpenAI Blog

OpenAI rafforza la sicurezza dei dati negli agenti AI

OpenAI implementa nuove protezioni per la gestione dei dati quando gli agenti AI accedono a link esterni. Le misure di sicurezza integrate mirano a prevenire l'esfiltrazione di dati tramite URL e gli attacchi di prompt injection, garantendo un ambien...

#LLM On-Premise #DevOps
2026-01-28 Phoronix

Mesa 26.0-rc2: Aggiornamenti per driver AMD, NVIDIA e Intel

Disponibile Mesa 26.0-rc2, la seconda release candidate che include una serie di correzioni di bug per i driver open-source OpenGL e Vulkan di AMD, NVIDIA e Intel. Questo aggiornamento trimestrale introduce nuove funzionalità e miglioramenti.

#Hardware #LLM On-Premise #DevOps
2026-01-28 Wired AI

Chrome introduce l'agente 'Auto Browse' con IA generativa

Google integra l'IA generativa nel browser Chrome con la nuova funzionalità 'Auto Browse'. L'agente automatizza la navigazione web, ponendo l'utente in una posizione di supervisione passiva. Si tratta di un'ulteriore spinta verso l'integrazione dell'...

#LLM On-Premise #DevOps
2026-01-28 Ars Technica AI

Chrome integra l'agente AI "Auto Browse" di Google

Google sta espandendo le capacità di Gemini nel browser Chrome con l'introduzione di "Auto Browse", un agente autonomo in grado di automatizzare compiti ripetitivi. L'integrazione include un accesso più semplice a Gemini tramite un pannello laterale ...

2026-01-28 TechCrunch AI

Chrome integra Gemini e funzioni agent per task autonomi

Google Chrome potenzia l'integrazione di Gemini nella sidebar e introduce funzionalità agent per automatizzare task, destinate agli utenti AI Pro e Ultra. L'obiettivo è competere con i browser focalizzati sull'intelligenza artificiale, offrendo un'es...

#LLM On-Premise #DevOps
2026-01-28 TechCrunch AI

Modelence raccoglie 13 milioni per ottimizzare lo stack AI

Modelence ha raccolto 13 milioni di dollari per sviluppare strumenti che semplifichino lo stack software per l'intelligenza artificiale. L'azienda punta a risolvere le complessità legate alla creazione di applicazioni basate su AI, offrendo soluzioni...

#LLM On-Premise #DevOps
2026-01-28 Tech.eu

Voyager Ventures lancia il Fondo II da 275 milioni di dollari

Voyager Ventures ha annunciato la chiusura del suo Fondo II da 275 milioni di dollari, portando il totale degli asset in gestione a 475 milioni di dollari. Il fondo investirà in tecnicie per l'energia, la produzione di materiali, l'intelligenza artif...

2026-01-28 Ars Technica AI

Cina approva l'importazione di chip AI Nvidia H200

Dopo settimane di incertezza, la Cina ha dato il via libera all'importazione dei chip H200 di Nvidia per ByteDance, Alibaba e Tencent. L'approvazione segue un periodo di sospensione temporanea delle consegne, nonostante il via libera all'esportazione...

#Hardware #LLM On-Premise #DevOps
2026-01-28 LocalLLaMA

Kimi K2.5: esecuzione locale del modello ibrido da 1T parametri

Il modello Kimi K2.5, che vanta prestazioni all'avanguardia in task di visione, sviluppo, agenti e chat, può essere eseguito in locale. La versione quantizzata Unsloth Dynamic a 1.8-bit riduce lo spazio su disco richiesto del 60%, passando da 600GB a...

#Hardware #LLM On-Premise #DevOps
2026-01-28 The Register AI

Adozione di agenti AI: entusiasmo iniziale in calo per le aziende

L'implementazione di agenti AI sta rallentando. Secondo il CEO di Redis, Rowan Trollope, solo le aziende più grandi riescono a superare le sfide di integrazione e a portare questi sistemi in produzione. Molte organizzazioni stanno riconsiderando le p...

#LLM On-Premise #DevOps
2026-01-28 LangChain Blog

Gestione del contesto per agenti AI con Deep Agents

L'SDK Deep Agents di LangChain affronta le sfide della gestione del contesto in agenti AI complessi. Utilizzando tecniche di compressione come l'offload su filesystem e la summarization, Deep Agents mira a ridurre il volume di informazioni nella memo...

2026-01-28 404 Media

Violazione dati subita da Match Group, proprietaria di Hinge e OkCupid

Il gruppo di dating online Match Group, che include piattaforme popolari come Hinge e OkCupid, è stata vittima di una violazione di dati. Gli hacker affermano di aver sottratto 1.7GB di dati compressi, inclusi ID pubblicitari unici degli utenti e doc...

#LLM On-Premise #DevOps
2026-01-28 LocalLLaMA

AMA con Kimi: il laboratorio open-source dietro K2.5

Il team di Kimi, il laboratorio di ricerca open-source dietro il modello K2.5, ha partecipato a una sessione AMA (Ask Me Anything) su Reddit per rispondere alle domande della comunità LocalLLaMA. La sessione si è concentrata su vari aspetti del model...

2026-01-28 MIT Technology Review

Privacy e AI: la memoria dei chatbot è la nuova frontiera

La capacità dei chatbot AI di ricordare preferenze e dettagli personali sta diventando un fattore chiave. Tuttavia, questa personalizzazione introduce nuove vulnerabilità per la privacy. Gli sviluppatori devono implementare controlli granulari sull'u...

2026-01-28 The Register AI

SK Hynix investe 10 miliardi $ in una nuova divisione AI

Forte di ingenti liquidità, SK Hynix crea una nuova divisione focalizzata su soluzioni AI. L'azienda coreana punta a capitalizzare l'attuale interesse per l'intelligenza artificiale, sebbene i dettagli operativi della nuova entità siano ancora scarsi...

#LLM On-Premise #DevOps
2026-01-28 TechCrunch AI

CEO di Anthropic e OpenAI contro le politiche migratorie USA

I vertici di Anthropic e OpenAI hanno espresso pubblicamente il loro dissenso verso le tattiche di controllo dell'immigrazione negli Stati Uniti, in seguito a episodi di violenza. Le dichiarazioni sono arrivate sia tramite comunicati ufficiali che in...

#LLM On-Premise #DevOps
2026-01-28 MIT Technology Review

Sicurezza LLM: regole efficaci ai confini, non nei prompt

Gli attacchi di prompt injection e l'uso malevolo di agenti AI richiedono un cambio di paradigma nella sicurezza. Le difese basate su regole semantiche sono fragili. Serve governance solida, controllo degli accessi, monitoraggio continuo e policy app...

#LLM On-Premise #DevOps
2026-01-28 Tom's Hardware

Apple e Nvidia valutano Intel per la produzione di chip nel 2028

Secondo indiscrezioni, Apple e Nvidia starebbero valutando di affidare a Intel la produzione di alcuni chip negli Stati Uniti. La decisione sarebbe motivata da questioni geopolitiche e tariffe, ma resta da vedere quali prodotti Intel sarà effettivame...

#Hardware #LLM On-Premise #DevOps
2026-01-28 The Register AI

Polizia inglese sospende Copilot per allucinazioni su eventi sportivi

La polizia delle West Midlands ha sospeso l'uso di Microsoft Copilot dopo che il chatbot ha "inventato" una partita di calcio inesistente, portando alle dimissioni anticipate del capo della polizia. La decisione evidenzia i rischi legati all'uso di m...

#LLM On-Premise #DevOps
2026-01-28 The Register AI

Windows: bypass UAC sfrutta falle corrette in ritardo

Un ricercatore di Google ha scoperto un bypass per lo User Account Control (UAC) di Windows. La vulnerabilità è stata sfruttata a causa di patch rilasciate in ritardo da Microsoft, evidenziando rischi nella gestione delle autorizzazioni di amministra...

#LLM On-Premise #DevOps
2026-01-28 LocalLLaMA

OpenAI Rallenta le Assunzioni: Pressioni Finanziarie in Aumento?

Sam Altman ammette un drastico rallentamento delle assunzioni in OpenAI a causa di crescenti pressioni finanziarie. Un promemoria interno segnala la necessità di interventi urgenti su ChatGPT, mentre gli analisti prevedono possibili difficoltà di liq...

#LLM On-Premise #DevOps
2026-01-28 Tech.eu

Ex-CEO Northvolt: raccolta fondi difficile dopo il fallimento

Peter Carlsson, ex-CEO di Northvolt, ha definito "emotivamente difficile" la raccolta di capitali per la sua nuova startup, Aris Machina, dopo il fallimento della società svedese produttrice di batterie. Aris Machina utilizza l'AI per ottimizzare i p...

2026-01-28 Ars Technica AI

Moltbot: l'assistente AI open source virale con rischi per la sicurezza

Moltbot, un assistente AI open source, ha rapidamente guadagnato popolarità su GitHub. Creato dallo sviluppatore Peter Steinberger, offre controllo tramite app di messaggistica. Nonostante le somiglianze con Jarvis di Iron Man, presenta rischi di sic...

#LLM On-Premise #DevOps
2026-01-28 AI News

Masumi Network: AI e blockchain per un'economia degli agenti sicura

La piattaforma Masumi Network combina intelligenza artificiale e blockchain per creare un ambiente sicuro e decentralizzato per gli agenti AI. L'obiettivo è consentire agli agenti di diverse aziende di interagire e scambiarsi valore in modo autonomo,...

#LLM On-Premise #DevOps
2026-01-28 Tech.eu

Funnel.io ottiene finanziamento da 80 milioni per l'AI nel marketing

Funnel, piattaforma di marketing intelligence con sede a Stoccolma, ha ottenuto un finanziamento di 80 milioni di dollari da HSBC Innovation Banking e Hercules Capital. L'iniezione di capitale supporterà lo sviluppo di funzionalità avanzate basate su...

#LLM On-Premise #DevOps
2026-01-28 AI News

La Casa Bianca paragona l'era dell'AI alla rivoluzione industriale

Un documento della Casa Bianca traccia parallelismi tra la rivoluzione industriale e l'attuale era dell'intelligenza artificiale, posizionando quest'ultima come forza trainante della crescita economica. L'AI è al centro della strategia economica stat...

#Hardware
2026-01-28 Tom's Hardware

Starlink riduce l'orbita per evitare collisioni con satelliti cinesi

Ricercatori cinesi affermano che Starlink ha abbassato l'orbita di una parte significativa della sua costellazione di satelliti a seguito di un rischio di collisione con un lancio satellitare cinese nel dicembre 2025. Oltre 4000 satelliti sarebbero s...

2026-01-28 Tom's Hardware

Calcolo termodinamico: IA più efficiente di 10 miliardi di volte?

Una nuova ricerca suggerisce che il calcolo termodinamico potrebbe ridurre drasticamente il consumo energetico dell'intelligenza artificiale nella generazione di immagini. I prototipi sono promettenti, ma la sfida di creare hardware competitivo è sig...

#Hardware #LLM On-Premise #DevOps
2026-01-28 LocalLLaMA

Kimi K2.5: un modello open-source promettente per la programmazione

Secondo un post su Reddit, Kimi K2.5 si distingue come un modello open-source particolarmente efficace per attività di programmazione. La discussione online suggerisce che il modello offre risultati notevoli in questo specifico ambito.

#LLM On-Premise #DevOps
2026-01-28 AI News

Adozione dell'AI in USA: ancora frammentata e legata al ruolo

Un sondaggio Gallup rivela che l'adozione dell'intelligenza artificiale nei luoghi di lavoro statunitensi è in crescita, ma rimane disomogenea. L'utilizzo è concentrato nei settori della tecnicia, finanza e servizi professionali, con un'adozione mino...

#LLM On-Premise #DevOps
2026-01-28 LocalLLaMA

API LLM: crollo dei prezzi, ha ancora senso l'on-premise?

Il costo delle API per i modelli linguistici di grandi dimensioni (LLM) è in rapido calo, sollevando interrogativi sulla convenienza di mantenere infrastrutture on-premise. Privacy, latenza e personalizzazione restano vantaggi chiave, ma i costi hard...

#Hardware #LLM On-Premise #DevOps
2026-01-28 Tech.eu

Modern Milkman riceve 10 milioni di sterline per espandersi

Modern Milkman, servizio di consegna di generi alimentari sostenibili nel Regno Unito, ha raccolto 10 milioni di sterline in un round di finanziamento guidato da Salica Investments. L'azienda, nata nel 2019, punta a sviluppare ulteriormente la sua pi...

2026-01-28 AI News

Standard Chartered: AI e privacy, un binomio indissolubile

Per Standard Chartered, le questioni legate alla privacy dei dati sono il punto di partenza per qualsiasi progetto di intelligenza artificiale. Le normative sulla protezione dei dati influenzano il tipo di dati utilizzabili, la trasparenza dei sistem...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

SK Hynix investe 10 miliardi di dollari in USA per l'AI

SK Hynix ha annunciato un investimento di 10 miliardi di dollari per rafforzare la sua presenza nel settore dell'intelligenza artificiale negli Stati Uniti. La decisione arriva in un momento di crescente competizione e pressioni tariffarie nel mercat...

#LLM On-Premise #DevOps
2026-01-28 LocalLLaMA

SanityHarness: Benchmark per valutare agenti di coding e modelli LLM

Uno sviluppatore ha creato SanityHarness, un tool di benchmark per valutare le capacità di agenti di coding e modelli linguistici in diversi linguaggi di programmazione. I risultati sono pubblicati su SanityBoard, una leaderboard che confronta le per...

#Fine-Tuning
2026-01-28 Tech.eu

b2venture chiude il Fondo V a 150 milioni per startup europee

b2venture ha annunciato la chiusura del suo Fondo V a 150 milioni di euro, superando il target prefissato. Il fondo supporterà circa 35 startup early-stage in Europa, con un focus su tecnicie scalabili e difendibili nei settori deep tech, AI e roboti...

2026-01-28 OpenAI Blog

OpenAI accelera l'adozione dell'IA in Europa con nuove iniziative

OpenAI lancia l'EU Economic Blueprint 2.0, un programma con nuovi dati, partnership e iniziative per promuovere l'adozione dell'intelligenza artificiale, lo sviluppo di competenze e la crescita economica in tutta Europa. L'iniziativa mira a supportar...

#LLM On-Premise #DevOps
2026-01-28 OpenAI Blog

Grant EMEA per il benessere giovanile nell'era dell'AI

Disponibile un grant da 500.000€ per ONG e ricercatori che si occupano di sicurezza e benessere dei giovani nell'era dell'intelligenza artificiale (AI) nella regione EMEA. L'iniziativa mira a supportare progetti che affrontano le sfide e le opportuni...

2026-01-28 TechWire Asia

Zebra Technologies punta sull'AI per ottimizzare le operazioni sul campo

Zebra Technologies integra l'intelligenza artificiale nelle operazioni sul campo per affrontare le sfide legate alla carenza di manodopera, alle aspettative dei clienti e all'imprevedibilità della supply chain. L'azienda si concentra su soluzioni che...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

SK Hynix: utili record nel 2025 grazie al boom delle memorie per AI

SK Hynix prevede utili da record nel 2025, trainati dalla forte domanda di memorie ad alte prestazioni per applicazioni di intelligenza artificiale. La crescita è attribuita principalmente all'aumento della richiesta di soluzioni di memoria specializ...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

ASML supera le aspettative, previsti 1.700 licenziamenti

Il produttore di macchinari per semiconduttori ASML ha annunciato risultati superiori alle attese, contestualmente a un piano di riduzione del personale che prevede il licenziamento di 1.700 dipendenti. La notizia arriva in un momento di cambiamenti ...

2026-01-28 DigiTimes

Cina approva le prime importazioni di chip Nvidia H200

Secondo quanto riportato, la Cina ha dato il via libera alle prime importazioni di chip Nvidia H200, un'acceleratore di intelligenza artificiale di fascia alta. Questa mossa potrebbe avere implicazioni significative per il mercato cinese dell'AI e pe...

#Hardware #LLM On-Premise #Fine-Tuning
2026-01-28 DigiTimes

Taiwan punta sugli sciami di droni con l'AI di Anduril

Taiwan sta investendo in modo significativo nella tecnicia degli sciami di droni, affidandosi al sistema di comando e controllo basato su intelligenza artificiale Lattice di Anduril. Questa mossa strategica mira a rafforzare le capacità di difesa e s...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

ASML prevede risultati record nel 2025 grazie all'aumento degli ordini

Il produttore di sistemi di litografia ASML prevede risultati finanziari da record per il 2025, sostenuti da una forte crescita degli ordini. L'azienda, cruciale per la produzione di semiconduttori avanzati, continua a beneficiare della domanda globa...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

SSD Phison Pascari alimentano il primo data center lunare

Gli SSD Pascari di Phison hanno stabilito un nuovo standard di affidabilità alimentando il primo data center lunare. Questa pietra miliare dimostra la capacità degli SSD di operare in ambienti estremi, aprendo nuove frontiere per l'elaborazione dati ...

#LLM On-Premise #DevOps
2026-01-28 Tech.eu

Co-reactive raccoglie 6,5 milioni per materiali CO₂-negativi

La startup tedesca Co-reactive ha ottenuto 6,5 milioni di euro in finanziamenti seed per sviluppare materiali da costruzione CO₂-negativi. Il processo di mineralizzazione continua trasforma CO₂ catturata e minerali naturali in materiali cementizi sup...

2026-01-28 DigiTimes

Anthropic punta a superare OpenAI, costi di calcolo restano una sfida

Anthropic mira a competere con OpenAI aumentando i ricavi, ma i costi elevati dell'infrastruttura di calcolo rappresentano un ostacolo significativo. L'azienda sta valutando strategie per ottimizzare le risorse e scalare le operazioni.

#Hardware #LLM On-Premise #DevOps
2026-01-28 DigiTimes

Musk punta a cicli di progettazione chip AI di soli 9 mesi

Elon Musk ha annunciato l'intenzione di ridurre drasticamente i tempi di progettazione dei chip per l'intelligenza artificiale, portandoli a soli nove mesi. Questa accelerazione potrebbe avere un impatto significativo sullo sviluppo di nuove capacità...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

Il 'Taiwan Dome' spinge verso una difesa di rete

L'iniziativa 'Taiwan Dome' mira a rafforzare le capacità di difesa attraverso un approccio di rete. Questo cambiamento strategico sottolinea l'importanza della connettività e della condivisione delle informazioni per una risposta più efficace alle mi...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

SoftBank studia investimento da 30 miliardi di dollari in OpenAI

Secondo fonti di stampa, SoftBank starebbe valutando un investimento di circa 30 miliardi di dollari in OpenAI. L'operazione, se confermata, rappresenterebbe un'iniezione di capitale significativa per la società che ha sviluppato ChatGPT e altri mode...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

Tesla rilancia il progetto Dojo, focus sull'AI per applicazioni spaziali

Tesla ha riavviato lo sviluppo del suo supercomputer Dojo, con un rinnovato interesse verso applicazioni di intelligenza artificiale in ambito spaziale. Il progetto, precedentemente focalizzato sulla guida autonoma, sembra espandere il suo raggio d'a...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

Macronix rilancia investimenti per memorie flash eMMC e NOR

Macronix riavvia un piano di investimenti da 22 miliardi di NT$ per espandere la produzione di memorie flash eMMC e NOR. L'iniziativa mira a soddisfare la crescente domanda nel settore, con un focus sulle memorie MLC.

#LLM On-Premise #DevOps
2026-01-28 ArXiv cs.CL

Calibrazione della Confidenza nei Modelli Linguistici: una Nuova Metrica

Un nuovo studio introduce un metodo per valutare l'affidabilità dei modelli linguistici (LLM) basato sulla calibrazione della confidenza. L'analisi rivela che molti modelli, specialmente quelli pre-addestrati con obiettivi di masking, tendono a esser...

#LLM On-Premise #DevOps
2026-01-28 ArXiv cs.CL

ASR multilingue: connettori LLM ottimizzati per famiglie linguistiche

Un nuovo studio esplora un approccio efficiente per il riconoscimento automatico del parlato (ASR) multilingue basato su LLM. La tecnica prevede la condivisione di connettori tra famiglie linguistiche, riducendo il numero di parametri e migliorando l...

#LLM On-Premise #DevOps
2026-01-28 ArXiv cs.AI

LLM per progettare problemi di ottimizzazione continua

Un nuovo studio esplora l'uso di modelli linguistici di grandi dimensioni (LLM) per generare problemi di ottimizzazione continua con caratteristiche controllabili. Il framework LLaMEA guida un LLM nella creazione di codice problema da descrizioni in ...

2026-01-28 ArXiv cs.AI

Sistemi A-BPMS: l'AI agentica trasforma il Business Process Management

Un nuovo studio prefigura una trasformazione nel Business Process Management (BPM) grazie all'Intelligenza Artificiale agentica. I sistemi A-BPMS integrano autonomia, ragionamento e apprendimento per una gestione dei processi data-driven, estendendo ...

#LLM On-Premise #DevOps
2026-01-28 OpenAI Blog

TrustBank: AI per donazioni fiscali personalizzate

TrustBank ha collaborato con Recursive per sviluppare Choice AI, un sistema basato su modelli OpenAI che offre raccomandazioni personalizzate e conversazionali per semplificare la scoperta di doni Furusato Nozei. L'AI aiuta i donatori a navigare tra ...

2026-01-28 DigiTimes

Lightmatter: interconnessioni fotoniche per AI dal 2026

Lightmatter prevede di introdurre interconnessioni fotoniche per infrastrutture AI nel 2026. Questa tecnicia promette di migliorare significativamente le prestazioni e l'efficienza energetica dei sistemi di calcolo per l'intelligenza artificiale, apr...

#LLM On-Premise #DevOps
2026-01-28 DigiTimes

Cina accelera sui chip auto, Taiwan punta alla fascia alta

La Cina intensifica gli sforzi per la produzione interna di chip per il settore automobilistico. Taiwan, nel frattempo, si concentra sulla fornitura di soluzioni di fascia alta per questo mercato in rapida evoluzione. La competizione si fa sempre più...

2026-01-28 LocalLLaMA

Kimi K2.5: modello open-source competitivo con alternative proprietarie

Un utente ha segnalato su Reddit che Kimi K2.5, un modello open-source, offre prestazioni paragonabili a modelli proprietari più costosi, come Opus, con un costo inferiore di circa il 90%. Viene evidenziata una performance superiore rispetto a GLM, s...

#LLM On-Premise #DevOps
2026-01-28 LocalLLaMA

Arcee AI lancia Trinity Large: modello open source da 400B parametri

Arcee AI ha rilasciato Trinity Large, un modello linguistico di grandi dimensioni (LLM) open source con 400 miliardi di parametri. Il modello è disponibile con licenza OpenWeight, aprendo nuove possibilità per la ricerca e lo sviluppo nel campo dell'...

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

Accton entra nella top 20 globale EMS/ODM grazie all'AI

Il produttore taiwanese Accton ha scalato la classifica dei fornitori di servizi EMS/ODM, entrando nella top 20 mondiale. La crescita è stata trainata dal raddoppio dei ricavi derivanti da prodotti legati all'intelligenza artificiale.

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

Ta-i Technology alza i prezzi dei chip resistor da febbraio

Ta-i Technology aumenterà i prezzi dei chip resistor a partire da febbraio, a causa della crescente pressione sui costi di produzione. La decisione riflette le sfide che i produttori di componenti elettronici stanno affrontando a livello globale.

2026-01-27 DigiTimes

Samsung abbandona le memorie NAND MLC: impatto previsto nel 2026

Secondo DIGITIMES, Samsung prevede di abbandonare la produzione di memorie NAND MLC (Multi-Level Cell). Questo cambiamento, legato alla transizione verso memorie 3D NAND, potrebbe avere ripercussioni sulla disponibilità a partire dal 2026.

#LLM On-Premise #DevOps
2026-01-27 LocalLLaMA

Kimi K2: analisi sintetica delle prestazioni di un modello LLM

Un utente ha condiviso su Reddit un punteggio di analisi sintetica per il modello linguistico Kimi K2. Il post originale rimanda a un tweet con ulteriori dettagli, offrendo uno spunto di discussione sulle prestazioni del modello in scenari specifici.

2026-01-27 LocalLLaMA

Workstation dual RTX PRO 6000: benchmark multi-utente e contesti lunghi

Un team ha testato una workstation con due RTX PRO 6000 e 1.15TB di RAM per carichi di lavoro AI multi-utente. Confronto tra inference GPU-only (INT4) e CPU+GPU (FP8) con MiniMax M2.1. I risultati mostrano che INT4 è più veloce nel prefill ma limitat...

#Hardware #LLM On-Premise #DevOps
2026-01-27 LocalLLaMA

Leak del System Prompt di Kimi K2.5: focus su tool e memory CRUD

È stato divulgato il system prompt completo del modello Kimi K2.5 di Moonshot, insieme agli schemi degli strumenti, ai protocolli CRUD della memoria e alle integrazioni di origini dati esterne. La fuga di notizie include anche informazioni sull'ingeg...

#LLM On-Premise #DevOps
2026-01-27 The Register AI

App per 'denudare' persone: Apple e Google sotto accusa

Una ricerca del Tech Transparency Project rivela la presenza di app, disponibili su Apple Store e Google Play, che permettono di creare falsi nudi non consensuali. Nonostante le dichiarazioni contrarie, le due aziende avrebbero guadagnato milioni di ...

#LLM On-Premise #DevOps
2026-01-27 TechCrunch AI

Anthropic punta a una valutazione di 300 miliardi con una raccolta fondi da 20

Secondo indiscrezioni, Anthropic starebbe cercando di raccogliere 20 miliardi di dollari, puntando a una valutazione superiore ai 300 miliardi. L'operazione finanziaria potrebbe consolidare la posizione dell'azienda nel mercato dei modelli linguistic...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-27 LocalLLaMA

Qwen3-32B: Quantization INT4 moltiplica la capacità di 12x

Un benchmark su Qwen3-32B mostra che la quantization a INT4, rispetto a BF16, permette di servire 12 volte più utenti simultanei con una perdita di accuratezza limitata all'1.9%. Il test è stato eseguito su una singola GPU H100, valutando diverse pre...

#Hardware #LLM On-Premise #DevOps
2026-01-27 Tom's Hardware

Zotac avverte: carenza di componenti minaccia i produttori di GPU

Zotac Korea ha espresso preoccupazione per la situazione del mercato delle schede grafiche. La carenza di componenti rischia di compromettere la sopravvivenza dei produttori e dei distributori del settore. L'azienda lancia un allarme sulla potenziale...

#Hardware #LLM On-Premise #DevOps
2026-01-27 Phoronix

GNU C Library migra da Sourceware a Linux Foundation CTI

Gli sviluppatori della GNU C Library (glibc) hanno deciso di migrare i loro servizi principali dall'infrastruttura Sourceware.org al progetto Core Toolchain Infrastructure (CTI) ospitato dalla Linux Foundation. Questa transizione mira a migliorare la...

#LLM On-Premise #DevOps
2026-01-27 Wired AI

Grok e xAI nel mirino di 37 procuratori generali USA

Almeno 37 procuratori generali di Stati e territori USA hanno avviato azioni legali contro xAI. La causa scatenante sarebbe la generazione, da parte di Grok, di immagini sessuali non consensuali di donne e minori.

#LLM On-Premise #DevOps
2026-01-27 404 Media

DHS: Video sorveglianza chiave in caso abusi ICE mai registrato

Il Dipartimento per la Sicurezza Interna (DHS) afferma che due settimane di riprese di sorveglianza cruciali dal centro di detenzione ICE di Broadview non sono mai state registrate, contrariamente a quanto dichiarato in precedenza. Le riprese erano s...

2026-01-27 Google AI Blog

Google approfondisce lo sviluppo del modello Gemini in un podcast

L'ultimo episodio del podcast Google AI: Release Notes esplora il processo di sviluppo di Gemini, uno dei modelli di AI per la programmazione più avanzati al mondo. Logan Kilpatrick intervista il team "Smokejumpers" per svelare i segreti dietro la su...

#LLM On-Premise #DevOps
2026-01-27 The Register AI

Aziende EMEA accelerano i progetti pilota AI nonostante i dubbi

Nonostante crescenti perplessità sui benefici reali dell'AI per molte imprese, Lenovo e IDC segnalano che le aziende nell'area EMEA continuano a investire in progetti pilota, mantenendo l'aspettativa di crescita e trasformazione operativa.

#LLM On-Premise #DevOps
2026-01-27 TechCrunch AI

CEO di Anthropic e OpenAI criticano le politiche migratorie USA

I CEO di Anthropic e OpenAI, Dario Amodei e Sam Altman, hanno espresso pubblicamente critiche nei confronti delle politiche di immigrazione statunitensi, in seguito a episodi di violenza. Le dichiarazioni sono giunte sia tramite canali ufficiali che ...

#LLM On-Premise #DevOps
2026-01-27 Tom's Hardware

Intel prepara un processore ibrido x86 con accelerazione AI dedicata

Intel annuncia lo sviluppo di un processore ibrido che combina core x86, accelerazione AI dedicata e logica programmabile. Questa mossa strategica potrebbe posizionare Intel in un segmento di mercato trascurato da Nvidia e AMD.

#Hardware #LLM On-Premise #DevOps
2026-01-27 TechCrunch AI

Google AI Plus con Gemini Pro 3 disponibile globalmente

Google ha esteso la disponibilità del piano Google AI Plus, che include l'accesso a Gemini Pro 3 e altri strumenti di intelligenza artificiale, a tutti i mercati, compresi gli Stati Uniti. Il costo negli USA è di 7,99 dollari al mese.

#LLM On-Premise #DevOps
2026-01-27 Google AI Blog

Google AI Plus si espande: disponibile in 35 nuovi paesi

Google ha annunciato l'espansione di Google AI Plus in 35 nuovi paesi e territori, inclusi gli Stati Uniti. L'iniziativa rende i piani Google AI disponibili in un numero maggiore di località a livello globale.

#Hardware
2026-01-27 Tom's Hardware

Iluvatar CoreX sfida Nvidia Rubin: roadmap GPU fino al 2027

Il produttore cinese di chip Shanghai Iluvatar CoreX ha svelato una roadmap pluriennale per le proprie GPU, puntando a competere direttamente con la piattaforma Rubin di Nvidia. L'azienda mira a raggiungere questo obiettivo entro il 2027, delineando ...

#Hardware #LLM On-Premise #DevOps
2026-01-27 TechCrunch AI

OpenAI Prism: workspace AI per la ricerca scientifica

OpenAI ha presentato Prism, un nuovo ambiente di lavoro scientifico che integra l'intelligenza artificiale nei processi standard di composizione dei documenti di ricerca. L'obiettivo è migliorare l'efficienza e la produttività dei ricercatori.

2026-01-27 OpenAI Blog

Prism: workspace LaTeX con GPT-5.2 integrato per la ricerca

Prism è un ambiente di lavoro gratuito, nativo per LaTeX, che integra GPT-5.2. L'obiettivo è fornire ai ricercatori una piattaforma unificata per la scrittura, la collaborazione e il ragionamento.

#LLM On-Premise #DevOps
2026-01-27 Phoronix

KDE Plasma 6.6 Beta 2 disponibile per i test

È disponibile la seconda beta del prossimo ambiente desktop KDE Plasma 6.6. La versione stabile di KDE Plasma 6.6 è prevista per metà febbraio. Questa release si concentra sul miglioramento della stabilità e sull'introduzione di nuove funzionalità pe...

2026-01-27 LocalLLaMA

Rocinante X 12B v1: modello LLM open source per role-playing in locale

È disponibile Rocinante X 12B v1, un modello linguistico di grandi dimensioni (LLM) open source progettato per attività creative di role-playing. Il modello, ispirato a Claude, è pensato per essere eseguito in locale, offrendo agli utenti il controll...

#LLM On-Premise #DevOps
2026-01-27 AI News

Databricks: l'adozione di AI enterprise si sposta verso sistemi agent

Secondo Databricks, l'adozione dell'AI enterprise si sta evolvendo verso sistemi "agent", dove i modelli pianificano ed eseguono autonomamente i workflow. Si registra un aumento del 327% nell'uso di workflow multi-agent sulla piattaforma Databricks t...

#LLM On-Premise #DevOps
2026-01-27 Wired AI

Google DeepMind: dipendenti chiedono protezione da ICE

A seguito di un presunto tentativo di accesso di un agente federale al campus di Cambridge di Google, i dipendenti di DeepMind chiedono all'azienda policy interne per proteggerli da potenziali azioni da parte delle autorità di immigrazione (ICE).

2026-01-27 Phoronix

Google Cloud: istanze N4A con CPU Axion disponibili

Google espande la sua offerta di processori ARM Axion su Google Cloud con le nuove istanze N4A, ora disponibili al pubblico. Ottimizzate per server web scale-out, microservizi e analisi dati, queste istanze promettono un ambiente di sviluppo e test p...

2026-01-27 Ars Technica AI

Google potenzia AI Overviews con Gemini 3: più conversazionale

Google sta aggiornando AI Overviews, la sua funzionalità di ricerca basata su intelligenza artificiale, con i modelli Gemini 3. L'obiettivo è rendere l'esperienza più conversazionale e precisa, scegliendo dinamicamente il modello Gemini 3 più adatto ...

2026-01-27 Google AI Blog

Ricerca potenziata: nuove capacità AI per tutti gli utenti

Gli utenti di tutto il mondo possono ora accedere più facilmente a funzionalità di intelligenza artificiale all'avanguardia direttamente tramite la Ricerca. L'articolo annuncia un'esperienza utente migliorata, con l'obiettivo di rendere l'AI più acce...

2026-01-27 Microsoft Research

UniRG: AI e Reinforcement Learning per l'analisi di immagini mediche

Microsoft Research presenta UniRG, un framework basato su reinforcement learning per migliorare la generazione automatica di referti radiologici. UniRG-CXR, il modello derivato, raggiunge performance superiori nell'accuratezza diagnostica e nella gen...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-27 TechCrunch AI

Google integra Gemini 3 nelle AI Overviews e introduce AI Mode

Google ha annunciato l'integrazione di Gemini 3 come modello predefinito per le AI Overviews a livello globale. L'azienda ha inoltre introdotto una nuova funzionalità, AI Mode, che permette agli utenti di passare direttamente dalle AI Overviews a con...

2026-01-27 LocalLLaMA

Z-Image: nuovo modello di generazione immagini da Tongyi-MAI

Tongyi-MAI ha rilasciato Z-Image, un nuovo modello per la generazione di immagini. Il modello è disponibile su Hugging Face, aprendo nuove possibilità per applicazioni di intelligenza artificiale generativa. Ulteriori dettagli sull'architettura e le ...

#LLM On-Premise #DevOps
2026-01-27 The Register AI

Il Papa mette in guardia dall'ingenuità verso l'IA

Il Pontefice esorta i fedeli a sviluppare un pensiero critico nei confronti dell'intelligenza artificiale, mettendo in guardia dai rischi di una dipendenza acritica dalla tecnicia e dalle interazioni innaturali con i chatbot. Invita a proteggere la p...

#LLM On-Premise #DevOps
2026-01-27 TechCrunch AI

Risotto Inc. raccoglie 10 milioni di dollari per l'AI nel ticketing

Risotto Inc., specializzata nell'automazione della risoluzione di ticket di assistenza clienti tramite intelligenza artificiale, ha annunciato un round di finanziamento seed da 10 milioni di dollari. L'investimento è guidato da Bonfire Ventures e mir...

2026-01-27 Tom's Hardware

Nvidia DGX Spark: potenza Blackwell per sviluppatori AI

Nvidia DGX Spark porta la potenza di Grace Blackwell ai desktop degli sviluppatori AI. CPU Arm a 20 core, GPU Blackwell con 6144 core CUDA e 128GB di memoria unificata permettono di gestire un'ampia gamma di modelli e carichi di lavoro AI con perform...

#Hardware #LLM On-Premise #DevOps
2026-01-27 TechCrunch AI

Flora raccoglie 42 milioni di dollari per il design basato su nodi

Flora, una piattaforma di design basata su nodi, ha ottenuto un finanziamento di 42 milioni di dollari da Redpoint Ventures. La piattaforma è utilizzata da aziende come Pentagram e Lionsgate per semplificare i processi di design e prototipazione.

2026-01-27 The Register AI

Allarmi meteo USA: traduzioni AI ancora incomplete, dice GAO

Il Government Accountability Office (GAO) ha sollecitato il National Weather Service (NWS) a finalizzare i piani per la traduzione linguistica basata su AI. Ritardi e incertezze nelle policy rischiano di compromettere l'efficacia degli allarmi meteo ...

#LLM On-Premise #DevOps
2026-01-27 The Next Web

TNW Council: prime indicazioni sul supporto alle startup

Il TNW Council ha rilevato differenze significative nelle esigenze delle startup in base alla loro fase di crescita. Le aziende con fatturato tra 1 e 10 milioni di euro cercano strategie di crescita e chiarezza nel posizionamento. Quelle tra 10 e 100...

#LLM On-Premise #DevOps
2026-01-27 AI News

Anthropic costruirà un assistente AI per la pubblica amministrazione UK

Il governo britannico ha selezionato Anthropic per sviluppare un assistente AI volto a modernizzare l'interazione tra cittadini e servizi statali. Il progetto si concentra sull'impiego di sistemi agentici basati su Claude per guidare gli utenti attra...

#LLM On-Premise #DevOps
2026-01-27 OpenAI Blog

PVH (Calvin Klein, Tommy Hilfiger) adotta ChatGPT Enterprise

PVH Corp., la società madre di Calvin Klein e Tommy Hilfiger, sta integrando ChatGPT Enterprise nei suoi processi aziendali. L'obiettivo è migliorare il design della moda, la catena di approvvigionamento e l'interazione con i consumatori attraverso l...

2026-01-27 Tech.eu

StuDocu: l'AI rivoluziona la preparazione agli esami

StuDocu, una piattaforma con oltre 50 milioni di documenti, sta trasformando la preparazione agli esami grazie all'integrazione di strumenti di intelligenza artificiale. La piattaforma offre riassunti istantanei, assistenti allo studio e quiz interat...

2026-01-27 Tech.eu

Evaro raccoglie 25 milioni $ per sanità digitale integrata

La piattaforma di sanità digitale Evaro, autorizzata dal NHS, ha chiuso un round di finanziamento di Serie A da 25 milioni di dollari. L'obiettivo è supportare i marchi consumer nell'offerta di servizi sanitari digitali integrati, ampliando l'accesso...

2026-01-27 The Register AI

Giappone e USA insieme per supercalcolo AI: progetto Genesis rilanciato

L'istituto di ricerca giapponese RIKEN, Fujitsu, l'Argonne National Laboratory (USA) e Nvidia collaborano per sviluppare infrastrutture di calcolo di nuova generazione per applicazioni di intelligenza artificiale (AI) e calcolo ad alte prestazioni (H...

#Hardware #LLM On-Premise #DevOps
2026-01-27 The Register AI

Cookie illegali su dispositivi scolastici: multa per Microsoft

L'autorità austriaca per la protezione dei dati (DSB) ha stabilito che Microsoft ha installato illegalmente cookie sui dispositivi di uno studente senza consenso. Il ministero dell'istruzione austriaco non era a conoscenza del software di tracciament...

2026-01-27 Tom's Hardware

Intel XeSS 3: frame generation multi-frame su GPU Arc e iGPU Core Ultra

I nuovi driver grafici Intel introducono XeSS 3 Multi-Frame Generation con modalità 2x, 3x e 4x. La tecnicia è compatibile con i giochi XeSS 2 esistenti senza richiedere aggiornamenti da parte degli sviluppatori, estendendo le capacità di frame gener...

#Hardware #LLM On-Premise #DevOps
2026-01-27 Tech.eu

ZOHO.VC chiude il primo round di finanziamento al 70% del target

ZOHO.VC, il braccio di venture capital di ZOLLHOF, ha chiuso il primo round del suo fondo inaugurale, raggiungendo il 70% del volume target. Il fondo si concentra su investimenti pre-seed e seed in startup tecniciche, combinando capitale, competenze ...

#Hardware
2026-01-27 AI News

Ondata di freddo: l'AI aiuta le compagnie aeree a reagire

Le recenti ondate di freddo negli Stati Uniti hanno messo a dura prova il settore aereo. Alcune compagnie, tra cui Air France-KLM e United Airlines, stanno utilizzando l'AI generativa per rispondere più rapidamente alle richieste dei clienti e ottimi...

#LLM On-Premise #DevOps #RAG
2026-01-27 The Register AI

Claude replica software commerciale per 10$/ora: è la fine dello sviluppo?

Uno sviluppatore open source ha creato uno script che utilizza AI agentic e assistenti di programmazione per generare software di alta qualità a costi minimi. Questo solleva preoccupazioni sull'impatto potenziale sulla professione dello sviluppatore ...

#LLM On-Premise #DevOps
2026-01-27 LocalLLaMA

Qwen: in arrivo un nuovo modello multimodale?

Gli sviluppatori di Qwen, il modello linguistico di grandi dimensioni open source, sembrano preannunciare il rilascio di un nuovo modello. La community ipotizza si tratti di un modello multimodale (vision-language), capace di elaborare sia testo che ...

#LLM On-Premise #DevOps
2026-01-27 Wired AI

Il futuro dell'AI: visioni di leader tech e studenti

Un sondaggio esplora le opinioni di CEO, giornalisti, studenti e altre figure del settore tecnicico riguardo le promesse e i pericoli dell'intelligenza artificiale. L'articolo riassume le diverse prospettive emerse, offrendo uno spaccato sul futuro d...

2026-01-27 DigiTimes

Lightmatter collabora con GUC e Cadence per superare i limiti di banda AI

Lightmatter stringe una partnership con GUC e Cadence per affrontare le sfide legate alla larghezza di banda nell'ambito dell'intelligenza artificiale. L'obiettivo è sviluppare soluzioni innovative che consentano di superare le limitazioni attuali e ...

#LLM On-Premise #DevOps
2026-01-27 TechCrunch AI

Grok di xAI sotto accusa per lacune nella protezione dei minori

Un report di Common Sense Media critica pesantemente Grok, il chatbot di xAI, per gravi mancanze nella protezione dei minori. Secondo l'organizzazione, Grok si posiziona tra i peggiori chatbot valutati in termini di sicurezza per i più giovani.

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

Taipower e Westinghouse: controlli nucleari per l'era dell'AI

Taipower collabora con Westinghouse per verifiche di sicurezza nucleare, in risposta alla crescente domanda energetica dell'AI e agli obiettivi net-zero. L'iniziativa mira a garantire operazioni sicure e affidabili delle centrali nucleari di fronte a...

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

Nvidia accelera le previsioni meteo con modelli open source

Nvidia ha rilasciato nuovi modelli open source per velocizzare le previsioni meteorologiche. Questa iniziativa mira a fornire strumenti più accessibili e potenti per la modellazione del clima, potenzialmente riducendo i tempi di calcolo e migliorando...

#Hardware #LLM On-Premise #DevOps
2026-01-27 Tech.eu

Radiant: 2 milioni di euro per il solare termico industriale

Radiant, specializzata in soluzioni solari termiche per applicazioni industriali, ha chiuso un round di finanziamento da 2 milioni di euro. L'azienda punta a ridurre la dipendenza dai combustibili fossili nel settore industriale, grazie a una tecnici...

2026-01-27 The Register AI

Salesforce: costi AI bloccati ora, sorprese dopo?

Gartner avverte gli utenti Salesforce: gli accordi enterprise con costi bloccati per AI e dati non saranno rinnovabili alle stesse condizioni. Prevedere i costi futuri e valutare il valore diventerà più complesso.

#LLM On-Premise #DevOps
2026-01-27 Tech.eu

Brickanta raccoglie 8 milioni per l'AI nella pianificazione edile

Brickanta, piattaforma svedese di AI per il settore edile, ha chiuso un round di finanziamento seed da 8 milioni di dollari. L'azienda utilizzerà i fondi per espandere la sua piattaforma focalizzata sull'analisi delle offerte, la stima dei costi e l'...

2026-01-27 LocalLLaMA

OpenAI: riserve di cassa a rischio esaurimento entro il 2027?

Un'analisi finanziaria prevede che OpenAI potrebbe esaurire le proprie riserve di cassa entro la metà del 2027. I costi di training dei modelli aumentano rapidamente, mentre la crescita dei ricavi non tiene il passo. La strategia 'Stargate' da 100 mi...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-27 DigiTimes

Taiwan ottiene status MFN dagli USA sui dazi della Sezione 232

Funzionari taiwanesi riportano che gli Stati Uniti hanno concesso a Taiwan lo status di Nazione più favorita (MFN) in relazione ai dazi doganali previsti dalla Sezione 232. La decisione rappresenta un riconoscimento dell'importanza dell'industria tai...

2026-01-27 DigiTimes

TSMC e Nvidia trainano la crescita AI: espansione accelerata a Taiwan

La forte domanda di soluzioni AI, guidata da Nvidia, sta spingendo TSMC e l'intera filiera tecnicica di Taiwan ad accelerare i piani di espansione. L'articolo evidenzia come la partnership tra il produttore di chip e il gigante delle GPU stia aliment...

#Hardware #LLM On-Premise #DevOps
2026-01-27 DigiTimes

Produttori di chip taiwanesi puntano a USA e Europa per la visual AI

I produttori di chip di Taiwan stanno espandendo il loro raggio d'azione verso i mercati di Stati Uniti ed Europa, in risposta alla saturazione del mercato cinese nel settore dell'intelligenza artificiale visiva. Questa mossa strategica mira a divers...

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

Semco registra ricavi record nel 2025 grazie a AI e automotive

Semco ha annunciato ricavi record per il 2025, trainati in particolare dai settori dell'intelligenza artificiale e dell'automotive. L'azienda beneficia della crescente domanda di soluzioni AI e dell'espansione del mercato automobilistico.

#LLM On-Premise #DevOps
2026-01-27 The Next Web

Noora Saksa nuova CEO di Slush, evento startup europeo

Slush, l'organizzazione finlandese dietro uno dei principali eventi europei per startup, ha nominato Noora Saksa come nuovo amministratore delegato. La nomina indica un'evoluzione strategica per Slush, che punta a espandersi oltre il suo evento princ...

2026-01-27 DigiTimes

Mercato globale PCB: crescita del 13,9% prevista per il 2026

Secondo TPCA, il mercato globale dei circuiti stampati (PCB) è destinato a crescere del 13,9% entro il 2026, spinto dall'aumento della capacità produttiva legata all'intelligenza artificiale. Questa espansione riflette la crescente domanda di hardwar...

#Hardware #LLM On-Premise #Fine-Tuning
2026-01-27 DigiTimes

Ennostar potenzia la comunicazione ottica per l'AI

Ennostar sta sviluppando soluzioni avanzate di comunicazione ottica per far fronte alla crescente domanda di trasmissione dati, alimentata dalle applicazioni di intelligenza artificiale. L'azienda mira a migliorare le prestazioni e l'efficienza delle...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-27 DigiTimes

Da TV in bianco e nero a chip AI: leadership taiwanese nell'export

Un editoriale di DIGITIMES sottolinea come Taiwan continui a essere un leader nell'export di tecnicie avanzate, spostandosi dai televisori in bianco e nero ai moderni chip per l'intelligenza artificiale. La capacità di adattamento e l'innovazione cos...

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

Iluvatar CoreX sfida Nvidia Rubin con una nuova roadmap GPU

La startup cinese Iluvatar CoreX ha annunciato una roadmap di nuove GPU, con l'obiettivo di competere con la futura architettura Rubin di Nvidia. L'azienda punta a posizionarsi nel mercato in rapida crescita delle soluzioni hardware per l'intelligenz...

#Hardware #LLM On-Premise #DevOps
2026-01-27 The Register AI

La Elizabeth Line di Londra e i suoi moderni 'bork'

La Elizabeth Line, l'ultima novità nel trasporto pubblico londinese, si distingue anche per i suoi 'bork' moderni. Un commento ironico sull'evoluzione tecnicica applicata anche agli aspetti più inaspettati dell'infrastruttura urbana.

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

GlobalFoundries e MIPS sfidano Arm nell'AI automotive

MIPS, guidata dal CEO Sameer Wasson, punta a competere con Arm nel settore dell'intelligenza artificiale per il settore automotive. La competizione si concentra sull'innovazione e sull'efficienza delle architetture di calcolo per applicazioni avanzat...

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

ChatGPT apre alla pubblicità: Google resta alla finestra?

OpenAI ha recentemente introdotto pubblicità all'interno di ChatGPT. Questo solleva interrogativi sulla strategia di Google, che finora ha evitato di integrare annunci pubblicitari nei suoi modelli linguistici. L'articolo analizza le possibili ragion...

#LLM On-Premise #DevOps
2026-01-27 Anthropic News

Anthropic collabora con il governo britannico per l'AI su GOV.UK

Anthropic ha stretto una partnership con il governo del Regno Unito per integrare l'assistenza basata sull'intelligenza artificiale nei servizi GOV.UK. L'obiettivo è migliorare l'esperienza degli utenti e l'efficienza dei servizi pubblici attraverso ...

#LLM On-Premise #DevOps
2026-01-27 LocalLLaMA

Kimi-K2.5: nuovo modello linguistico open-source disponibile

È disponibile Kimi-K2.5, un nuovo modello linguistico open-source. Il modello è accessibile tramite Hugging Face. La notizia è stata diffusa tramite un post sulla piattaforma Reddit dedicato ai modelli LLM in locale.

#LLM On-Premise #DevOps
2026-01-27 ArXiv cs.CL

Valutazione dei Modelli di Ricompensa: un Nuovo Framework Competitivo

Un nuovo studio introduce Pairwise Maximum Discrepancy Competition (PMDC), un framework dinamico per valutare la generalizzazione dei modelli di ricompensa (RM) negli LLM. PMDC seleziona coppie prompt-risposta che massimizzano il disaccordo tra RM, c...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-27 ArXiv cs.CL

Crystal-KV: gestione efficiente della cache KV per LLM Chain-of-Thought

Crystal-KV è un framework per la gestione della cache Key-Value (KV) nei modelli linguistici di grandi dimensioni (LLM) che utilizzano il ragionamento Chain-of-Thought (CoT). Ottimizza l'utilizzo della cache dando priorità alle informazioni rilevanti...

#LLM On-Premise #DevOps
2026-01-27 ArXiv cs.LG

Dataset di ospedalizzazioni per dengue in Brasile (1999-2021)

Un nuovo dataset rilasciato su Zenodo offre dati armonizzati a livello municipale sulle ospedalizzazioni per dengue in Brasile dal 1999 al 2021, disaggregati a cadenza settimanale. L'obiettivo è migliorare l'accuratezza dei modelli di intelligenza ar...

#Fine-Tuning
2026-01-27 ArXiv cs.LG

TelcoAI: Ricerca avanzata nelle specifiche 3GPP con RAG multi-modale

TelcoAI è un sistema RAG (Retrieval-Augmented Generation) multi-modale progettato per la documentazione 3GPP, che include specifiche tecniche complesse per le telecomunicazioni. Utilizza chunking section-aware, query planning strutturato e fusione di...

#LLM On-Premise #DevOps #RAG
2026-01-27 LocalLLaMA

Jan v3 Instruct: modello di coding da 4B con miglioramenti del 40%

Il team di Jan ha rilasciato Jan-v3-4B-base-instruct, un modello da 4 miliardi di parametri addestrato con pre-training continuo e reinforcement learning. L'obiettivo è migliorare le capacità in attività comuni preservando le capacità generali. Il mo...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-27 DigiTimes

Corea del Sud: la nuova legge sull'IA esclude il settore manifatturiero

La nuova legislazione sull'intelligenza artificiale in Corea del Sud ha suscitato dibattiti per aver escluso il settore manifatturiero dalle sue normative principali. Questa scelta strategica solleva interrogativi sull'approccio del paese alla regola...

#LLM On-Premise #DevOps
2026-01-27 LocalLLaMA

DeepSeek-OCR-2: nuovo modello OCR open source di DeepSeek AI

DeepSeek AI ha rilasciato DeepSeek-OCR-2, un modello di riconoscimento ottico dei caratteri (OCR) open source. La notizia è stata diffusa su Reddit, con link diretto al modello disponibile su Hugging Face. Questo rilascio potrebbe favorire l'adozione...

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

Microsoft Maia 200: capacità decuplicata rispetto a Maia 100

Secondo DIGITIMES, Microsoft prevede un aumento di oltre dieci volte nella capacità dei suoi sistemi Maia 200 rispetto ai precedenti Maia 100. Questo incremento significativo suggerisce un forte impegno nell'espansione delle proprie infrastrutture di...

#LLM On-Premise #DevOps
2026-01-27 DigiTimes

Microsoft presenta il chip Maia 200 per l'IA: produzione di massa in arrivo

Microsoft ha annunciato Maia 200, un nuovo chip progettato specificamente per carichi di lavoro di intelligenza artificiale. L'azienda sta procedendo verso la produzione di massa, segnando un passo significativo nel suo impegno verso l'innovazione ha...

#Hardware #LLM On-Premise #DevOps
2026-01-27 DigiTimes

Amazon: Intelligenza Artificiale onnipresente entro il 2026

Secondo DIGITIMES, Amazon prevede che le applicazioni di intelligenza artificiale saranno pervasiva entro il 2026. Questo cambiamento avrà un impatto significativo su vari settori, trasformando il modo in cui le aziende operano e interagiscono con i ...

#LLM On-Premise #DevOps
2026-01-27 TechCrunch AI

Qualcomm supporta SpotDraft: AI contrattuale on-device in crescita

SpotDraft, specializzata in AI per la gestione contrattuale, riceve il supporto di Qualcomm. La società elabora annualmente oltre un milione di contratti tramite la sua piattaforma AI, registrando una crescita del 173% su base annua. L'azienda punta ...

#LLM On-Premise #DevOps
2026-01-27 LocalLLaMA

Kimi K2.5: Nuovo modello linguistico in fase di test

È stata rilasciata una nuova versione del modello linguistico Kimi, denominata K2.5. Al momento, la disponibilità è limitata al sito web ufficiale e non ci sono ancora comunicazioni ufficiali, suggerendo che il modello sia ancora in fase di test. La ...

#LLM On-Premise #DevOps
2026-01-27 LocalLLaMA

Falla nella supply chain di skill AI: sviluppatori esposti

Un ricercatore ha dimostrato come sia possibile sfruttare vulnerabilità nelle piattaforme di condivisione di skill per modelli AI, iniettando codice malevolo ed eseguendolo sulle macchine degli sviluppatori. L'attacco, seppur simulato, evidenzia risc...

#LLM On-Premise #DevOps
2026-01-26 DigiTimes

Alibaba DAMO Academy: chip AI proprietari per T-Head Semiconductor

La DAMO Academy di Alibaba guida lo sviluppo di chip AI custom per T-Head Semiconductor. Questo sforzo sottolinea l'impegno di Alibaba nell'innovazione hardware per supportare le proprie esigenze di intelligenza artificiale.

#Hardware #LLM On-Premise #DevOps
2026-01-26 DigiTimes

Taiwan punta al quantum computing industriale entro 5 anni

Taiwan mira a sviluppare capacità di quantum computing di livello industriale nei prossimi cinque anni. L'iniziativa, riportata da DIGITIMES, sottolinea l'importanza strategica del quantum computing per il futuro tecnicico del paese.

2026-01-26 DigiTimes

Intelligenza Artificiale mette alla prova la rete elettrica di Taiwan

L'aumento della domanda energetica legata all'intelligenza artificiale sta mettendo sotto pressione la rete elettrica di Taiwan, in un contesto globale di scarsità di turbine a gas e trasformatori. La resilienza dell'infrastruttura è cruciale per sos...

#LLM On-Premise #DevOps
2026-01-26 OpenAI Blog

Indeed: l'AI trasforma la ricerca di lavoro e l'acquisizione di talenti

Maggie Hulce, CRO di Indeed, spiega come l'intelligenza artificiale stia rivoluzionando la ricerca di lavoro, il reclutamento e l'acquisizione di talenti sia per i datori di lavoro che per chi cerca lavoro. L'AI sta ottimizzando i processi, rendendol...

#LLM On-Premise #DevOps
2026-01-26 Tom's Hardware

Nvidia investe altri 2 miliardi di dollari in CoreWeave

Nvidia aumenta la sua partecipazione in CoreWeave, fornitore di infrastrutture AI, con un investimento di 2 miliardi di dollari. La decisione riflette la fiducia di Nvidia nella crescita e nella gestione di CoreWeave, consolidando ulteriormente la pa...

#Hardware
2026-01-26 Ars Technica AI

OpenAI svela i dettagli tecnici del suo agente di sviluppo codice AI

OpenAI ha pubblicato un'analisi tecnica dettagliata del funzionamento interno di Codex CLI, il suo agente AI per lo sviluppo di codice. La pubblicazione offre agli sviluppatori informazioni utili sugli strumenti di AI coding, capaci di scrivere codic...

2026-01-26 TechCrunch AI

YouTuber contro Snap: violazione di copyright nell'addestramento AI?

Alcuni YouTuber hanno intentato una causa contro Snap, accusando l'azienda di aver utilizzato dataset protetti da copyright, originariamente destinati alla ricerca accademica, per addestrare i propri modelli di intelligenza artificiale. La disputa so...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-26 The Register AI

TrapC: un linguaggio C memory-safe sviluppato con Claude

Robin Rowe presenta TrapC, un'estensione memory-safe del linguaggio C, sviluppata con l'ausilio del modello linguistico Claude. Il progetto è quasi pronto per la fase di testing. L'articolo esplora le implicazioni dell'intelligenza artificiale nello ...

2026-01-26 LocalLLaMA

Prompt injection: LLM locale compromesso via email

Un ricercatore ha dimostrato come un singolo messaggio di posta elettronica, contenente un prompt injection mascherato, possa indurre un LLM locale (ClawdBot) a esfiltrare dati sensibili. L'attacco, che non sfrutta vulnerabilità software, evidenzia i...

#LLM On-Premise #DevOps
2026-01-26 TechCrunch AI

Obvious Ventures punta su salute planetaria e raccoglie 360 milioni

La società di venture capital Obvious Ventures ha annunciato la chiusura del suo quinto fondo, raccogliendo 360,360,360 dollari. Il fondo si concentrerà su investimenti in aziende che mirano a migliorare la salute planetaria, umana ed economica.

2026-01-26 TechCrunch AI

Anthropic integra app interattive in Claude, inclusa Slack

Anthropic ha annunciato l'integrazione di app interattive all'interno dell'interfaccia del chatbot Claude. Tra le prime integrazioni, spicca quella con Slack e altri strumenti per la collaborazione aziendale, aprendo nuove possibilità di utilizzo del...

#LLM On-Premise #DevOps
2026-01-26 The Register AI

Adozione dell'AI al lavoro: crescita piatta nel Q4, secondo Gallup

Secondo un sondaggio di Gallup, l'adozione dell'intelligenza artificiale sul posto di lavoro si è arrestata nel quarto trimestre del 2025. Tuttavia, chi ha già iniziato a utilizzarla ne fa un uso sempre maggiore. Gli utenti frequenti di AI rimangono ...

#LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

Orchestrazione multi-agente per Claude Code: un "alveare pensante"

Un tecnico ha sviluppato un sistema multi-agente per Claude Code, composto da sette agenti specializzati che condividono memoria persistente e comunicano tra loro. L'obiettivo è simulare una collaborazione più intelligente e contestualizzata nello sv...

#LLM On-Premise
2026-01-26 LocalLLaMA

SSD da 2TB a prezzo stracciato: l'affare si fa al Walmart!

Un utente di Reddit ha scovato un SSD da 2TB a un prezzo incredibilmente basso in un Walmart locale. La scoperta sottolinea come, a volte, si possano trovare componenti hardware a prezzi vantaggiosi nei canali di distribuzione meno convenzionali. Un'...

#Hardware #LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

Transformers v5: Nuova release stabile con boost prestazionale

Hugging Face ha rilasciato la versione stabile 5 di Transformers, focalizzata su performance migliorate (in particolare per Mixture-of-Experts), API semplificate per i tokenizer e caricamento dinamico dei pesi. Disponibile una guida alla migrazione p...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-26 The Register AI

L'AI per risolvere i downtime di sistema: una nuova frontiera?

Un guasto improvviso ai sistemi nel cuore della notte può scatenare il panico. Ma cosa succederebbe se l'intelligenza artificiale potesse intervenire per diagnosticare e risolvere i problemi prima che si manifestino, riducendo i tempi di inattività e...

#LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

Qwen3-Max-Thinking: Spingendosi oltre i limiti

Una discussione su Reddit analizza le capacità del modello linguistico Qwen3-Max-Thinking, esplorandone le potenzialità e i limiti. La comunità di LocalLLaMA si interroga sulle performance e sulle possibili applicazioni del modello, con un focus sull...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-26 TechCrunch AI

Microsoft presenta Maia 200, chip per inference AI ad alta efficienza

Microsoft ha annunciato Maia 200, un nuovo chip progettato per scalare l'inference AI. Questo processore, successore del Maia 100 del 2023, è ottimizzato per eseguire modelli di intelligenza artificiale complessi con maggiore velocità ed efficienza. ...

#Hardware #LLM On-Premise #DevOps
2026-01-26 TechCrunch AI

Nvidia investe 2 miliardi di dollari in CoreWeave per il calcolo AI

Nvidia investirà 2 miliardi di dollari in CoreWeave, società specializzata in infrastrutture per il calcolo accelerato, con l'obiettivo di supportare l'espansione della sua capacità di calcolo per l'intelligenza artificiale di 5 GW. L'accordo prevede...

#Hardware #LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

Benchmarking di GPU Tesla usate per LLM locali: analisi VRAM

Un utente di Reddit sta conducendo un benchmark su GPU Tesla di seconda mano, dotate di elevata VRAM, per valutare le loro prestazioni in configurazioni parallele per LLM locali. L'obiettivo è confrontare queste schede economiche con soluzioni più mo...

#Hardware #LLM On-Premise #DevOps
2026-01-26 404 Media

L'uso distorto dell'AI per diffamare figure controverse

L'articolo analizza come figure influenti di destra stiano sfruttando l'intelligenza artificiale per creare meme denigratori nei confronti di persone diventate simbolo di movimenti di protesta. Questo fenomeno, accelerato dalla diffusione di AI gener...

2026-01-26 Tom's Hardware

Neurophos: chip fotonico 10.000 volte più piccolo

La startup Neurophos, supportata da Bill Gates, ha sviluppato un chip di fotonica al silicio che promette prestazioni superiori alle GPU Nvidia Vera Rubin, consumando la stessa energia. La tecnicia vanta dimensioni ridotte di 10.000 volte rispetto al...

#Hardware #LLM On-Premise #DevOps
2026-01-26 AI News

Formula E: AI Google Cloud per obiettivi net-zero

La Formula E sfrutta l'intelligenza artificiale di Google Cloud per raggiungere i suoi obiettivi net-zero, ottimizzando la logistica globale e le operazioni commerciali. L'accordo pluriennale prevede l'integrazione dei modelli Gemini per l'analisi de...

2026-01-26 Ars Technica AI

UE indaga xAI per deepfake a sfondo sessuale generati da Grok

L'Unione Europea ha avviato un'indagine formale su xAI, la società di Elon Musk, in seguito alla diffusione di immagini deepfake a sfondo sessuale, anche minorile, generate dal suo chatbot Grok. L'indagine mira a valutare se xAI abbia adottato misure...

#LLM On-Premise #DevOps
2026-01-26 Phoronix

Linux: patch per abilitare/disabilitare VT al boot

Una patch proposta per il kernel Linux consentirebbe di abilitare o disabilitare il supporto VT (Virtual Terminal) al momento dell'avvio del sistema. Attualmente, questa opzione è configurabile solo in fase di compilazione del kernel.

#LLM On-Premise #DevOps
2026-01-26 Tom's Hardware

Asus Zenbook Duo (2026): OLED e potenza Intel per la mobilità

Asus rinnova il suo Zenbook Duo nel 2026 con un processore Intel Core Ultra X9 388H. Il portatile si distingue per i suoi due schermi OLED e una sezione grafica integrata ad alte prestazioni, promettendo un'esperienza visiva di alto livello in mobili...

#Hardware
2026-01-26 Tom's Hardware

Xi Jinping spinge sull'AI: focus sulla tecnicia nazionale

Il leader cinese Xi Jinping ha sottolineato l'importanza di far progredire l'intelligenza artificiale durante il suo primo incontro formale del 2026 con i ministri. L'enfasi è posta sullo sviluppo di tecnicie AI interne, paragonando l'impatto potenzi...

#Hardware #LLM On-Premise #DevOps
2026-01-26 Phoronix

AMD GFX13: il target iniziale è stato integrato in LLVM 23 (RDNA5?)

Il codice per il target AMDGPU GFX13, presumibilmente legato all'architettura RDNA5 di prossima generazione, è stato aggiunto al repository Git di LLVM 23. Questo aggiornamento rappresenta un passo preliminare verso il supporto del nuovo hardware nei...

#Hardware #LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

Minimax M2.2 in arrivo: Febbraio denso per i laboratori cinesi

Il mese di febbraio si preannuncia ricco di novità nel panorama dell'intelligenza artificiale cinese. Oltre ai già annunciati Deepseek v4 e Kimi K3, anche Minimax starebbe per rilasciare il modello M2.2. Si vocifera inoltre di un modello proprietario...

2026-01-26 Tech.eu

Footprint Firm lancia fondo deeptech Article 9 da 76 milioni

Footprint Firm ha annunciato la chiusura finale di Footprint Fund I, un fondo di venture capital Article 9 da 76 milioni di euro. Il fondo si concentra su aziende deeptech in fase iniziale attive nella transizione ecologica nel Nord Europa, con inves...

#LLM On-Premise #DevOps
2026-01-26 The Register AI

Windows 11: Problemi di avvio dopo gli aggiornamenti di gennaio

Microsoft sta indagando su segnalazioni di problemi di avvio su macchine Windows 11 dopo l'installazione degli aggiornamenti di sicurezza di gennaio. Alcuni sistemi rimangono bloccati in un ciclo di riavvio, richiedendo un'ulteriore analisi da parte ...

#Hardware #LLM On-Premise #DevOps
2026-01-26 The Register AI

Browser AI-generated: realtà o speculazione?

L'affermazione di Cursor di aver sviluppato un browser quasi interamente con agenti AI ha sollevato dubbi. L'articolo invita a verificare attentamente le affermazioni prima di accettarle come verità, sottolineando che la generazione di codice è solo ...

#LLM On-Premise #DevOps
2026-01-26 The Register AI

Oltre il browser: costruire un web più libero e decentralizzato

L'articolo esplora l'idea di un internet più libero e decentralizzato, basato su protocolli aperti e codice open source. Si discute come i servizi centralizzati e le normative attuali limitino questa libertà originaria, e si suggerisce di costruire a...

2026-01-26 Tom's Hardware

Ridimensionata The Line, la megacittà saudita punta sull'AI?

Il progetto The Line, l'ambiziosa megacittà lineare in Arabia Saudita, sembra ridimensionato. Nuove indiscrezioni suggeriscono un cambio di destinazione d'uso, con un focus su data center per l'intelligenza artificiale. Prevista inizialmente per 9 mi...

#LLM On-Premise #DevOps
2026-01-26 Tech.eu

Synthesia: valutazione raddoppiata a 4 miliardi di dollari

La startup britannica Synthesia, specializzata in video aziendali basati su intelligenza artificiale, ha quasi raddoppiato la sua valutazione a 4 miliardi di dollari in un anno. Un nuovo round di finanziamento da 200 milioni di dollari, guidato da Go...

#Hardware #LLM On-Premise #DevOps
2026-01-26 Phoronix

Linux: nuove patch per ottimizzare l'uso della memoria swap

Una nuova serie di patch per il kernel Linux, sviluppata da Kairui Song di Tencent, mira a migliorare la gestione della memoria swap. Le modifiche promettono un risparmio di memoria e un leggero incremento delle performance del sistema.

2026-01-26 The Register AI

Oracle AI a bordo dell'ammiraglia HMS Prince of Wales tramite edge cloud

La Royal Navy britannica utilizza l'infrastruttura edge di Oracle Cloud per gestire sistemi di difesa basati su intelligenza artificiale sulla portaerei HMS Prince of Wales. La piattaforma, definita "sovrana", supporta il processo decisionale e l'app...

#LLM On-Premise #DevOps
2026-01-26 AI News

Modernizzare le app triplica i ritorni sugli investimenti in AI

Secondo un report di Cloudflare, le aziende che hanno modernizzato le proprie applicazioni hanno quasi tre volte più probabilità di ottenere un ritorno sugli investimenti in AI. Il report sottolinea come la modernizzazione delle applicazioni sia un f...

#LLM On-Premise #DevOps
2026-01-26 DigiTimes

Kenmec punta sull'AI con quattro motori di crescita

Kenmec Mechanical Engineering identifica quattro aree strategiche per la crescita futura, con un focus sull'integrazione di soluzioni di intelligenza artificiale. L'azienda mira a espandere la propria presenza nel mercato AI attraverso investimenti m...

#LLM On-Premise #DevOps
2026-01-26 DigiTimes

TAISIC si concentra su substrati SiC di fascia alta

Il produttore di materiali TAISIC Materials sta riorientando la propria attività verso la produzione di substrati in carburo di silicio (SiC) di fascia alta. La decisione strategica mira a capitalizzare la crescente domanda di materiali avanzati nel ...

2026-01-26 DigiTimes

Nvidia, Arm e Qualcomm: strategie per gli ASIC AI

Secondo DIGITIMES, Nvidia, Arm e Qualcomm stanno definendo strategie specifiche per lo sviluppo di Application-Specific Integrated Circuits (ASIC) dedicati all'intelligenza artificiale. L'articolo analizza le diverse direzioni intraprese dai tre colo...

#Hardware #LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

Chatbot AI sostituiscono il supporto clienti: un'arma a doppio taglio?

Le aziende stanno sempre più spesso sostituendo il personale di supporto clienti con chatbot basati su intelligenza artificiale, spesso con risultati insoddisfacenti. Un utente condivide esperienze negative con Ebay e Payoneer, evidenziando risposte ...

#LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

Proteste per donazione a MAGA: utenti abbandonano ChatGPT

La decisione del COO di OpenAI di donare ingenti somme a MAGA, Inc. ha scatenato una reazione negativa tra gli utenti di ChatGPT. Molti abbonati hanno annunciato la cancellazione dei loro account premium in segno di protesta, sollevando interrogativi...

#LLM On-Premise #DevOps
2026-01-26 Tech.eu

Kime raccoglie 2 milioni di euro per l'ottimizzazione AI

La startup Kime, con sede a Copenaghen, ha ottenuto 2 milioni di euro in finanziamenti pre-seed per sviluppare una piattaforma di analisi che traccia la visibilità dei marchi all'interno delle risposte generate da sistemi di intelligenza artificiale....

#LLM On-Premise #DevOps
2026-01-26 TechCrunch AI

Synthesia raggiunge valutazione di 4 miliardi di dollari

La startup britannica Synthesia, specializzata in piattaforme AI per la creazione di video di formazione interattivi, ha raccolto 200 milioni di dollari in un round di finanziamento di Serie E. L'operazione porta la sua valutazione a 4 miliardi di do...

#LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

Reflow Studio: workstation locale per voice cloning e lip sync

Reflow Studio v0.5 è una workstation locale e portabile per il neural dubbing, che integra RVC (voice cloning), Wav2Lip (lip sync) e GFPGAN (face enhancement). Non richiede installazione di Python e offre un'interfaccia a tema Cyberpunk per un'esperi...

#LLM On-Premise #DevOps
2026-01-26 The Register AI

Red Teaming per l'AI: la chiave per una conformità sicura

Il red teaming emerge come pratica fondamentale per proteggere i sistemi di intelligenza artificiale, specialmente nell'era dell'AI agentica, dove sistemi multi-LLM prendono decisioni autonome. La trasparenza nello sviluppo e nel deployment dell'AI è...

#LLM On-Premise #DevOps
2026-01-26 Tech.eu

Orbital raccoglie 60 milioni di dollari per l'AI nel diritto immobiliare

Orbital, una piattaforma AI specializzata nel diritto immobiliare, ha ottenuto 60 milioni di dollari in un round di finanziamento di Serie B. L'obiettivo è espandere la propria presenza negli Stati Uniti e nel Regno Unito, sviluppando ulteriormente l...

#LLM On-Premise #DevOps
2026-01-26 DigiTimes

Pegatron prevede un boom dei server AI nel 2026

Il presidente di Pegatron prevede una forte crescita del mercato dei server AI a partire dal 2026. L'azienda punta a capitalizzare sull'aumento della domanda di infrastrutture per l'intelligenza artificiale.

#LLM On-Premise #DevOps
2026-01-26 ArXiv cs.AI

Affidabilità degli agenti LLM: un framework diagnostico

Un nuovo framework diagnostico valuta l'affidabilità degli agenti LLM multi-agente nell'automazione aziendale, con focus su implementazioni in ambienti con stringenti requisiti di privacy. La ricerca analizza diverse architetture hardware e modelli, ...

#Hardware
2026-01-26 ArXiv cs.CL

M3Kang: Testare il ragionamento matematico multilingue nei modelli VLM

Presentato M3Kang, un nuovo dataset multilingue per valutare le capacità di ragionamento matematico multimodale dei modelli vision-language (VLM). Derivato dalla competizione Kangaroo Math, include problemi tradotti in 108 lingue, con benchmark su mo...

#Fine-Tuning
2026-01-26 ArXiv cs.CL

Valutazione di LLM in scenari di code-mixing cinese-inglese

Presentato ChiEngMixBench, un nuovo benchmark per valutare le capacità di code-mixing (cinese-inglese) dei modelli linguistici di grandi dimensioni (LLM) in contesti comunicativi reali. Il benchmark analizza la spontaneità e la naturalezza del lingua...

#LLM On-Premise #Fine-Tuning #DevOps
2026-01-26 ArXiv cs.LG

Fitbit e salute mentale: studio su studenti durante la pandemia

Una ricerca ha analizzato i dati raccolti tramite dispositivi Fitbit per valutare lo stato di salute mentale degli studenti durante la pandemia. I risultati indicano che parametri fisiologici come frequenza cardiaca e qualità del sonno possono essere...

#Fine-Tuning
2026-01-26 ArXiv cs.LG

Scoperta causale: nuovo metodo per dati discreti

Un nuovo studio introduce un approccio basato su score matching generalizzato per identificare relazioni causali in dati discreti. Il metodo, che si concentra sull'individuazione dell'ordine topologico dei grafi aciclici diretti (DAG), promette di mi...

2026-01-26 DigiTimes

Sviluppo AI: nel 2026 focus sull'impatto reale

Nel 2026, lo sviluppo dell'intelligenza artificiale si sposterà verso applicazioni concrete e risultati tangibili. Questo cambiamento di direzione indica una fase di riequilibrio del settore, con una maggiore attenzione all'efficacia e all'integrazio...

#LLM On-Premise #DevOps
2026-01-26 DigiTimes

Applicazioni IT: potenziale adozione di OLED DDI, ma aggiornamenti lenti

Secondo DIGITIMES, le applicazioni IT mostrano un potenziale di adozione per i driver di display OLED (DDI). Tuttavia, il ritmo di aggiornamento rimane lento. L'articolo analizza le dinamiche del mercato e i fattori che influenzano l'adozione di ques...

#LLM On-Premise #DevOps
2026-01-26 DigiTimes

Foxconn leader nella produzione di server AI grazie ad Apple

Secondo DIGITIMES, Foxconn si conferma leader nella produzione di server per l'intelligenza artificiale, beneficiando anche della forte domanda da parte di Apple. La competizione nel settore rimane elevata, con altri produttori che cercano di guadagn...

#LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

Nvidia DGX Spark GB10 vinta a un hackathon: e ora?

Un utente ha vinto una workstation Dell DGX Spark GB10 a un hackathon Nvidia e chiede consigli su come utilizzarla al meglio. In precedenza, la usava per l'inference di un modello Nemotron 30B con vLLM, che richiedeva oltre 100 GB di memoria. Ora cer...

#Hardware #LLM On-Premise #DevOps
2026-01-26 LocalLLaMA

AutoGen: inference accelerata con Speculative Reasoning Execution

Un ingegnere ha ottimizzato il loop di ragionamento di Microsoft AutoGen, riducendo la latenza dell'agente dell'85% tramite Speculative Reasoning Execution (SRE). Il modulo, in fase di approvazione, prevede "tool calls" in parallelo all'inference LLM...

#Hardware #Fine-Tuning
2026-01-26 DigiTimes

Rimodulazioni strategiche e limiti di scalabilità: la settimana in breve

Panoramica settimanale sulle principali tendenze nel settore dell'intelligenza artificiale, con un focus particolare sulle modifiche nelle strategie aziendali, gli adeguamenti nelle catene di approvvigionamento e le sfide legate alla scalabilità dell...

#LLM On-Premise #DevOps
2026-01-26 Phoronix

Aggiornamenti per le librerie X.Org: Release previste per il 2026

Mentre si attendono sviluppi sul futuro di X.Org Server e un possibile rilascio della versione 26.1, diverse librerie X.Org hanno ricevuto nuovi aggiornamenti minori. Queste release si concentrano principalmente su correzioni di build e piccoli migli...

2026-01-26 DigiTimes

Pegatron prevede crescita a tripla cifra per i server AI nel 2026

Pegatron stima una crescita significativa nel mercato dei server AI entro il 2026, puntando anche sulle opportunità offerte dai chip ASIC. L'azienda si prepara ad espandere la propria presenza nel settore dell'intelligenza artificiale.

#Hardware #LLM On-Premise #DevOps
2026-01-26 DigiTimes

Pegatron punta su server AI e automotive per crescere

Pegatron, malgrado le sfide del mercato, punta a una crescita significativa nei settori dei server per intelligenza artificiale e dell'automotive. L'azienda taiwanese prevede di espandere la propria presenza in questi mercati strategici per compensar...

#LLM On-Premise #DevOps
2026-01-26 DigiTimes

Apple punta sull'AI: Federighi alla guida, si guarda a Gemini

Apple riorganizza la sua strategia sull'intelligenza artificiale, affidando a Craig Federighi la guida del settore. La mossa suggerisce un'apertura verso modelli esterni come Google Gemini, in un contesto di crescente competizione nel campo dell'AI g...

#LLM On-Premise #DevOps
2026-01-25 DigiTimes

Nvidia stringe i margini: inizia la guerra dei server ASIC

Secondo DIGITIMES, il mercato dei server basati su ASIC sta per entrare in una fase di competizione più intensa, con Nvidia che esercita pressione sui margini di profitto. Questo potrebbe portare a nuove dinamiche nel settore dell'hardware per l'inte...

#Hardware #LLM On-Premise #DevOps
2026-01-25 DigiTimes

iPhone 17: domanda elevata mette sotto pressione i fornitori taiwanesi

La forte domanda per i modelli di fascia alta di iPhone 17 sta mettendo a dura prova le catene di approvvigionamento dei fornitori taiwanesi. I vettori faticano a soddisfare gli ordini iniziali, segno di un rinnovato interesse per i dispositivi premi...

#LLM On-Premise
2026-01-25 DigiTimes

Micro LED di Ennostar per raffreddare i server AI

Ennostar punta sui Micro LED per risolvere i problemi di surriscaldamento all'interno dei server AI. La tecnicia potrebbe migliorare l'efficienza e l'affidabilità dei sistemi di raffreddamento, cruciali per le prestazioni dei carichi di lavoro di int...

#Hardware #LLM On-Premise #DevOps
2026-01-25 DigiTimes

Tesla punta alla produzione di massa di robot umanoidi nel 2026

Tesla accelera i piani per la produzione di massa di robot umanoidi, con l'obiettivo di un lancio nel 2026. L'iniziativa potrebbe segnare una svolta nel settore della robotica, aprendo nuove prospettive per l'automazione e l'interazione uomo-macchina...

#LLM On-Premise #DevOps
2026-01-25 TechCrunch AI

ChatGPT pesca risposte da Grokipedia di Elon Musk

ChatGPT sta integrando nei risultati di ricerca informazioni provenienti da Grokipedia, l'enciclopedia generata tramite intelligenza artificiale e sviluppata da xAI, la società di Elon Musk. Questo solleva interrogativi sulla provenienza e l'affidabi...

#LLM On-Premise #DevOps
2026-01-25 TechCrunch AI

Humans&: nuovi modelli fondazionali per la collaborazione AI

La startup Humans&, fondata da ex dipendenti di Anthropic, Meta, OpenAI, xAI e Google DeepMind, sta sviluppando modelli fondazionali di nuova generazione focalizzati sulla collaborazione, superando il tradizionale approccio basato sulla chat.

#LLM On-Premise #DevOps
2026-01-25 TechCrunch AI

Fantascienza e Comic-Con prendono posizione contro l'IA generativa

Importanti figure della fantascienza e della cultura pop stanno adottando posizioni più ferme contro l'IA generativa. L'articolo esplora come queste comunità stanno reagendo all'avanzata dell'intelligenza artificiale e quali implicazioni ciò potrebbe...

#LLM On-Premise #DevOps
2026-01-25 LocalLLaMA

GLM-4.7-Flash: prestazioni ulteriormente migliorate

Una discussione su Reddit mette in evidenza i miglioramenti di velocità ottenuti con GLM-4.7-Flash, un modello linguistico di grandi dimensioni. I dettagli tecnici specifici e i risultati dei benchmark sono disponibili tramite un link a GitHub, offre...

#LLM On-Premise #DevOps
2026-01-25 LocalLLaMA

GLM-4.7-Flash: calo di performance con contesti ampi?

Un utente ha segnalato un calo di performance nel modello GLM-4.7-Flash all'aumentare della lunghezza del contesto. I benchmark mostrano una diminuzione dei token al secondo (t/s) passando da contesti brevi a contesti più estesi, suggerendo un possib...

#Hardware
2026-01-25 The Next Web

UE: società uniche per startup e stop agli impianti "a rischio"

L'Unione Europea accelera sull'innovazione: nasce "EU Inc", una struttura legale unificata per le startup. Contestualmente, si punta a eliminare i fornitori tecnicici considerati "ad alto rischio" dalle infrastrutture critiche. Misure che puntano a r...

2026-01-25 Phoronix

AMD: in arrivo correzioni ai driver grafici per Linux 7.0

AMD ha in programma il rilascio di una serie di correzioni ai driver grafici open source AMDGPU e AMDKFD. Queste modifiche sono state accodate in vista della prossima finestra di integrazione del kernel Linux 7.0 e mirano a migliorare la stabilità e ...

#Hardware
2026-01-25 TechCrunch AI

Siri potenziata da Gemini: Apple svela la novità a febbraio?

Indiscrezioni suggeriscono che Apple potrebbe presentare a febbraio la nuova versione del suo assistente vocale Siri, basata sull'intelligenza artificiale Gemini di Google. Questa mossa segnerebbe un punto di svolta per Siri, da tempo criticata per l...

2026-01-25 LocalLLaMA

Iran: blackout internet e modelli linguistici locali come alternativa

In Iran, un prolungato blackout di internet, iniziato oltre 400 ore fa a causa di proteste, ha portato a severe restrizioni sull'accesso online. Solo pochi siti, tra cui Google e ChatGPT, sono stati inseriti in whitelist. In questo scenario, i modell...

#Hardware
2026-01-25 LocalLLaMA

Idee di coding open source per l'ingegneria assistita da IA

Un utente di Reddit cerca consigli per strutturare una guida per sviluppatori, dai principianti ai veterani, interessati all'ingegneria assistita dall'intelligenza artificiale. L'obiettivo è creare un ambiente di apprendimento collaborativo e identif...

2026-01-25 LocalLLaMA

TrustifAI: un framework per valutare l'affidabilità delle risposte AI

TrustifAI è un nuovo framework progettato per quantificare e spiegare l'affidabilità delle risposte generate dai modelli di linguaggio (LLM). Anziché un semplice punteggio di correttezza, TrustifAI calcola un 'Trust Score' multidimensionale, basato s...

#RAG
2026-01-25 The Register AI

Emmabuntüs DE 6: la distro Linux etica per i neofiti

Emmabuntüs DE 6 è una distribuzione Linux pensata per chi si avvicina per la prima volta al mondo del software libero. Punta a ridurre i rifiuti elettronici e supporta iniziative di beneficenza, offrendo documentazione chiara e strumenti accessibili.

2026-01-25 LocalLLaMA

GLM 4.7 Flash: ottimizzazione della cache KV per contesti più lunghi

Una nuova ottimizzazione per GLM 4.7 Flash riduce l'utilizzo di VRAM della cache KV. La modifica, che consiste nella rimozione di 'Air', permette di gestire contesti molto più lunghi con la stessa configurazione hardware, risparmiando gigabyte di mem...

#Hardware
2026-01-25 LocalLLaMA

Modding estremo: RTX 4090 potenziata a 48 GB di memoria

Un appassionato ha pubblicato una guida dettagliata per aumentare la memoria di una RTX 4090 fino a 48 GB. La procedura, che richiede competenze avanzate di saldatura e conoscenza approfondita dell'hardware, è documentata in un video e suscita intere...

#Hardware
2026-01-25 LocalLLaMA

SOSM: un'alternativa open source ai Transformer basata su grafi

Un ricercatore ha rilasciato in open source il progetto Self-Organizing State Model (SOSM), un'architettura di modello linguistico che esplora alternative all'attenzione dei Transformer standard. SOSM utilizza routing basato su grafi, separa la rappr...

2026-01-25 Tom's Hardware

ChatGPT pesca dati da contenuti generati da IA: un loop ricorsivo?

ChatGPT è stato scoperto mentre cita Grokipedia nelle sue risposte, innescando un potenziale loop ricorsivo. Questo comportamento rischia di diffondere informazioni errate o allucinate, sollevando preoccupazioni sulla qualità e l'affidabilità delle r...

2026-01-25 LocalLLaMA

Zerotap: l'app Android che vuole controllare il tuo telefono con l'AI

Gli sviluppatori di Zerotap, un'app Android che permette all'AI di interagire con il telefono come farebbe un umano, chiedono feedback agli utenti. L'app supporta Ollama e modelli come OpenAI e Gemini. Tra le funzionalità in cantiere: connessione a s...

#LLM On-Premise
2026-01-25 Tom's Hardware

RTX 2080 Ti: modding estremo la trasforma in Titan RTX da 900W

Un appassionato di modding ha trasformato una scheda grafica RTX 2080 Ti Hall of Fame in una Titan RTX potenziata. L'intervento ha previsto la sostituzione del core e l'aggiunta di 24 GB di memoria GDDR6, oltre a una modifica per spingere il limite d...

#Hardware
2026-01-25 LocalLLaMA

Moondream3: che fine ha fatto il promettente modello visuale?

Il modello visuale Moondream3, presentato l'anno scorso, sembra essere sparito dai radar. Nonostante una versione MLX sia disponibile, mancano implementazioni Llama.cpp e aggiornamenti pubblici. La comunità si interroga sul futuro di questo prometten...

#LLM On-Premise
2026-01-25 Phoronix

Kernel Linux: piano di continuità se il Git di Torvalds sparisse

Nel kernel Linux 6.19 è stata inclusa la documentazione relativa alla continuità del progetto. Questa definisce le procedure da seguire qualora il repository Git ufficiale di Linus Torvalds diventasse inaccessibile, garantendo la prosecuzione dello s...

2026-01-25 Phoronix

Focusrite Forte: supporto Linux 7.0 per l'interfaccia audio USB

L'interfaccia audio USB Focusrite Forte, soluzione portatile per la registrazione audio (2-in, 4-out), sarà supportata dal kernel Linux 7.0. Le patch necessarie sono in coda nell'albero di sviluppo del sottosistema audio del kernel Linux. Il disposit...

#Hardware
2026-01-25 Phoronix

Qualcomm: supporto display e grafica migliorano con Linux 7.0

Rob Clark ha inviato gli ultimi aggiornamenti del driver kernel MSM DRM per i miglioramenti di display e grafica Qualcomm, in vista della finestra di integrazione di Linux 7.0 del prossimo mese. Tra le novità, spicca il supporto per Snapdragon 8 Elit...

#Hardware
2026-01-25 Tech in Asia

CEO di Nvidia in Cina, incertezza sul chip H200

Il CEO di Nvidia si è recato in Cina mentre l'azienda attende l'approvazione di Pechino per vendere il suo chip H200 per l'intelligenza artificiale. La vendita è stata autorizzata dagli Stati Uniti, ma resta l'incognita delle dogane cinesi. La mossa ...

#Hardware
2026-01-25 Tech in Asia

Corea del Sud nega favoritismi nell'indagine su Coupang

Il primo ministro sudcoreano Kim Min-seok ha respinto le accuse di discriminazione nei confronti delle aziende statunitensi, inclusa la società di e-commerce Coupang, nel contesto di un'indagine in corso. Il governo ribadisce la sua imparzialità vers...

2026-01-25 Tech in Asia

Taiwan: AI e Big Data trainano l'innovazione nelle startup

Un recente studio di Taiwan rivela che oltre l'80% delle startup locali concentra le proprie attività sull'intelligenza artificiale e sui big data. Questo dato sottolinea come queste tecnicie stiano diventando sempre più centrali per le nuove imprese...

2026-01-25 LocalLLaMA

Qwen 3 VL: distillare il ragionamento visivo di Gemini 3 Flash

Un utente sta lavorando a una pipeline di dati sintetici per modelli image-to-image ad alta precisione. L'obiettivo è trasferire le capacità di ragionamento visivo di Gemini 3 Flash nel modello open source Qwen 3 VL 32B, per ottenere un motore locale...

#Fine-Tuning
2026-01-25 LocalLLaMA

Stable-DiffCoder: nuovo LLM per codice basato su Seed-Coder

È stato presentato Stable-DiffCoder, un nuovo modello linguistico di grandi dimensioni (LLM) specializzato nella generazione di codice. Costruito a partire dal modello Seed-Coder, Stable-DiffCoder utilizza tecniche di diffusione per migliorare la qua...

2026-01-25 Phoronix

GIMP 3.0.8 disponibile: un'anticipazione della versione 3.2

È stata rilasciata la versione 3.0.8 di GIMP, un aggiornamento che potrebbe rappresentare l'ultima serie di correzioni di bug per la serie 3.0. Questa release arriva in un momento in cui si attende l'imminente rilascio di GIMP 3.2, la prossima versio...

2026-01-25 DigiTimes

Singapore investe 786 milioni di dollari per la sovranità nell'IA

Singapore punta a rafforzare la propria indipendenza tecnicica nel campo dell'intelligenza artificiale, stanziando 786 milioni di dollari. L'obiettivo è promuovere lo sviluppo di capacità locali e ridurre la dipendenza da fornitori esteri, in un sett...

2026-01-25 DigiTimes

Nvidia cala in Cina: rivali locali guadagnano terreno nell'AI

La quota di mercato di Nvidia nel settore dei chip per l'intelligenza artificiale in Cina è scesa all'8%. I produttori cinesi stanno aumentando la produzione e guadagnando quote di mercato, erodendo il dominio precedentemente detenuto dall'azienda st...

#Hardware
2026-01-25 DigiTimes

Auto e robotica: le case automobilistiche puntano su IA e wearable

Le case automobilistiche ampliano i loro orizzonti investendo in intelligenza artificiale e tecnicie indossabili. Questa diversificazione strategica mira a integrare nuove funzionalità nei veicoli e ad esplorare settori adiacenti, aprendo la strada a...

2026-01-25 LocalLLaMA

Drift: analisi del codice senza AI, solo AST parsing

Un tecnico ha sviluppato Drift, uno strumento per l'analisi del codice che utilizza l'AST parsing e Regex. Scansiona il codice, estrae pattern e li rende accessibili via CLI o IDE. A differenza degli strumenti basati su regole, Drift apprende dalla c...

#Fine-Tuning
2026-01-24 LocalLLaMA

LLM: quale modello locale su GPU 24GB nel 2026?

Un utente di LocalLLaMA si interroga sull'evoluzione dei modelli di linguaggio di grandi dimensioni (LLM) eseguibili in locale. Nello specifico, chiede se, a distanza di nove mesi dal rilascio di Gemma 3 27b, siano disponibili alternative migliori, c...

#Hardware
2026-01-24 LocalLLaMA

GLM 4.7 Flash: versioni non censurate "Balanced" e "Aggressive"

Disponibili versioni non censurate del modello GLM 4.7 Flash di Z.ai, un modello MoE da 30B con circa 3B di parametri attivi e un contesto di 200K token. Le varianti "Balanced", adatta per il coding agentico, e "Aggressive", per argomenti senza censu...

#LLM On-Premise
2026-01-24 TechCrunch AI

Ex-Googler lanciano app con IA per l'istruzione dei più giovani

Un gruppo di ex dipendenti di Google ha sviluppato Sparkli, un'applicazione basata sull'intelligenza artificiale pensata per colmare le lacune dei sistemi educativi tradizionali. L'obiettivo è fornire ai bambini competenze in settori chiave come desi...

2026-01-24 LocalLLaMA

Corea del Sud: potenza emergente nell'intelligenza artificiale

La Corea del Sud si afferma come una delle nazioni leader nel campo dell'intelligenza artificiale, grazie anche alla Korean National Sovereign AI Initiative. Questo programma governativo incentiva lo sviluppo di modelli di intelligenza artificiale na...

2026-01-24 TechCrunch AI

Laboratori di IA: un nuovo test rivela chi punta davvero al profitto

Distinguere i laboratori di intelligenza artificiale focalizzati sulla redditività sta diventando sempre più complesso. È stato sviluppato un sistema di valutazione per fare chiarezza e identificare chi persegue attivamente modelli di business sosten...

2026-01-24 LocalLLaMA

Audiobook fai-da-te: tool open source con Qwen3 e voice cloning

Un sviluppatore ha creato un convertitore open source per trasformare PDF, EPUB e altri formati in audiolibri di alta qualità. Il tool utilizza Qwen3 TTS, un modello vocale open source, e supporta il voice cloning. L'obiettivo è offrire un'alternativ...

2026-01-24 Tom's Hardware

Modding estremo: dissipatore custom da amplificatore per RTX 3080

Un utente di Reddit ha sostituito il backplate della sua RTX 3080 con un massiccio dissipatore di calore ricavato da un amplificatore per auto da 100W. Questa modifica artigianale ha permesso di ridurre le temperature della GPU di ben 10°C, miglioran...

#Hardware
2026-01-24 The Next Web

Mews raccoglie 255 milioni di euro per l'AI nel settore alberghiero

La piattaforma tech per l'ospitalità Mews, con sede ad Amsterdam, ha ottenuto 255 milioni di euro in un round di finanziamento di Serie D. L'obiettivo è accelerare l'adozione di soluzioni di automazione e intelligenza artificiale per gli hotel a live...

2026-01-24 Tom's Hardware

Zotac alza i prezzi delle GPU Nvidia RTX: stangata fino a 200 dollari

Zotac avrebbe aumentato i prezzi di listino delle GPU Nvidia RTX, con rincari fino a 200 dollari. Alcuni utenti segnalano anche la cancellazione degli ordini pre-aumento, generando polemiche sulla gestione delle consegne da parte dell'azienda. La soc...

#Hardware
2026-01-24 LocalLLaMA

Stazione di lavoro per LLM: quale configurazione sotto i 5000 dollari?

Un utente, stanco dei limiti di Claude Code, cerca consigli per assemblare o acquistare una macchina dedicata allo sviluppo di modelli di linguaggio offline, con un budget di 5000 dollari. Valuta diverse opzioni, tra cui workstation preconfigurate e ...

#Hardware
2026-01-24 LocalLLaMA

Test sul campo di GLM 4.7 Flash Q6 con RTX 5090

Un utente condivide la propria esperienza pratica con il modello GLM 4.7 Flash Q6, focalizzandosi sulla sua capacità di gestire il codice Roo in progetti web personali. Il modello si è dimostrato più affidabile e preciso rispetto ad alternative come ...

#LLM On-Premise
2026-01-24 The Register AI

Elo: un linguaggio sviluppato con l'aiuto dell'IA Claude

Bernard Lambeau, sviluppatore e fondatore di diverse aziende tech con sede in Belgio, ha creato il linguaggio di programmazione Elo. Per farlo, si è avvalso del supporto di Claude Code, l'assistente di programmazione di Anthropic, lavorando in una mo...

2026-01-24 404 Media

Mucca usa strumenti come uno scimpanzé: scoperta in Austria

Una mucca di razza Bruna Svizzera di nome Veronika è stata osservata mentre utilizza strumenti per grattarsi, un comportamento finora documentato principalmente in primati, orche e uccelli. La scoperta mette in discussione le concezioni sull'intellig...

2026-01-24 LocalLLaMA

Sviluppo locale con LLM: una sfida per i coder hardware?

Un programmatore hardware ha espresso frustrazione riguardo le prestazioni dei modelli linguistici di grandi dimensioni (LLM) eseguiti localmente su una GPU 5090. Nonostante l'hardware potente, i modelli sembrano sottoutilizzati e incapaci di sfrutta...

#Hardware #LLM On-Premise
2026-01-24 Phoronix

AMD rilascia MLIR-AIE 1.2 per Ryzen AI NPU

AMD ha rilasciato la versione 1.2 del toolchain MLIR-AIE, progettato per ottimizzare le prestazioni dei dispositivi Ryzen AI NPU. Questo aggiornamento, basato su LLVM e incentrato su MLIR, offre agli sviluppatori strumenti avanzati per sviluppare app...

#Hardware
2026-01-24 Tom's Hardware

Microsoft fornisce chiavi BitLocker all'FBI con mandato valido

Microsoft ha confermato di aver fornito all'FBI le chiavi di ripristino BitLocker di alcuni utenti, conservate sui propri server. La società di Redmond ha dichiarato di aver agito in seguito alla ricezione di un mandato di perquisizione valido.

2026-01-24 Phoronix

Linux 6.19: Correzioni per il driver AMDGPU dopo alcune regressioni

Il driver AMDGPU per Linux 6.19 ha subito delle correzioni urgenti per risolvere regressioni che hanno colpito diversi utenti. Gli sviluppatori hanno lavorato per integrare le patch necessarie e stabilizzare il sistema, garantendo un'esperienza utent...

#Hardware
2026-01-24 Phoronix

Newelle: l'assistente AI per GNOME ora supporta Llama.cpp

Newelle, l'assistente virtuale basato su intelligenza artificiale per l'ambiente desktop GNOME, si aggiorna con nuove integrazioni. Oltre al supporto per Google Gemini, OpenAI e Groq, l'ultima versione introduce il supporto per modelli LLM locali tra...

#LLM On-Premise
2026-01-24 Tom's Hardware

La Cina svela uno sciame di 200 droni IA controllati da un soldato

L'Esercito Popolare di Liberazione cinese ha presentato la sua ultima tecnicia di sciame di droni, composta da 200 unità. Il sistema è resistente al jamming, capace di decisioni autonome e controllato da un singolo soldato grazie a un "algoritmo inte...

2026-01-24 LocalLLaMA

Hugging Face: i modelli AI e ML più recenti della settimana

Hugging Face ha rilasciato e aggiornato numerosi modelli di intelligenza artificiale e machine learning. Tra questi, modelli di ragionamento multilingue come GLM-4.7, strumenti per la generazione di report automatizzati e modelli multimodali per la t...

2026-01-24 LocalLLaMA

Ottimizzare modelli MoE su CPU: guida a GLM-4 e GPT-OSS

Eseguire modelli Mixture-of-Experts (MoE) su CPU e RAM richiede ottimizzazione della larghezza di banda. L'articolo analizza GLM-4.7-Flash e GPT OSS 120B, fornendo consigli su hardware (Intel) e software, inclusa la compilazione di `llama.cpp` e l'as...

#Hardware #LLM On-Premise
2026-01-24 LocalLLaMA

LLM senza filtri per interazioni NSFW: la ricerca è aperta

Un utente di Reddit è alla ricerca di un modello linguistico di grandi dimensioni (LLM) non censurato, capace di generare prompt particolarmente audaci e intelligenti per giochi di ruolo a sfondo sessualmente esplicito (NSFW). La discussione è aperta...

2026-01-24 LocalLLaMA

GLM 4.7 Flash: problemi di velocità con contesti ampi?

Un utente ha segnalato un calo significativo delle prestazioni di GLM 4.7 Flash con LM Studio dopo aver superato i 10.000 token, nonostante l'utilizzo di impostazioni raccomandate e software aggiornato. Si discute se altre implementazioni, come vllm,...

#Hardware #LLM On-Premise
2026-01-24 LocalLLaMA

Context Engine: ricerca di codice self-hosted per LLM

Un tecnico ha sviluppato Context Engine, un sistema di retrieval self-hosted per codebase, progettato per funzionare con vari client MCP. Utilizza una ricerca ibrida che combina dense embeddings con la ricerca lessicale e il parsing AST. L'obiettivo ...

#LLM On-Premise #DevOps #RAG
2026-01-24 DigiTimes

Ottica taiwanese pronta a rivoluzionare l'elettronica automotive

L'industria ottica di Taiwan si prepara a un ruolo chiave nell'elettronica del settore automobilistico, spinta dalla crescente domanda di guida autonoma. Le aziende taiwanesi puntano a fornire soluzioni innovative per i sistemi avanzati di assistenza...

2026-01-24 DigiTimes

Droni: Taiwan punta alla certificazione FCC negli USA

Un'alleanza di produttori di droni di Taiwan sta lavorando per ottenere la certificazione FCC (Federal Communications Commission) negli Stati Uniti. Questa mossa strategica mira a facilitare l'accesso al mercato statunitense, aprendo nuove opportunit...

2026-01-24 DigiTimes

IA energivora: limiti alla crescita, supply chain in trasformazione

I crescenti consumi energetici dell'intelligenza artificiale pongono nuove sfide. Le tensioni geopolitiche sulle terre rare e le innovazioni nel packaging stanno rimodellando le filiere globali. Un'analisi di DIGITIMES evidenzia come questi fattori i...

2026-01-24 TechCrunch AI

Harvey, colosso legale AI, acquisisce Hexus: sale la competizione

Harvey, leader nel settore dell'intelligenza artificiale legale, ha annunciato l'acquisizione di Hexus, startup specializzata in soluzioni tecniciche per il settore legale. L'operazione mira a rafforzare la posizione di Harvey in un mercato sempre pi...

2026-01-24 OpenAI Blog

GPT-5 al Lavoro: Come le Aziende Stanno Usando l'AI

Un nuovo rapporto analizza l'adozione di ChatGPT in diversi settori industriali, evidenziando i compiti principali automatizzati, i modelli di utilizzo per reparto e le prospettive future dell'intelligenza artificiale nel mondo del lavoro. L'analisi ...

2026-01-24 LocalLLaMA

LuxTTS: voice cloning efficiente con un modello TTS compatto

È stato rilasciato LuxTTS, un modello text-to-speech basato su diffusione con soli 120 milioni di parametri. Si distingue per la sua capacità di voice cloning di alta qualità, paragonabile a modelli dieci volte più grandi, e per la sua efficienza, ri...

2026-01-24 LocalLLaMA

Strix Halo: prestazioni sorprendenti con MiniMax Q3 K_XL

Un utente ha testato Strix Halo (Bosgame M5 con 128GB) su Ubuntu 25.10, ottenendo risultati notevoli con il modello MiniMax Q3 K_XL. In particolare, la velocità di circa 30 token al secondo in modalità TG rende il modello utilizzabile per attività di...

2026-01-24 TechCrunch AI

AMI Labs: la nuova startup di Yann LeCun nel mondo dei modelli AI

AMI Labs, la nuova iniziativa imprenditoriale di Yann LeCun dopo aver lasciato Meta, ha immediatamente catturato l'attenzione del settore. L'azienda si focalizzerà sullo sviluppo di modelli AI avanzati, promettendo di rivoluzionare il campo dell'inte...

2026-01-24 LocalLLaMA

Corea del Sud: corsa spietata all'IA sovrana

La Corea del Sud è impegnata in una competizione intensa per sviluppare una propria intelligenza artificiale. Questa "AI Squid Game", come è stata soprannominata, vede diverse aziende e istituzioni in lizza per la supremazia nel campo dell'IA, con l'...

2026-01-23 Wired AI

Trump e l'IA a Davos: analisi dall'Uncanny Valley

Donald Trump e le principali aziende di intelligenza artificiale sono stati protagonisti al World Economic Forum di Davos. L'episodio di 'Uncanny Valley' analizza le implicazioni di questo incontro, esplorando le dinamiche tra politica, tecnicia e ec...

2026-01-23 TechCrunch AI

Google Foto si aggiorna: ora puoi creare meme con l'IA Gemini

Google Foto introduce una nuova funzionalità che permette agli utenti di creare meme personalizzati a partire dalle proprie foto. L'integrazione sfrutta l'intelligenza artificiale Gemini di Google, offrendo un modo divertente per sperimentare con le ...

2026-01-23 The Register AI

Microsoft sblocca BitLocker per l'FBI: resa dei dati come servizio?

Un report indica che Microsoft ha fornito all'FBI le chiavi di cifratura BitLocker per accedere ai portatili di utenti Windows. Questo solleva interrogativi sulla reale sicurezza dei dati protetti con BitLocker e sull'importanza di gestire autonomame...

2026-01-23 TechCrunch AI

Davos sempre più tech: l'AI ruba la scena al World Economic Forum

L'edizione annuale del World Economic Forum di Davos ha visto una forte presenza del settore tecnicico, con un'attenzione particolare all'intelligenza artificiale. I temi tradizionali come il cambiamento climatico e la povertà globale sono passati in...

2026-01-23 OpenAI Blog

Analisi approfondita del ciclo degli agenti Codex

Un'analisi tecnica dettagliata del ciclo degli agenti Codex, che spiega come la CLI di Codex orchestra modelli, strumenti, prompt e prestazioni utilizzando l'API Responses. Esploriamo l'architettura e il funzionamento interno di questo componente chi...

2026-01-23 LocalLLaMA

ChatGPT: come scalare PostgreSQL per 800 milioni di utenti

OpenAI ha illustrato le strategie di scalabilità adottate per PostgreSQL, al fine di supportare gli 800 milioni di utenti di ChatGPT. L'articolo originale approfondisce le sfide affrontate e le soluzioni implementate per gestire un carico di lavoro c...

2026-01-23 LocalLLaMA

Sweep: modello open-source da 1,5B per l'autocompletamento del codice

Sweep AI ha rilasciato un modello open-source da 1,5 miliardi di parametri, denominato Sweep, progettato per predire le modifiche successive nel codice. Questo strumento, disponibile su Hugging Face e tramite un plugin JetBrains, utilizza le modifich...

#Fine-Tuning
2026-01-23 The Register AI

Deepin Linux: il sistema operativo cinese punta sull'IA integrata

La nuova release 25.0.10 di Deepin, il sistema operativo desktop sviluppato da Uniontech, dimostra l'ambizione cinese di non dipendere dalla tecnicia occidentale. L'interfaccia è moderna e accattivante, e integra funzionalità di intelligenza artifici...

2026-01-23 TechCrunch AI

Meta stoppa l'accesso degli adolescenti ai personaggi IA

Meta ha temporaneamente sospeso l'accesso degli adolescenti ai suoi personaggi basati sull'intelligenza artificiale. L'azienda sta sviluppando nuove versioni di questi personaggi, progettate per fornire risposte più adatte alla loro età. La mossa è p...

2026-01-23 404 Media

Dietro le Quinte del Blog: Intelligenza Artificiale, Banche e Censura

Uno sguardo dietro le quinte di 404 Media. Questa settimana, focus sull'impatto dell'intelligenza artificiale generativa, una conferenza sul riciclaggio di denaro e la rimozione di simboli legati alla schiavitù. L'intervista con il CTO di Wikimedia F...

#Fine-Tuning
2026-01-23 The Register AI

Cyberattacchi automatizzati con IA: allarme da Google

Un dirigente di Google avverte: i criminali informatici stanno già automatizzando i flussi di lavoro e strumenti completi per cyberattacchi su vasta scala, basati sull'intelligenza artificiale, potrebbero arrivare presto. I CISO devono prepararsi a u...

2026-01-23 TechCrunch AI

Meta frena l'accesso degli adolescenti agli AI character

Meta sta sviluppando nuove versioni dei suoi AI character, progettate per fornire risposte adatte all'età degli adolescenti. L'azienda ha temporaneamente sospeso l'accesso a questa funzionalità per gli utenti più giovani, al fine di perfezionare e ca...

2026-01-23 LocalLLaMA

Agenti vocali: meglio modelli avanzati o vincoli più rigidi?

Nello sviluppo di agenti vocali, il dibattito si concentra sull'importanza relativa tra la qualità del modello e la definizione di vincoli comportamentali efficaci. Un modello più intelligente non sempre si traduce in prestazioni superiori se non ade...

2026-01-23 Phoronix

VVenC H.266: Ottimizzazioni ARM per prestazioni superiori

Fraunhofer HHI ha rilasciato una nuova versione di VVenC, il suo encoder video H.266 open-source. L'aggiornamento include ottimizzazioni delle prestazioni per architettura ARM. I primi benchmark mostrano un miglioramento delle prestazioni su sistemi ...

#Hardware
2026-01-23 Wired AI

Agenti AI: la matematica ne prevede il fallimento?

Un recente studio mette in discussione il futuro degli agenti basati su intelligenza artificiale, suggerendo che i limiti matematici ne precludano il successo. L'industria, tuttavia, sembra non condividere queste preoccupazioni, continuando a investi...

2026-01-23 TechCrunch AI

Davos: i CEO dell'AI trasformano il forum in una conferenza tech

Il World Economic Forum di Davos ha visto quest'anno una forte predominanza dell'intelligenza artificiale. I CEO del settore non si sono risparmiati nel discutere apertamente le implicazioni dell'AI, tanto da mettere in ombra temi tradizionali come i...

2026-01-23 Tom's Hardware

Alibaba punta all'IPO per T-Head e investe in infrastrutture AI

Secondo indiscrezioni, Alibaba starebbe preparando l'offerta pubblica iniziale (IPO) per la sua divisione di produzione di chip, T-Head. L'obiettivo principale sarebbe quello di raccogliere capitali significativi per finanziare lo sviluppo di soluzio...

2026-01-23 TechCrunch AI

Sam Altman di OpenAI in visita in India: focus sull'IA

Il CEO di OpenAI, Sam Altman, si prepara a visitare l'India per la prima volta dopo quasi un anno. La visita giunge in un momento di grande fermento nel settore dell'intelligenza artificiale, con numerosi leader del settore che convergono a Nuova Del...

2026-01-23 Tom's Hardware

Intel: primi clienti per il nodo 14A forse nel 2026

Intel ha dichiarato di avere potenziali clienti interessati alla tecnicia di processo 14A. L'azienda prevede di ricevere i primi impegni formali nella seconda metà del 2026. Questo rappresenta un passo avanti significativo per Intel nella sua strateg...

#Hardware
2026-01-23 LocalLLaMA

Nvidia PersonaPlex: IA vocale open-source per interazioni in tempo reale

Nvidia ha presentato PersonaPlex, un modello di intelligenza artificiale conversazionale vocale open-source e full-duplex. PersonaPlex permette il controllo della personalità tramite prompt testuali e condizionamento vocale audio. Addestrato su conve...

#Hardware #Fine-Tuning
2026-01-23 Phoronix

AMD Ryzen AI: nuovo software per performance superiori

AMD ha rilasciato una nuova versione del software Ryzen AI, un pacchetto per Windows e Linux progettato per sfruttare le NPU Ryzen AI in diverse attività di intelligenza artificiale. L'aggiornamento promette performance migliorate e supporto per nuov...

#Hardware
2026-01-23 Tech.eu

CyberAlloy: rete europea per la difesa cibernetica

È stata lanciata CyberAlloy, una rete indipendente che connette aziende, governi, istituti di ricerca, venture capitalist ed esperti di sicurezza. L'obiettivo è creare un ecosistema resiliente agli attacchi informatici, promuovendo la collaborazione ...

2026-01-23 Tom's Hardware

Lian Li RS1200G: alimentatore ATX 3.1 con design rotazionale

L'alimentatore Lian Li RS1200G ATX 3.1 combina innovazione nel design rotazionale e affidabilità. La compatibilità con i case rappresenta un aspetto da valutare attentamente. Gli alimentatori ATX 3.1 sono progettati per supportare le più recenti sche...

2026-01-23 Tech.eu

L'Europa sfida Big Tech: alternative digitali in crescita

L'Europa punta all'indipendenza digitale, riducendo la dipendenza dalle grandi aziende tecniciche statunitensi. La Commissione Europea promuove soluzioni open source e infrastrutture digitali sviluppate in Europa, che rispettino i valori locali di pr...

#Hardware
2026-01-23 Tom's Hardware

Asus indaga sui problemi alle schede madri serie 800 e CPU 9800X3D

Asus ha annunciato un'indagine interna sulle schede madri serie 800, in seguito alle segnalazioni di guasti hardware da parte degli utenti che utilizzano i processori 9800X3D. L'azienda mira a far luce sulle cause dei malfunzionamenti e valutare le p...

#Hardware
2026-01-23 Tech.eu

ClearScore acquisisce Acre Platforms per espandere l'offerta

La fintech ClearScore, con sede a Londra e specializzata in servizi di valutazione del merito creditizio, ha annunciato l'acquisizione della piattaforma britannica di mutui Acre Platforms. Questa operazione, il cui valore non è stato reso noto, rappr...

2026-01-23 Tom's Hardware

Intel: perdite ridotte, ma azioni in calo del 13%

Intel registra ricavi stabili nel 2025, ma le azioni crollano a causa di una perdita di 300 milioni di dollari, nonostante un massiccio investimento esterno. La domanda supererà l'offerta almeno fino al 2026.

#Hardware
2026-01-23 LocalLLaMA

Llama.cpp ora supporta l'API di risposte OpenAI

L'integrazione dell'API di risposte OpenAI in Llama.cpp è realtà. Questa novità, accolta con favore dalla community, promette di semplificare l'interazione con i modelli linguistici e di aprire nuove possibilità nello sviluppo di applicazioni basate ...

#Hardware #LLM On-Premise
2026-01-23 LocalLLaMA

GLM4.7-Flash REAP: nuovo modello per la programmazione agentica

È stata rilasciata una versione del modello GLM4.7-Flash, denominata REAP, ottimizzata per la programmazione agentica. I primi test indicano un notevole miglioramento rispetto alle versioni precedenti, posizionandosi tra i modelli più efficienti in r...

#Fine-Tuning
2026-01-23 DigiTimes

Foxconn accelera la trasformazione AI della produzione globale

Foxconn Industrial Internet (FII) sta potenziando la sua piattaforma di produzione globale tramite l'integrazione di soluzioni basate sull'intelligenza artificiale. L'obiettivo è rimodellare i processi produttivi, rendendoli più efficienti e adattabi...

2026-01-23 DigiTimes

Taiwan: industria auto in ripresa dopo i negoziati sulle tariffe

L'industria automobilistica di Taiwan mostra segnali di ripresa dopo i recenti negoziati sulle tariffe. Un'analisi di DIGITIMES rivela un miglioramento del 15%, pur evidenziando la necessità di ulteriori rassicurazioni per una crescita sostenibile de...

2026-01-23 DigiTimes

AcBel punta sui data center AI con alimentatori HVDC da 1 MW

AcBel ha annunciato il lancio di alimentatori HVDC (High Voltage Direct Current) da 1 MW, segnalando una mossa strategica verso i data center AI. L'azienda vede in questo settore un motore di crescita fondamentale. La decisione riflette la crescente ...

#Hardware
2026-01-23 Tech.eu

Agileday raccoglie 6,4 milioni per espandere le soluzioni AI

Agileday, società finlandese specializzata in piattaforme operative per servizi professionali, ha chiuso un round di finanziamento di Serie A da 6,4 milioni di euro. L'investimento, guidato da Newion, vedrà l'azienda scalare la propria piattaforma te...

2026-01-23 DigiTimes

Presidente di Compal celebra 50 anni nel Gruppo Kinpo

Il presidente di Compal ha celebrato il suo cinquantesimo anniversario nel Gruppo Kinpo. L'evento si svolge in un momento di riflessione sulle sfide demografiche che Taiwan si trova ad affrontare e sulle strategie per garantire una crescita sostenibi...

2026-01-23 DigiTimes

Accordo tariffario Taiwan-USA: impulso per le macchine utensili

Un nuovo accordo tariffario tra Taiwan e Stati Uniti promette di dare una spinta significativa all'industria delle macchine utensili di Taiwan. Si prevede che l'accordo rimodellerà le dinamiche del mercato globale, favorendo la crescita e l'espansion...

2026-01-23 DigiTimes

Compal punta a una crescita esplosiva dei server AI nel 2026

Il produttore taiwanese Compal prevede una forte espansione nel mercato dei server dedicati all'intelligenza artificiale a partire dal 2026, dopo un periodo di calo dei ricavi. L'azienda sta investendo in nuove tecnicie e capacità produttive per sodd...

#Hardware
2026-01-23 DigiTimes

Lite-On punta U-Media per espandersi in AI e 5G

Lite-On Technology ha lanciato un'offerta pubblica per acquisire U-Media. L'operazione mira a rafforzare la posizione di Lite-On nei settori dell'intelligenza artificiale (AI) e del 5G, accelerando la sua crescita in questi mercati strategici. L'acqu...

2026-01-23 ArXiv cs.CL

AfriEconQA: nuovo dataset per l'analisi economica africana

Presentato AfriEconQA, un dataset di riferimento per l'analisi economica africana basato sui report della Banca Mondiale. Il dataset, composto da quasi 9.000 istanze QA, mira a valutare i sistemi di Information Retrieval e RAG in un contesto di ragio...

#Fine-Tuning #RAG
2026-01-23 ArXiv cs.CL

Entropy-Tree: decodifica ad albero guidata dall'entropia per LLM

Un nuovo metodo di decodifica per modelli linguistici di grandi dimensioni (LLM), chiamato Entropy-Tree, sfrutta l'entropia per guidare l'esplorazione ad albero. Questo approccio mira a migliorare sia l'accuratezza che l'affidabilità nei compiti di r...

#Fine-Tuning
2026-01-23 ArXiv cs.LG

Gli LLM: lingua e cultura sono indissolubilmente legate

Una nuova ricerca evidenzia come la qualità delle risposte degli LLM sia influenzata dalla lingua utilizzata nella query. Le lingue a bassa dotazione di risorse ottengono risposte di qualità inferiore. Lo studio rivela inoltre che la scelta della lin...

2026-01-23 ArXiv cs.LG

LLM potenziati per la progettazione di farmaci basata su strutture

Un nuovo framework, ELILLM, sfrutta i modelli linguistici di grandi dimensioni (LLM) per la progettazione di farmaci basata su strutture (SBDD). ELILLM affronta le limitazioni degli LLM nell'interpretazione delle strutture proteiche e nella generazio...

2026-01-23 ArXiv cs.AI

Bias nascosti nei LLM per il triage ospedaliero: uno studio

Una nuova ricerca evidenzia come i modelli linguistici di grandi dimensioni (LLM) integrati nei sistemi di triage ospedaliero possano presentare bias nascosti nei confronti di pazienti con diverse provenienze razziali, sociali ed economiche. Lo studi...

#Fine-Tuning
2026-01-23 DigiTimes

Tata Group investe 11 miliardi $ in India: focus su AI e chip

Il gruppo Tata investirà 11 miliardi di dollari nella Innovation City del Maharashtra, in India. L'obiettivo è rafforzare le ambizioni del paese nel settore dell'intelligenza artificiale e dei semiconduttori, settori strategici per la crescita tecnic...

2026-01-23 DigiTimes

E Ink spinge le etichette elettroniche per la smart retail

E Ink Holdings sta potenziando le etichette elettroniche per scaffali (ESL), cavalcando l'onda della crescita globale del settore smart retail. Questa mossa strategica mira a soddisfare la crescente domanda di soluzioni di gestione dei prezzi più eff...

2026-01-23 DigiTimes

USA sostengono la strategia di difesa asimmetrica di Taiwan

L'American Institute in Taiwan (AIT) ha promesso il sostegno degli Stati Uniti alla strategia di difesa asimmetrica di Taiwan e alla sua filiera di approvvigionamento per la difesa. L'AIT ha sottolineato l'importanza della libertà e della sicurezza d...

2026-01-23 DigiTimes

Palo Alto Networks: IA contro IA per la sicurezza nel 2026

James Yu, country manager di Palo Alto Networks a Taiwan, sottolinea la necessità di affrontare le minacce basate sull'intelligenza artificiale con soluzioni di sicurezza potenziate dall'IA. L'azienda prevede un aumento degli attacchi sofisticati e r...

2026-01-23 TechCrunch AI

Blockit: startup AI negozia appuntamenti, finanziata da Sequoia

Blockit, una startup che utilizza agenti AI per gestire calendari e pianificare appuntamenti, ha raccolto 5 milioni di dollari in finanziamenti seed guidati da Sequoia. L'obiettivo è automatizzare la pianificazione, riducendo i tempi necessari per co...

2026-01-23 DigiTimes

AI: aziende taiwanesi prudenti nonostante l'hype

Le aziende di Taiwan mantengono un atteggiamento cauto nei confronti dell'intelligenza artificiale, nonostante il grande entusiasmo che circonda questo settore. Persistono i dubbi sulla sostenibilità della crescita e sul reale impatto a lungo termine...

2026-01-23 DigiTimes

Google: il dibattito tra agenti IA migliora il ragionamento

Ricerca Google: il dibattito tra molteplici agenti di intelligenza artificiale potenzia le capacità di ragionamento, superando i limiti della pura potenza di calcolo. Questo approccio innovativo apre nuove prospettive nello sviluppo di sistemi IA più...

2026-01-23 Phoronix

AMD: Ottimizzazioni per RDNA4 nel driver RadeonSI

Nuove ottimizzazioni per le schede grafiche AMD Radeon RDNA4 sono state integrate nel driver RadeonSI Gallium3D (OpenGL) di Mesa. Queste consegne, arrivate subito dopo il rilascio di Mesa 26.0, saranno incluse nella versione 26.1 di Mesa, prevista pe...

#Hardware
2026-01-23 LocalLLaMA

Unsloth: ottimizzazione di embedding 1.8-3.3x più rapida

Unsloth ha annunciato un miglioramento nella velocità di ottimizzazione fine degli embedding, con incrementi di 1.8-3.3x e una riduzione del 20% nell'utilizzo di VRAM. La nuova funzionalità supporta contesti più ampi e promette di non compromettere l...

#LLM On-Premise #Fine-Tuning #RAG
2026-01-23 TechCrunch AI

OpenAI punta al mercato enterprise nel 2026: la strategia

OpenAI ha affidato a Barret Zoph la guida della sua espansione nel settore enterprise. La mossa arriva subito dopo il rientro di Zoph in azienda, segnalando un forte interesse di OpenAI verso questo segmento di mercato. L'obiettivo è competere con i ...

2026-01-23 DigiTimes

Chunghwa Telecom e SES realizzano una stazione O3b MEO a Taiwan

Chunghwa Telecom collabora con SES per la costruzione della prima stazione di terra O3b MEO nel Nord Asia, situata a Taiwan. Questa infrastruttura supporterà le comunicazioni satellitari di nuova generazione, migliorando la connettività e riducendo l...

2026-01-23 DigiTimes

Taiwan: boom storico per il cargo aereo previsto nel 2026

Il volume di merci aviotrasportate da Taiwan è destinato a raggiungere un picco storico nel 2026. La crescita è trainata principalmente dalle esportazioni di chip e dall'intelligenza artificiale. L'isola si conferma un hub cruciale per il trasporto a...

2026-01-22 TechCrunch AI

Inferact raccoglie 150 milioni di dollari per commercializzare vLLM

La startup Inferact, focalizzata sull'inference, ha ottenuto un finanziamento di 150 milioni di dollari. Questo round di investimento valuta la società, di recente costituzione, 800 milioni di dollari. L'obiettivo principale è la commercializzazione ...

#LLM On-Premise
2026-01-22 LocalLLaMA

vLLM raccoglie 150 milioni: l'inferenza è la nuova frontiera

Il finanziamento di 150 milioni di dollari per vLLM (Inferact) indica un cambio di priorità nel settore dell'intelligenza artificiale. Dopo anni di investimenti massicci nel training di modelli, l'attenzione si sposta ora sull'inferenza, in particola...

#Hardware #LLM On-Premise #Fine-Tuning
2026-01-22 Ars Technica AI

Apple al lavoro su un wearable pin con IA, lancio previsto nel 2027

Secondo indiscrezioni, Apple starebbe sviluppando un dispositivo indossabile con funzionalità di intelligenza artificiale. Il dispositivo, dalle dimensioni simili a un AirTag, si indosserebbe come una spilla. Il lancio potrebbe avvenire già nel 2027....

2026-01-22 LocalLLaMA

Unsloth accelera il fine-tuning dei modelli di embedding

Daniel Han di Unsloth ha annunciato il supporto per il fine-tuning dei modelli di embedding tramite Unsloth e Sentence Transformers. Promette velocità superiori (fino a 3.3x) e un utilizzo inferiore di VRAM (fino al 20%). Sono disponibili notebook di...

#Fine-Tuning #RAG
2026-01-22 Phoronix

Kernel Linux, fix per consumo memoria GPU non autorizzato

Una vulnerabilità nel driver DRM (Direct Rendering Manager) del kernel Linux consentiva a utenti senza privilegi di saturare la memoria del kernel. La falla è stata corretta per evitare blocchi di sistema dovuti a esaurimento della memoria.

#Hardware
2026-01-22 PyTorch Blog

Feast entra nell'ecosistema PyTorch per l'AI in produzione

Feast, la piattaforma open source per la gestione dei dati nell'AI, si integra con PyTorch. L'obiettivo è risolvere le incongruenze tra dati di training e produzione, accelerando il rilascio di modelli accurati e affidabili. L'integrazione abilita la...

#Hardware #Fine-Tuning #DevOps
2026-01-22 TechCrunch AI

DeepMind sorpresa dalla fretta di OpenAI con gli annunci in ChatGPT

Demis Hassabis, CEO di Google DeepMind, si dice sorpreso dalla decisione di OpenAI di inserire pubblicità in ChatGPT. Afferma che Google non sta esercitando pressioni per una simile integrazione nel proprio chatbot di intelligenza artificiale. La mos...

2026-01-22 PyTorch Blog

Feast entra nell'ecosistema PyTorch per l'AI di produzione

Feast, piattaforma open source per la gestione dei dati nell'AI di produzione, si integra con PyTorch. L'obiettivo è semplificare il passaggio dallo sviluppo del modello al suo rilascio, eliminando le incongruenze tra dati di training e utilizzo real...

#Hardware #Fine-Tuning
2026-01-22 Wired AI

AI: ondata di disinformazione minaccia la democrazia

L'intelligenza artificiale sta creando un terreno fertile per la diffusione di disinformazione su vasta scala e a velocità senza precedenti. Gli esperti avvertono che individuare queste campagne manipolative sta diventando sempre più difficile, mette...

2026-01-22 Wired AI

Claude Code: come cambia lo sviluppo software in Anthropic

WIRED ha intervistato Boris Cherny, responsabile di Claude Code, per capire come questo strumento di programmazione stia trasformando il lavoro interno ad Anthropic. L'adozione di tool di questo tipo potrebbe rivoluzionare il futuro dello sviluppo so...

2026-01-22 The Register AI

AI: impatti maggiori sulle professioni a prevalenza femminile?

Un recente studio della Brookings Institution evidenzia come alcune professioni con alta percentuale di lavoratrici siano particolarmente vulnerabili all'impatto dell'intelligenza artificiale. I dentisti, invece, sembrano essere tra i meno esposti a ...

2026-01-22 404 Media

La dimensione conta: studio sull'impatto del pene tra rivali

Uno studio rivela che la dimensione del pene maschile influenza sia l'attrazione femminile sia la percezione di minaccia tra uomini. I risultati suggeriscono che, nel corso dell'evoluzione, la dimensione del pene potrebbe aver giocato un ruolo nella ...

2026-01-22 TechCrunch AI

Google offre test SAT gratuiti potenziati da Gemini

Google mette a disposizione degli studenti che si preparano per il SAT una nuova risorsa gratuita: test di pratica potenziati dall'intelligenza artificiale di Gemini. L'iniziativa mira a rendere più accessibile la preparazione agli esami di ammission...

2026-01-22 MIT Technology Review

ChatGPT Health: può fare meglio del "Dr. Google"?

OpenAI ha lanciato ChatGPT Health, una versione del suo modello linguistico progettata per fornire consulenza medica. L'iniziativa arriva in un momento delicato, con crescenti preoccupazioni sull'accuratezza e la sicurezza delle informazioni sanitari...

2026-01-22 The Register AI

Palantir addestra l'IA dei droni intercettori ucraini

L'Ucraina sta potenziando la sua difesa aerea con l'aiuto dell'intelligenza artificiale di Palantir. L'azienda fornirà un accesso più ampio ai dati di combattimento, permettendo ai droni intercettori di operare in modo più autonomo ed efficace contro...

2026-01-22 The Register AI

Jeffrey Snover, architetto di PowerShell, va in pensione

Jeffrey Snover, figura chiave di PowerShell e punto di riferimento per gli amministratori Windows, ha lasciato Microsoft dopo anni dedicati all'automazione. La sua carriera, trascorsa tra Microsoft e Google, ha segnato profondamente il mondo dell'IT.

2026-01-22 Ars Technica AI

Google AI Mode: risposte personalizzate con Gmail e Foto

Google sta potenziando AI Mode, la sua interfaccia di ricerca basata sull'intelligenza artificiale, con una nuova funzionalità chiamata "Personal Intelligence". Questa novità permette al sistema di personalizzare le risposte attingendo ai dati presen...

2026-01-22 TechCrunch AI

L'AI di Google ora pesca dati da Gmail e Foto per risposte su misura

La nuova modalità AI di Google è in grado di accedere ai contenuti di Gmail e Google Foto per fornire risposte personalizzate. L'azienda precisa che il modello non viene addestrato direttamente sui dati degli utenti, ma sulle interazioni tra prompt s...

#Fine-Tuning
2026-01-22 Google AI Blog

Google Search: Intelligenza Personale con AI Mode e le tue info

Google introduce l'Intelligenza Personale nella Ricerca. Gli abbonati a Google AI Pro e AI Ultra potranno connettere Gmail e Google Foto all'AI Mode, ottenendo risultati più pertinenti e personalizzati. Questa novità mira a migliorare l'esperienza ut...

2026-01-22 TechCrunch AI

Google acquisisce il team di Hume AI, startup specializzata in voce

Google ha assunto il CEO e i principali tecnici della startup Hume AI, focalizzata sull'intelligenza artificiale vocale. Questa mossa sottolinea come l'interfaccia vocale stia diventando sempre più centrale rispetto agli schermi nell'interazione uomo...

2026-01-22 Phoronix

Intel aggiorna il firmware IPU per i laptop Panther Lake

Intel ha rilasciato un aggiornamento del firmware IPU 7.5 (Image Processing Unit) per i suoi prossimi laptop Core Ultra Series 3 Panther Lake. L'aggiornamento riguarda l'unità di elaborazione immagini utilizzata dalle webcam integrate nei modelli di ...

#Hardware
2026-01-22 TechCrunch AI

Anthropic sfida i candidati: test tecnici anti-cheat con Claude

Anthropic, azienda specializzata in intelligenza artificiale, ha dovuto rivedere i suoi test di valutazione tecnica per i candidati. L'obiettivo è evitare che i candidati utilizzino strumenti di intelligenza artificiale, come il suo stesso Claude, pe...

2026-01-22 Wired AI

Google acquisisce talenti chiave dalla startup Hume AI

Google ha siglato un importante accordo di licenza con Hume AI, assicurandosi l'ingresso nel team di DeepMind del CEO Alan Cowen e di diversi ingegneri di spicco della startup specializzata in intelligenza artificiale vocale.

2026-01-22 LocalLLaMA

Qwen3 TTS: nuovo modello text-to-speech open source

È stato rilasciato Qwen3 TTS, un nuovo modello text-to-speech (TTS) open source. Il progetto è disponibile su GitHub e Hugging Face, offrendo agli sviluppatori nuove opzioni per la sintesi vocale. Questo strumento promette di ampliare le possibilità ...

2026-01-22 Tom's Hardware

USA, stretta sull'export di chip AI: il Congresso avrà potere di veto

Il Congresso degli Stati Uniti sta valutando l'AI Overwatch Act, una proposta di legge che darebbe al parlamento il potere di bloccare l'export di processori ad alte prestazioni per l'intelligenza artificiale, prodotti da aziende come AMD e Nvidia, v...

#Hardware
2026-01-22 The Register AI

VMware: sconti USA fino al 64%, ma l'hypervisor è escluso

La General Services Administration degli Stati Uniti promuove sconti fino al 64% sull'offerta VMware di Broadcom tramite un accordo OneGov. Stranamente, la piattaforma vSphere, elemento fondamentale di VMware, non rientra nell'accordo. L'iniziativa s...

2026-01-22 The Register AI

Blocco note di Windows: Microsoft continua a (s)toccarlo

Microsoft interviene di nuovo su Blocco note, aggiungendo una schermata "Novità" per informare gli utenti sulle ultime modifiche apportate all'umile editor di testo. L'azienda di Redmond sembra intenzionata a non lasciare in pace una delle applicazio...

2026-01-22 LocalLLaMA

Qwen3-TTS: la famiglia di modelli open source per la sintesi vocale

Qwen ha rilasciato in open source l'intera famiglia di modelli Qwen3-TTS, che include VoiceDesign, CustomVoice e Base. Sono disponibili cinque modelli in due dimensioni (0.6B e 1.8B), con supporto per dieci lingue. Il codice, i modelli pre-addestrati...

2026-01-22 LocalLLaMA

Sviluppatore di Qwen attivo su Twitter

Un sviluppatore del modello linguistico di grandi dimensioni (LLM) Qwen è stato avvistato su Twitter. La notizia è stata diffusa su Reddit, scatenando discussioni nella comunità LocalLLaMA. Qwen è un modello sviluppato da Alibaba, noto per le sue cap...

2026-01-22 Tom's Hardware

Nvidia: l'IA creerà più lavoro per operai e tecnici specializzati

Secondo Jensen Huang (Nvidia), l'intelligenza artificiale trasformerà il mercato del lavoro, incrementando la domanda e i salari per le professioni tecniche specializzate, come elettricisti e idraulici, parallelamente alla riduzione di mansioni d'uff...

#Hardware
2026-01-22 LocalLLaMA

Hugging Face: i modelli più scaricati della settimana

Hugging Face ha rilasciato diversi modelli che stanno riscuotendo un notevole successo. Tra questi, spiccano GLM-4.7-Flash per la generazione di testo rapida, GLM-Image per l'editing di immagini, pocket-tts per la sintesi vocale e VibeVoice-ASR per i...

2026-01-22 The Register AI

Alan Turing Institute: cambio al vertice con focus sulla difesa

Mark Girolami assume temporaneamente la carica di amministratore delegato dell'Alan Turing Institute, dopo le dimissioni di Jean Innes. La transizione avviene in un momento di crescente attenzione all'applicazione dell'intelligenza artificiale nel se...

2026-01-22 LocalLLaMA

Llama.cpp: integrato fix CUDA per GLM 4.7 Flash Attention

Un fix per CUDA relativo a GLM 4.7 Flash Attention è stato integrato in Llama.cpp. La modifica, proposta tramite una pull request su GitHub, dovrebbe migliorare le prestazioni e la stabilità nell'utilizzo di modelli di linguaggio di grandi dimensioni...

#Hardware #LLM On-Premise
2026-01-22 Tom's Hardware

AMD ROCm: Trasformazione radicale per lo sviluppo di IA

AMD ha presentato al CES 2026 importanti aggiornamenti per ROCm, la sua piattaforma software. L'azienda punta ad abbattere le barriere nello sviluppo di applicazioni di intelligenza artificiale, rendendo ROCm uno strumento sempre più accessibile e pe...

#Hardware
2026-01-22 TechCrunch AI

Sparkli: l'app interattiva con IA per l'apprendimento dei più piccoli

Un team di ex dipendenti di Google sta sviluppando Sparkli, un'applicazione interattiva basata sull'intelligenza artificiale generativa, pensata per rendere l'apprendimento più coinvolgente per i bambini. L'app si propone di superare i limiti delle a...

#Hardware
2026-01-22 AI News

Gates e OpenAI: intelligenza artificiale per la sanità in Africa

La Gates Foundation e OpenAI stanno collaborando per testare l'uso dell'intelligenza artificiale (AI) nel settore sanitario primario in Africa. L'iniziativa, denominata Horizon1000, mira a introdurre strumenti di AI in 1.000 cliniche in Ruanda e nell...

2026-01-22 DigiTimes

OpenAI e ServiceNow: partnership per l'IA nei processi aziendali

OpenAI e ServiceNow hanno stretto una partnership per integrare modelli e agenti di intelligenza artificiale nei flussi di lavoro aziendali. L'obiettivo è migliorare l'efficienza e automatizzare processi complessi all'interno delle aziende, sfruttand...

2026-01-22 DigiTimes

La Cina rilancia gli incentivi per l'acquisto di dispositivi ICT

Il governo cinese ha reintrodotto i sussidi per l'acquisto di nuovi dispositivi ICT, incentivando la sostituzione di quelli obsoleti. Questa mossa mira a stimolare le vendite nel settore e promuovere l'innovazione tecnicica. L'iniziativa dovrebbe ave...

2026-01-22 Tech.eu

Vi Partners: nuovo fondo venture capital da 161 milioni di euro

La società svizzera Vi Partners ha annunciato il primo closing del suo nuovo fondo di venture capital, con un obiettivo di 161 milioni di euro. Questo traguardo coincide con il 25° anniversario dell'azienda, un quarto di secolo dedicato al supporto d...

2026-01-22 DigiTimes

Nvidia e MediaTek uniscono le forze nella battaglia per i PC con IA

Nvidia e MediaTek intensificano la competizione nel settore dei PC dotati di intelligenza artificiale. La collaborazione mira a integrare le rispettive competenze per offrire soluzioni avanzate, in un mercato in rapida espansione e sempre più competi...

#Hardware
2026-01-22 DigiTimes

SAS punta sui wafer da 12 pollici e sull'AI nei visori

Secondo Digitimes, SAS sta riorientando la propria strategia sui carburi di silicio (SiC), puntando su wafer da 12 pollici. L'azienda starebbe inoltre lavorando su visori con funzionalità di intelligenza artificiale. Questa mossa strategica potrebbe ...

2026-01-22 The Register AI

AI e codice: l'automazione aumenta il debito di sicurezza?

L'integrazione dell'AI nello sviluppo software porta efficienza, ma emergono rischi per la sicurezza. Un honeypot creato con codice AI ha rivelato vulnerabilità nascoste, sollevando preoccupazioni sull'uso di strumenti di coding automatizzati e il po...

2026-01-22 LocalLLaMA

In arrivo Qwen3 TTS Open Source tramite VLLM-Omni PR

Una pull request su GitHub suggerisce l'imminente rilascio di Qwen3 TTS open source tramite il progetto VLLM-Omni. La notizia è stata diffusa su Reddit, generando interesse nella comunità open source per le potenziali applicazioni di sintesi vocale (...

#LLM On-Premise
2026-01-22 LocalLLaMA

Generazione LLM lenta? Ecco una possibile causa

Un utente di Reddit ha condiviso un'immagine che illustra come l'elaborazione possa rallentare la generazione di testo nei modelli linguistici di grandi dimensioni (LLM). La visualizzazione mostra in dettaglio i passaggi coinvolti nel processo di gen...

2026-01-22 The Next Web

Digital Networks Act: l'UE punta a modernizzare le reti per l'IA

La Commissione Europea ha proposto il Digital Networks Act (DNA) per ammodernare le reti di telecomunicazioni dell'UE. L'obiettivo è supportare l'infrastruttura di intelligenza artificiale, promuovere l'equità nella connettività e favorire un ecosist...

2026-01-22 LocalLLaMA

LLM: un anno di esperienza nello sviluppo software

Un'analisi sull'uso dei modelli linguistici di grandi dimensioni (LLM) nello sviluppo software, basata su un anno di esperienza professionale. I chatbot si rivelano utili per esplorare il codice e controllare le regressioni. I modelli open source più...

#Hardware
2026-01-22 DigiTimes

Reazioni contrastanti in Cina al blocco di Nvidia H200

I produttori cinesi di chip per l'intelligenza artificiale reagiscono in modo diversificato alla notizia del blocco di Nvidia H200. La decisione potrebbe spingere ulteriormente lo sviluppo di alternative locali, ma solleva anche preoccupazioni sulla ...

#Hardware
2026-01-22 DigiTimes

Mercedes ridimensiona la guida autonoma di Livello 3

Mercedes-Benz rivede i piani per la guida autonoma di Livello 3, sullo sfondo di una trasformazione del settore automobilistico guidata dall'intelligenza artificiale. La casa automobilistica tedesca sembra voler ricalibrare la propria strategia, in u...

2026-01-22 ArXiv cs.CL

LLM e salute mentale: i rischi delle interazioni prolungate

Un nuovo studio mette in guardia sui rischi derivanti dall'uso di modelli linguistici di grandi dimensioni (LLM) nel supporto alla salute mentale. La ricerca evidenzia come, in dialoghi prolungati, gli LLM tendano a superare i limiti di sicurezza, of...

2026-01-22 ArXiv cs.LG

Attacchi GCG: vulnerabilità nei modelli di diffusione linguistica?

Un nuovo studio esplora l'efficacia degli attacchi Greedy Coordinate Gradient (GCG) contro i modelli di diffusione linguistica, un'alternativa emergente ai modelli autoregressivi. La ricerca si concentra su LLaDA, un modello open-source, analizzando ...

#Fine-Tuning
2026-01-22 ArXiv cs.LG

Call center: pipeline automatica per training di LLM con Q&A

Un nuovo studio presenta Call2Instruct, una pipeline automatizzata end-to-end per generare dataset di domande e risposte (Q&A) da registrazioni audio di call center. L'obiettivo è semplificare l'addestramento di modelli linguistici di grandi dimensio...

#Fine-Tuning #RAG
2026-01-22 ArXiv cs.AI

Ontologie neutrali: un nuovo teorema sull'impossibilità

Un nuovo studio su arXiv dimostra che le ontologie neutrali, essenziali per sistemi dati moderni che devono gestire disaccordi legali e politici, non possono includere impegni causali o normativi a livello fondamentale. Questa scoperta impone vincoli...

2026-01-22 DigiTimes

Luxshare: attacco ransomware mette a rischio dati di Apple e Nvidia

Il produttore cinese Luxshare, fornitore chiave di aziende come Apple e Nvidia, sarebbe stato colpito da un attacco ransomware. L'entità dell'attacco e la tipologia di dati potenzialmente compromessi non sono ancora del tutto chiari, ma l'incidente s...

#Hardware
2026-01-22 DigiTimes

EMS: i colossi cinesi si reinventano con IA, auto e consegne globali

I principali produttori cinesi di servizi di produzione elettronica (EMS) stanno riorientando le proprie strategie. L'obiettivo è affrontare le nuove sfide del mercato globale, puntando su hardware per l'intelligenza artificiale, il settore automobil...

#Hardware
2026-01-22 LocalLLaMA

World Labs: il nuovo modello di mondo 3D di Fei Fei Li

Fei Fei Li, figura di spicco nel campo dell'intelligenza artificiale, ha lanciato con World Labs un modello generativo di mondi 3D chiamato Marble. A differenza degli approcci tradizionali, Marble utilizza Neural Radiance Fields (NeRF) e Gaussian spl...

2026-01-22 DigiTimes

Taiwan e USA: nuove strategie su wafer ed energia verde

Il presidente del SAS (Semiconductor Assembly and Streets), ha delineato le sfide future per le industrie di Taiwan e degli Stati Uniti. Annunciate nuove strategie incentrate sulla produzione di wafer e sullo sviluppo di energia verde, con l'obiettiv...

2026-01-22 DigiTimes

TYC espande la produzione automotive negli USA

TYC Brother's, tramite il membro del consiglio di amministrazione Chuang Tai-Shie, annuncia un'espansione della propria presenza nella catena di approvvigionamento automotive con un incremento della produzione negli Stati Uniti. La mossa strategica m...

2026-01-22 DigiTimes

EMS/ODM: Taiwan domina il mercato globale, ricavi in crescita

I produttori taiwanesi di servizi di produzione elettronica (EMS) e original design manufacturer (ODM) si confermano leader globali. Secondo le stime di DIGITIMES, i ricavi del settore sono destinati a crescere significativamente entro il 2025, conso...

2026-01-22 The Register AI

eBay vieta gli shop-bot basati su intelligenza artificiale

eBay ha aggiornato le proprie policy per vietare l'utilizzo di agenti software automatizzati, o shop-bot, alimentati da intelligenza artificiale. La decisione mira a proteggere l'esperienza utente sulla piattaforma di e-commerce.

2026-01-22 DigiTimes

Impennata prevista per le consegne di ASIC cloud nel 2026

Secondo un report di DIGITIMES, il mercato degli ASIC (Application-Specific Integrated Circuit) destinati al cloud è in forte crescita. Si prevede un'impennata delle consegne a partire dal 2026. La capacità di memoria rimane un fattore critico e un p...

#Hardware
2026-01-22 LocalLLaMA

Kimi-Linear-48B: supporto GGUF e integrazione in llama.cpp

Si discute online dell'implementazione di Kimi-Linear-48B in llama.cpp, data la sua efficacia nella gestione di contesti lunghi. La comunità si interroga sui tempi necessari per l'integrazione del modello, che promette miglioramenti significativi nel...

#Hardware #LLM On-Premise
2026-01-22 Phoronix

Linux dice addio a HIPPI, lo standard per supercomputer degli anni '80

Il kernel Linux si prepara a mandare in pensione HIPPI (High Performance Parallel Interface), uno standard di rete per supercomputer nato alla fine degli anni '80. HIPPI consentiva connessioni a quasi 1 Gigabit al secondo su distanze fino a 25 metri....

#Hardware
2026-01-22 DigiTimes

Server AI mandano in tilt le classifiche EMS nel 2024

Secondo quanto riportato da AFP, il 2024 è stato un anno di sconvolgimenti nelle classifiche EMS (Electronic Manufacturing Services) a causa della crescente importanza dei server dedicati all'intelligenza artificiale. Questi sistemi ad alta potenza h...

2026-01-22 DigiTimes

PCB: spedizioni dirette da Taiwan verso gli USA restano limitate

Secondo fonti di DIGITIMES, le spedizioni dirette di circuiti stampati (PCB) da Taiwan verso gli Stati Uniti rimangono contenute. Questo dato evidenzia una possibile riorganizzazione delle catene di approvvigionamento globali nel settore dell'elettro...

2026-01-22 DigiTimes

QCT punta all'integrazione AI con server completi

QCT mira a rafforzare la sua posizione nella catena di approvvigionamento dell'intelligenza artificiale. La società starebbe sviluppando una strategia completa di server per competere nel mercato, integrando verticalmente le proprie soluzioni. L'obie...

#Hardware
2026-01-22 The Register AI

Upscale sfida Nvidia: 200 milioni per il networking AI

La startup Upscale AI ha raccolto 200 milioni di dollari in finanziamenti di Serie A per competere con Nvidia nel mercato degli switch per sistemi AI a livello di rack. L'azienda prevede di utilizzare i fondi per sviluppare i propri switch UALink bas...

#Hardware #Fine-Tuning
2026-01-22 The Register AI

I lavori del futuro nell'IA? Casco e stivali, secondo i guru tech

I leader del mondo dell'intelligenza artificiale si sono riuniti a Davos per il World Economic Forum, offrendo le loro previsioni sull'impatto dell'IA sul mondo del lavoro. Mentre alcuni temono la perdita di posti di lavoro, altri sottolineano la cre...

#Hardware
2026-01-21 The Register AI

Davos: al vaglio le misure di sicurezza per gli agenti di IA

A Davos, i rischi legati agli agenti di intelligenza artificiale sono stati al centro di un panel dedicato alle minacce cyber. In particolare, si è discusso di come proteggere questi sistemi e prevenire che diventino una minaccia interna, sfruttando ...

2026-01-21 TechCrunch AI

Todoist: l'AI detta legge nelle tue liste di cose da fare

Todoist introduce una nuova funzionalità che permette agli utenti di aggiungere attività alle proprie liste semplicemente parlando con l'intelligenza artificiale integrata nell'app. Un modo più naturale e veloce per gestire le proprie consegne.

2026-01-21 TechCrunch AI

Apple punta a trasformare Siri in un chatbot basato su IA

Secondo indiscrezioni, Apple starebbe progettando di evolvere Siri, trasformandola da semplice assistente integrato a chatbot più sofisticato, simile a ChatGPT. Questa mossa segnerebbe un cambiamento significativo nell'approccio di Apple all'intellig...

2026-01-21 The Register AI

L'IA non mantiene le promesse di profitto, secondo Deloitte

Uno studio di Deloitte rivela che, per la maggior parte delle aziende, l'adozione di strumenti di intelligenza artificiale non si è tradotta in un miglioramento dei profitti. Nonostante ciò, i ricercatori continuano a lodare il potenziale della tecni...

2026-01-21 LocalLLaMA

Inferenza LLM: 8 GPU AMD MI50 per prestazioni e convenienza

Una configurazione con otto GPU AMD MI50 da 32GB offre prestazioni notevoli nell'inferenza di modelli linguistici di grandi dimensioni (LLM). Con MiniMax-M2.1 raggiunge i 26 token al secondo, mentre con GLM 4.7 arriva a 15 token al secondo. Il sistem...

#Hardware #LLM On-Premise
2026-01-21 Phoronix

AMD ROCm 7.2: supporto esteso per schede Radeon e nuove funzionalità

AMD ha rilasciato ROCm 7.2, un aggiornamento significativo del suo stack di calcolo GPU open source. La nuova versione estende il supporto a un numero maggiore di schede grafiche Radeon e introduce ROCm Optiq, ampliando le capacità della piattaforma ...

#Hardware
2026-01-21 PyTorch Blog

PyTorch 2.10: Ottimizzazioni e Debug Numerico

La nuova release di PyTorch 2.10 introduce miglioramenti significativi in termini di performance e strumenti per il debug numerico. Tra le novità principali, il supporto sperimentale per Python 3.14, la riduzione della latenza grazie ai combo-kernel,...

#Hardware
2026-01-21 LangChain Blog

Deep Agents: Sviluppare applicazioni multi-agente con IA avanzata

Deep Agents semplifica la creazione di sistemi IA complessi tramite agenti specializzati. Introduce i concetti di subagenti isolati per evitare il sovraccarico del contesto e di skills per svelare progressivamente le capacità. L'articolo illustra com...

2026-01-21 Wired AI

USA e Cina: più collaborazione sull'IA di quanto si pensi

Un'analisi di WIRED su oltre 5.000 pubblicazioni scientifiche presentate a NeurIPS, condotta tramite Codex di OpenAI, rivela aree di insospettabile collaborazione tra Stati Uniti e Cina nella ricerca sull'intelligenza artificiale. I risultati sfidano...

2026-01-21 LocalLLaMA

Lemonade v9.1.4: supporto GLM-4.7-Flash-GGUF e compatibilità LM Studio

Rilasciata la versione 9.1.4 di Lemonade, server locale per modelli linguistici di grandi dimensioni (LLM). Tra le novità, il supporto per GLM-4.7-Flash-GGUF su ROCm e Vulkan, l'importazione di GGUF da LM Studio e miglioramenti al supporto per divers...

#LLM On-Premise #DevOps
2026-01-21 LocalLLaMA

Qwen3-14B affinato con DeepSeek: boost del 20% nella sicurezza

Un ricercatore ha affinato il modello linguistico Qwen3-14B utilizzando 10.000 tracce di DeepSeek, ottenendo un miglioramento del 20% nelle prestazioni di un benchmark di sicurezza personalizzato. Questo dimostra come l'affinamento di modelli più pic...

2026-01-21 Tom's Hardware

V-Color Manta XFinity RGB DDR5-6400: Memorie da 128GB al Top?

Le V-Color Manta XFinity RGB DDR5-6400 si posizionano tra i kit di memoria da 128GB più veloci sul mercato. La domanda chiave è se mantengano le promesse in termini di prestazioni e se giustifichino l'investimento per gli utenti che necessitano di un...

2026-01-21 Tom's Hardware

Colossus 2 di xAI: la potenza reale è lontana dal gigawatt promesso

L'affermazione di Elon Musk riguardo alla capacità di 1 GW per il supercomputer Colossus 2 di xAI è stata messa in discussione. Analisi satellitari suggeriscono che la capacità di raffreddamento del sito indichi una potenza significativamente inferio...

2026-01-21 The Register AI

Trump promette permessi rapidi per data center nucleari

Donald Trump ha promesso di accelerare l'approvazione dei permessi per i data center alimentati da energia nucleare. Jensen Huang, CEO di Nvidia, ha presentato a Davos la sua visione dell'intelligenza artificiale.

#Hardware
2026-01-21 Phoronix

PyTorch 2.10: supporto migliorato per GPU AMD, Intel e NVIDIA

La nuova versione di PyTorch, la 2.10, continua a migliorare il supporto per le GPU Intel e per lo stack di calcolo AMD ROCm. Ulteriori ottimizzazioni sono state implementate anche per le GPU NVIDIA CUDA. Questo aggiornamento si concentra sull'ottimi...

#Hardware
2026-01-21 LocalLLaMA

Microsoft rilascia VibeVoice-ASR per il riconoscimento vocale

Microsoft ha reso disponibile VibeVoice-ASR, un nuovo modello per il riconoscimento automatico del parlato (ASR). Il modello è accessibile tramite Hugging Face, aprendo nuove possibilità per gli sviluppatori che lavorano su applicazioni vocali. La pu...

2026-01-21 404 Media

Palantir: cosa sta realmente sviluppando con ELITE per l'ICE?

Un nuovo podcast analizza ELITE, lo strumento che Palantir sta sviluppando per l'ICE (Immigration and Customs Enforcement). Si discute anche di come gli influencer AI stiano creando immagini false di celebrità in contesti sessualmente espliciti e del...

2026-01-21 Anthropic News

La nuova costituzione di Claude: cosa cambia per l'IA?

Anthropic ha introdotto una nuova costituzione per Claude, il suo modello linguistico di punta. Questo aggiornamento mira a migliorare l'allineamento del modello con i valori umani e a renderlo più sicuro ed efficace nelle sue applicazioni. L'iniziat...

2026-01-21 Tom's Hardware

Intel saluta Alder Lake e Sapphire Rapids: ordini finali in arrivo

Intel ha annunciato la fine del ciclo di vita (EOL) per i processori Alder Lake di 12a generazione e Xeon Sapphire Rapids di 4a generazione. I clienti avranno tempo limitato per effettuare gli ultimi ordini di queste CPU ibride, segnando un passaggio...

#Hardware
2026-01-21 The Register AI

OpenAI rassicura i residenti sulle nuove sedi Stargate

OpenAI cerca di smorzare le preoccupazioni relative ai nuovi datacenter Stargate. L'azienda promette piani che tengano conto delle esigenze locali, minimizzando l'impatto ambientale e sui costi dell'energia elettrica. L'iniziativa giunge in un moment...

2026-01-21 LocalLLaMA

Spunta GLM-OCR, nuovo modello di Z.ai, su GitHub

Un nuovo modello denominato GLM-OCR, proveniente da Z.ai, è stato individuato su GitHub. La scoperta è stata segnalata su Reddit, nel subreddit LocalLLaMA, tramite un post che include un'immagine e link alla discussione e alla risorsa originale. Al m...

2026-01-21 Phoronix

XDG-Desktop-Portal 1.21: supporto Linyaps e riduzione del movimento

È disponibile per i test XDG-Desktop-Portal 1.21, l'ultima versione di questo servizio frontend per Flatpak. Tra le nuove funzionalità spiccano il supporto per le applicazioni Linyaps e un'impostazione per la riduzione del movimento, pensata per migl...

2026-01-21 Tom's Hardware

Nvidia supera Apple: è il primo cliente di TSMC

Jensen Huang, CEO di Nvidia, ha confermato che la sua azienda ha superato Apple come principale cliente di TSMC. Nvidia torna così ad essere il cliente numero uno del produttore di chip, dopo oltre vent'anni. Questo sorpasso evidenzia la crescente im...

#Hardware
2026-01-21 Phoronix

NVIDIA GB10: la CPU sfida AMD Ryzen AI Max+ in test Linux

Il superchip NVIDIA GB10, progettato per l'intelligenza artificiale, è stato testato in scenari Linux tradizionali per valutare le prestazioni della sua CPU. I benchmark di Phoronix mettono a confronto il GB10 con l'AMD Ryzen AI Max+ "Strix Halo" all...

#Hardware
2026-01-21 The Register AI

Palantir: IA ridurrà l'immigrazione nelle economie occidentali?

Alex Karp, CEO di Palantir, ha espresso un'opinione potenzialmente controversa sull'impatto dell'intelligenza artificiale (IA) sull'immigrazione. Secondo Karp, l'IA potrebbe ridurre la necessità di immigrazione nelle economie occidentali. Le sue affe...

2026-01-21 LocalLLaMA

Corretto bug in GLM-4.7-Flash-GGUF: riscaricare per risultati migliori

È stato risolto un bug in GLM-4.7-Flash-GGUF che causava loop e output scadenti. Si raccomanda di riscaricare il modello per ottenere risultati significativamente migliori. Z.ai ha suggerito parametri ottimali per diversi casi d'uso, tra cui l'utiliz...

#LLM On-Premise
2026-01-21 TechCrunch AI

OpenAI punta al mercato hardware: auricolari in arrivo nel 2026?

OpenAI potrebbe lanciare il suo primo dispositivo hardware, forse degli auricolari, già nel 2026. Chris Lehane, Chief Global Affairs Officer di OpenAI, ha annunciato che l'azienda prevede di presentare il suo primo hardware nella seconda metà di ques...

#Hardware
2026-01-21 MIT Technology Review

L'IA aumenterà la produttività senza sostituire i lavoratori

Un nuovo studio di Vanguard prevede che l'intelligenza artificiale (IA) avrà un impatto significativo sulla produttività, paragonabile a quello del personal computer. L'IA andrà ad aumentare le capacità umane piuttosto che sostituirle completamente, ...

2026-01-21 LocalLLaMA

GLM 4.7: guida all'uso con llama.cpp e Flash Attention

Ecco come far funzionare GLM 4.7 su llama.cpp sfruttando Flash Attention per prestazioni superiori. La guida include dettagli sulla configurazione e un link a una branch Git specifica. Si segnala che le quantizzazioni potrebbero richiedere una ricrea...

#Hardware #LLM On-Premise
2026-01-21 Tom's Hardware

IA: Microsoft, serve impatto sociale ampio o rischia di sgonfiarsi

Satya Nadella, CEO di Microsoft, avverte che l'intelligenza artificiale deve generare benefici per un'ampia fetta di popolazione, altrimenti rischia di perdere consenso sociale e trasformarsi in una bolla speculativa. Serve un impatto più esteso per ...

2026-01-21 TechCrunch AI

Zanskar punta a 1 TW di energia geotermica finora sottovalutata

La società Zanskar ha raccolto 115 milioni di dollari per individuare risorse geotermiche negli Stati Uniti occidentali. L'obiettivo è alimentare la rete elettrica con energia pulita, sfruttando un potenziale finora inesplorato. Si prevede che l'iniz...

2026-01-21 IEEE Spectrum

Gli attacchi di prompt injection mettono ancora in difficoltà l'IA

I modelli linguistici di grandi dimensioni (LLM) continuano a essere vulnerabili agli attacchi di prompt injection, una tecnica che induce l'IA a eseguire azioni non autorizzate. La difficoltà risiede nella loro incapacità di comprendere il contesto ...

2026-01-21 LocalLLaMA

Risolto il problema di GLM 4.7 Flash in Llama.cpp

Una correzione per un problema relativo a GLM 4.7 Flash è stata integrata in llama.cpp. Parallelamente, è in corso lo sviluppo del supporto FA (Fused Attention) per CUDA, con l'obiettivo di migliorare ulteriormente le prestazioni e l'efficienza nell'...

#Hardware #LLM On-Premise
2026-01-21 LocalLLaMA

File Brain: ricerca semantica locale open source nei tuoi documenti

File Brain è un motore di ricerca open source che indicizza i file in locale e permette di cercarli usando il linguaggio naturale. Supporta la ricerca semantica multilingue, l'OCR integrato ed è disponibile per Windows e Linux. L'obiettivo è superare...

2026-01-21 TechCrunch AI

Spesa in app mobile supera il gaming nel 2025, trainata dall'IA

Nel 2025, i consumatori hanno speso di più in applicazioni mobile rispetto ai videogiochi. L'adozione di app basate sull'intelligenza artificiale è stata la principale forza trainante di questa crescita, segnando un cambiamento significativo nelle ab...

2026-01-21 TechCrunch AI

Preply: la piattaforma di apprendimento linguistico diventa unicorno

La piattaforma per l'apprendimento delle lingue Preply ha raggiunto una valutazione di 1,2 miliardi di dollari dopo un round di finanziamento da 150 milioni di dollari. Questo traguardo segna un nuovo capitolo per l'azienda, fondata 14 anni fa, e sot...

2026-01-21 Tom's Hardware

Cliente Amazon riceve una RTX 5060 Ti spacciata per RTX 5080

Un acquirente su Amazon ha subito una truffa: al posto di una scheda video RTX 5080, ha ricevuto una RTX 5060 Ti con etichette contraffatte. Il pacco era venduto e spedito da Amazon, suggerendo una possibile sostituzione del prodotto dopo un reso. L'...

#Hardware
2026-01-21 Phoronix

Linux: una riga di codice riduce la latenza su CPU Xeon

Una patch per il kernel Linux promette di ridurre drasticamente la latenza di riattivazione (wakeup latency) sui moderni server Intel Xeon. La modifica, che coinvolge una singola riga di codice, mira a ottimizzare le prestazioni in scenari dove la re...

#Hardware
2026-01-21 Source

Deep Dive sulle nuove features di LLMOnPremise

In questo e altri editoriali che pubblicherò a breve, un approfondimento su alcune nuove funzionalità del Sito gemello di AI-Radar LLMOnPremise.com. In questo caso: Decision Matrix

2026-01-21 DigiTimes

OpenAI punta al 2026 per l'adozione pratica dell'IA e nuove entrate

OpenAI ha fissato il 2026 come anno chiave per la diffusione su larga scala di soluzioni di intelligenza artificiale realmente utilizzabili. L'azienda guarda anche all'ingresso nel mercato hardware e alla diversificazione dei flussi di ricavi, in un ...

#Hardware
2026-01-21 AI News

Citi addestra 4.000 dipendenti all'uso dell'AI

Citi ha intrapreso un'iniziativa interna per integrare l'intelligenza artificiale nel lavoro quotidiano dei suoi dipendenti. Circa 4.000 persone, provenienti da diversi settori aziendali, sono state formate per utilizzare strumenti di AI approvati. L...

2026-01-21 DigiTimes

Sequoia Capital punta su Anthropic: cambio di strategia in vista?

Il fondo di venture capital Sequoia Capital sembra intenzionato a investire in Anthropic, società specializzata in intelligenza artificiale. Questa mossa potrebbe segnalare un cambiamento nella strategia di investimento del fondo, con una maggiore at...

2026-01-21 DigiTimes

Fortune Electric: meno dazi USA e più domanda per data center AI

Fortune Electric beneficia della riduzione dei dazi statunitensi e della crescente domanda di data center per l'intelligenza artificiale. Questi fattori combinati creano un contesto favorevole per l'azienda, migliorando le prospettive di crescita e r...

2026-01-21 DigiTimes

Taiwan: export record a dicembre grazie a server e chip AI

Le esportazioni di Taiwan hanno raggiunto livelli record a dicembre, trainate dalla forte domanda di server e chip per l'intelligenza artificiale. Questo dato sottolinea il ruolo chiave dell'isola nell'industria globale dei semiconduttori e la sua cr...

2026-01-21 The Next Web

Quando la conoscenza aziendale diventa un ostacolo

Un articolo esplora come la conoscenza aziendale, se mal strutturata e trasferita rigidamente, possa trasformarsi da risorsa a svantaggio, sia per le aziende che per i dipendenti. Il processo di onboarding è cruciale: una gestione inadeguata delle in...

2026-01-21 Tech.eu

SWISSto12 ottiene 73 milioni di euro dall'ESA per HummingSat

La società aerospaziale SWISSto12 ha ottenuto 73 milioni di euro dall'ESA per accelerare lo sviluppo della piattaforma HummingSat. I fondi serviranno a industrializzare HummingSat, aumentare la capacità produttiva e promuovere nuove innovazioni di pr...

2026-01-21 Tech.eu

Fracttal raccoglie 35 milioni per la manutenzione potenziata dall'AI

Fracttal, azienda con sede a Madrid specializzata in soluzioni di manutenzione basate sull'intelligenza artificiale, ha chiuso un round di finanziamento da 35 milioni di dollari guidato da Riverwood Capital. L'investimento sosterrà la crescita, lo sv...

#Hardware
2026-01-21 DigiTimes

Davos 2026: l'IA al centro del dibattito tra leader mondiali

Il Forum di Davos 2026 vedrà l'intelligenza artificiale protagonista. I leader globali si confronteranno su temi cruciali come la potenza di calcolo necessaria, il controllo degli algoritmi e le implicazioni etiche e sociali derivanti dal suo svilupp...

2026-01-21 DigiTimes

Mercato auto elettriche: divisioni e competizione nell'edge AI

Il mercato dei veicoli elettrici sta mostrando segni di divisione, mentre si intensifica la competizione nel settore dell'edge AI. Nuove analisi rivelano le tendenze emergenti e le sfide che le aziende devono affrontare per avere successo in questi s...

2026-01-21 LocalLLaMA

Creazione di un LLM da zero: aggiornamento al sesto giorno

Un appassionato condivide i progressi nella creazione di un modello linguistico (LM) da zero. Dopo aver stabilizzato il sistema, l'attenzione si è spostata sull'addestramento, rivelando la necessità di un numero di step significativamente maggiore pe...

#Hardware
2026-01-21 The Register AI

Curl chiude il programma bug bounty per eccesso di segnalazioni AI

Il manutentore del popolare tool open-source Curl ha interrotto il programma di ricompense per bug, in seguito all'aumento di segnalazioni generate dall'intelligenza artificiale. L'iniziativa era diventata ingestibile a causa della difficoltà di valu...

2026-01-21 DigiTimes

Chromebook: consegne stabili nel 2026 malgrado problemi di memorie

Secondo Digitimes, le consegne di Chromebook dovrebbero rimanere stabili nel 2026, nonostante le sfide legate all'approvvigionamento di memorie. Il mercato dei Chromebook è influenzato da diversi fattori, tra cui la domanda del settore education e la...

2026-01-21 DigiTimes

La Cina punta sui grandi modelli di IA per lo sviluppo strategico

Un recente intervento del premier cinese ha posto l'accento sull'importanza dei modelli di intelligenza artificiale di grandi dimensioni (LLM) nello sviluppo strategico del paese. Questa mossa sottolinea l'impegno della Cina nell'innovazione tecnicic...

#Fine-Tuning
2026-01-21 OpenAI Blog

Horizon 1000: OpenAI e Gates Foundation per l'IA in Africa

OpenAI e la Gates Foundation lanciano Horizon 1000, un progetto pilota da 50 milioni di dollari per potenziare l'intelligenza artificiale nel settore sanitario africano. L'iniziativa mira a raggiungere 1.000 cliniche entro il 2028, portando innovazio...

2026-01-21 ArXiv cs.CL

Compass-Embedding v4: rappresentazioni multilingue per l'e-commerce

Presentato Compass-Embedding v4, un framework di embedding multilingue ad alta efficienza, ottimizzato per l'e-commerce nel Sud-est asiatico. Affronta le sfide di scarsità di dati, supervisione rumorosa e vincoli di produzione. Introduce Class-Aware ...

#LLM On-Premise #Fine-Tuning
2026-01-21 ArXiv cs.CL

LLM: Troppa memoria KV penalizza performance e qualità?

Una nuova ricerca analizza il compromesso tra performance e qualità dei modelli linguistici di grandi dimensioni (LLM) quando esposti a contesti ampi e distrattivi. Lo studio evidenzia un degrado non lineare delle performance legato alla crescita del...

2026-01-21 ArXiv cs.LG

AdaFRUGAL: training di modelli LLM più efficiente e adattabile

Un nuovo framework, AdaFRUGAL, promette di ridurre drasticamente il consumo di memoria e i tempi di training per i modelli linguistici di grandi dimensioni (LLM). Grazie a controlli dinamici che automatizzano la gestione degli iperparametri, AdaFRUGA...

#Hardware #Fine-Tuning
2026-01-21 ArXiv cs.LG

CSyMR: Un benchmark per il ragionamento musicale simbolico con LLM

Un nuovo benchmark, CSyMR-Bench, valuta le capacità di ragionamento musicale simbolico dei modelli linguistici di grandi dimensioni (LLM). Il set di dati, composto da domande a scelta multipla derivate da forum di esperti ed esami professionali, rich...

2026-01-21 ArXiv cs.AI

LLM: analisi dei sistemi dinamici svela regimi funzionali

Un nuovo studio esplora l'organizzazione temporale interna dei modelli linguistici di grandi dimensioni (LLM) durante la generazione di testo. I ricercatori hanno adattato concetti di neuroscienze, come l'integrazione temporale, per analizzare le din...

2026-01-21 ArXiv cs.AI

Diagnosi di malattie rare: l'IA è davvero all'altezza?

Un nuovo studio mette in discussione l'efficacia dei modelli linguistici di grandi dimensioni (LLM) nella diagnosi differenziale delle malattie rare. Il benchmark MIMIC-RD rivela che gli LLM attuali faticano a gestire la complessità clinica reale, ev...

#Fine-Tuning
2026-01-21 LocalLLaMA

Camb AI: nuovo modello con latenza minima per lo sport in diretta?

Un utente ha segnalato il lancio di un nuovo modello Camb AI, particolarmente efficace nelle trasmissioni sportive in diretta. L'aspetto più notevole è la sua bassa latenza e l'alta qualità della voce, tanto da risultare indistinguibile da quella uma...

2026-01-21 DigiTimes

Intel assume un ex-capo GPU di Qualcomm per l'AI su PC

Intel ha reclutato un ex dirigente di Qualcomm, specializzato in GPU, per guidare le iniziative future nel campo dell'intelligenza artificiale sui PC. Questa mossa strategica mira a rafforzare la posizione di Intel nel mercato in rapida crescita dei ...

#Hardware
2026-01-21 DigiTimes

OpenAI punta sull'hardware: in arrivo dispositivi audio e altro

Secondo indiscrezioni, OpenAI starebbe pianificando l'ingresso nel mercato hardware con una serie di dispositivi. Il primo della lista sarebbe 'Sweetpea', un prodotto audio. L'azienda sembra intenzionata a diversificare le proprie attività, espandend...

#Hardware
2026-01-21 DigiTimes

Asia Optical punta sui robot umanoidi per la crescita futura

Il presidente di Asia Optical, I-Jen Lai, vede nei robot umanoidi il prossimo motore di crescita dell'azienda. La società sta investendo in questo settore emergente, scommettendo sul potenziale a lungo termine della robotica avanzata. Si prevede un a...

2026-01-21 DigiTimes

oToBrite espande l'AI visiva a veicoli e robot

oToBrite Electronics amplia le sue soluzioni di intelligenza artificiale visiva full-domain. Le fotocamere di livello automobilistico dell'azienda entrano nel mercato dei veicoli senza conducente e della robotica, aprendo nuove opportunità di applica...

2026-01-21 LocalLLaMA

vLLM rilascia la versione 0.14.0: ottimizzazione dei LLM

È stata rilasciata la versione 0.14.0 di vLLM, un framework progettato per ottimizzare l'inferenza dei modelli linguistici di grandi dimensioni (LLM). Questa nuova versione promette miglioramenti nelle prestazioni e nell'efficienza, rendendo più agev...

#LLM On-Premise
2026-01-21 DigiTimes

Nvidia presenta Alpamayo, piattaforma per guida autonoma di livello 4

Nvidia ha annunciato Alpamayo, una nuova piattaforma pensata per lo sviluppo di veicoli a guida autonoma di livello 4. La piattaforma mira a fornire ai produttori di automobili e ai fornitori di tecnicia gli strumenti necessari per accelerare la real...

#Hardware
2026-01-21 DigiTimes

Nvidia sfida Apple per la priorità di TSMC nella produzione di chip

Nvidia punta a scalzare Apple come cliente prioritario di TSMC, il colosso taiwanese della produzione di semiconduttori. La competizione per accaparrarsi le capacità produttive di TSMC si fa sempre più intensa, con importanti implicazioni per il futu...

#Hardware
2026-01-21 DigiTimes

Thailandia: polo ASEAN per PCB grazie a Zhen Ding Tech

La Thailandia si afferma come hub chiave per i PCB (Printed Circuit Board) nell'area ASEAN. Questo grazie a un investimento di 2,1 miliardi di dollari da parte di Zhen Ding Technology, leader nel settore. L'iniziativa consolida la posizione del paese...

2026-01-21 OpenAI Blog

Stargate Community: infrastruttura AI guidata dalla comunità

L'iniziativa Stargate Community adotta un approccio incentrato sulla comunità per l'infrastruttura di intelligenza artificiale. I piani, sviluppati localmente, tengono conto delle esigenze energetiche, delle priorità della forza lavoro e del contribu...

2026-01-21 DigiTimes

Taiwan: maxi-commessa droni e investimenti in microelettronica

Il Ministero della Difesa taiwanese ha annunciato un importante ordine di approvvigionamento di droni, incrementando parallelamente gli investimenti nel settore della progettazione di circuiti integrati (IC) a livello nazionale. La mossa strategica m...

2026-01-21 The Register AI

OpenAI: un modello predittivo per l'età degli utenti di ChatGPT

OpenAI ha iniziato a implementare un sistema di predizione dell'età per i suoi utenti di ChatGPT. L'obiettivo è filtrare l'accesso a contenuti potenzialmente dannosi o inadatti ai minori. Questa iniziativa potrebbe aprire nuove opportunità di monetiz...

2026-01-21 Anthropic News

Mariano-Florentino Cuéllar nel Long-Term Benefit Trust di Anthropic

Anthropic ha annunciato la nomina di Mariano-Florentino Cuéllar al suo Long-Term Benefit Trust. Questo trust supervisiona le attività di Anthropic, assicurando che l'azienda persegua obiettivi di beneficio pubblico a lungo termine nello sviluppo dell...

2026-01-21 DigiTimes

Dazi al 100% mettono in allerta i produttori di memorie di Taiwan

L'imposizione di dazi del 100% rappresenta una seria minaccia per i produttori di memorie di Taiwan. Questa mossa protezionistica potrebbe avere ripercussioni significative sull'industria locale, alterando gli equilibri del mercato globale e spingend...

2026-01-20 DigiTimes

Taiwan: tariffe elettriche scaglionate per i data center

Taiwan introduce tariffe elettriche differenziate per i data center, in risposta al crescente consumo energetico legato all'intelligenza artificiale. La mossa mira a incentivare l'efficienza energetica e a gestire meglio la domanda di elettricità, in...

2026-01-20 DigiTimes

Sony e TCL verso una joint venture nell'home entertainment

Sony e TCL starebbero valutando una joint venture nel settore dell'home entertainment. L'accordo potenziale potrebbe portare a una maggiore collaborazione nello sviluppo e nella produzione di televisori e altri dispositivi per l'intrattenimento domes...

2026-01-20 DigiTimes

Inventec raddoppia gli investimenti 2026 per i server IA

Inventec ha annunciato un raddoppio dei suoi investimenti di capitale previsti per il 2026, portandoli a 1 miliardo di dollari. La decisione è motivata dalle crescenti opportunità nel mercato dei server dedicati all'intelligenza artificiale (IA). L'a...

#Hardware
2026-01-20 LocalLLaMA

Implementazione GLM-4.7-Flash in llama.cpp: problemi confermati

Recenti discussioni indicano che l'implementazione di GLM-4.7-Flash in llama.cpp presenta dei problemi. Le differenze significative nelle logprob rispetto a vLLM potrebbero spiegare comportamenti anomali segnalati dagli utenti, come cicli infiniti e ...

#LLM On-Premise
2026-01-20 TechCrunch AI

ChatGPT: stima l'età degli utenti per proteggere i minori

OpenAI introduce una nuova funzionalità in ChatGPT: il modello ora stima l'età degli utenti. L'obiettivo è prevenire la fornitura di contenuti potenzialmente problematici a persone di età inferiore ai 18 anni, rafforzando le misure di sicurezza per i...

2026-01-20 LocalLLaMA

Giga Potato:free, un modello LLM che sfida i top di gamma?

Un utente ha scoperto un modello linguistico gratuito denominato Giga Potato:free su Kilo Code, rimanendo impressionato dalle sue prestazioni. Secondo i primi test, il modello rivaleggia con Sonnet 4.5 e Opus 4.5, gestendo prompt complessi con risult...

2026-01-20 Google AI Blog

Sundance Institute: ecosistema per l'IA nel cinema

Il Sundance Institute lancia un'iniziativa per creare un ecosistema guidato dalla comunità, focalizzato sull'istruzione e sull'utilizzo dell'intelligenza artificiale (IA) nel settore cinematografico, con l'obiettivo di supportare i creativi e promuov...

2026-01-20 The Next Web

Von der Leyen lancia "Europe Inc.": cambio di passo per l'UE?

Al World Economic Forum di Davos, Ursula von der Leyen ha delineato una possibile svolta nella politica economica europea. L'espressione "Europe Inc.", pur non essendo una legge, rappresenta un segnale politico forte: la Commissione Europea intende a...

2026-01-20 The Register AI

Firefox Nightly: ora disponibile in formato RPM per Linux

Mozilla ha iniziato a distribuire pacchetti RPM nativi di Firefox Nightly, la versione più aggiornata del browser, per le distribuzioni Linux basate su Red Hat e SUSE. Questa mossa offre agli utenti nuove opzioni di installazione per provare le funzi...

2026-01-20 OpenAI Blog

Cisco e OpenAI: agenti AI per l'ingegneria enterprise

Cisco e OpenAI collaborano per ridefinire l'ingegneria enterprise. Il fulcro è Codex, un agente software basato su intelligenza artificiale, integrato nei flussi di lavoro per velocizzare lo sviluppo, automatizzare la correzione di difetti e abilitar...

2026-01-20 OpenAI Blog

ChatGPT: stima dell'età degli utenti per maggiore sicurezza online

OpenAI introduce la stima dell'età su ChatGPT per proteggere gli utenti più giovani. Il sistema valuta se un account appartiene a un minore o a un adulto, applicando tutele specifiche per gli adolescenti. L'azienda prevede di migliorare progressivame...

2026-01-20 The Register AI

VoidLink: il malware Linux creato (quasi) interamente da una IA

Un nuovo malware per Linux, chiamato VoidLink, è stato scoperto mentre prendeva di mira infrastrutture cloud. La particolarità? Secondo i ricercatori, è stato sviluppato quasi interamente da un agente di intelligenza artificiale, probabilmente da un ...

2026-01-20 Phoronix

AMD semplifica l'installazione di vLLM per ROCm

AMD ha introdotto un metodo più semplice per installare vLLM su hardware Radeon/Instinct tramite ROCm. Un nuovo wheel Python facilita l'installazione senza ricorrere a Docker, migliorando l'esperienza per gli sviluppatori che utilizzano GPU AMD per l...

#Hardware #LLM On-Premise #DevOps
2026-01-20 LocalLLaMA

Nuovo dataset LongPage: oltre 6.000 romanzi per addestrare LLM

È stato rilasciato un aggiornamento del dataset LongPage, che ora include oltre 6.000 romanzi completi, corredati di "tracce di ragionamento". Queste tracce suddividono la storia in sezioni gerarchiche, dall'idea generale ai singoli capitoli e scene....

#Fine-Tuning
2026-01-20 Tech.eu

UE lancia 'EU Inc', la struttura per startup a livello europeo

La Commissione Europea ha presentato 'EU Inc', una nuova struttura societaria paneuropea pensata per le startup. L'iniziativa mira a semplificare le operazioni transfrontaliere, offrendo una registrazione centralizzata e standardizzata a livello UE, ...

2026-01-20 Phoronix

LLVM: via libera ai contributi AI, ma con supervisione umana

Il progetto open-source LLVM ha definito una policy per l'integrazione di codice generato tramite intelligenza artificiale. I contributi sviluppati con l'ausilio di strumenti AI saranno accettati, a condizione che un umano esamini e approvi il codice...

2026-01-20 LocalLLaMA

Liquid AI: modello LLM da 1GB per ragionamento on-device

Liquid AI ha rilasciato LFM2.5-1.2B-Thinking, un modello di ragionamento che opera interamente sul dispositivo. Questo modello, addestrato specificamente per il ragionamento conciso, genera tracce di pensiero interne prima di fornire risposte, consen...

2026-01-20 The Register AI

PC AI per l'azienda: la potenza di calcolo è tutto?

L'intelligenza artificiale sta permeando il mondo dell'informatica aziendale. Ma i PC specificamente progettati per l'AI sono davvero così diffusi? Un'analisi del ruolo della potenza di calcolo (TOPS) nell'adozione dei PC AI in ambito enterprise e se...

2026-01-20 TechCrunch AI

Humans&, startup AI 'human-centric', raccoglie 480 milioni di dollari

Humans&, una startup focalizzata su un'intelligenza artificiale che potenzi le persone anziché sostituirle, ha raccolto 480 milioni di dollari in un round di finanziamento seed. La valutazione della società si attesta a 4,48 miliardi di dollari. L'az...

2026-01-20 LocalLLaMA

GLM-4.7-Flash: benchmark da capogiro su H200 e RTX 6000 Ada

Il modello GLM-4.7-Flash mostra prestazioni notevoli in nuovi benchmark. Su una singola GPU H200, raggiunge un picco di 4.398 token al secondo. Con una RTX 6000 Ada, il modello genera 112 token al secondo utilizzando quantizzazione dinamica Unsloth e...

#Hardware #LLM On-Premise
2026-01-20 404 Media

Ohio, ladro di posta si incastra con le storie di Instagram

Un uomo dell'Ohio è stato arrestato con l'accusa di furto di posta dopo aver pubblicato su Instagram foto di carte di credito rubate e interi contenitori di corrispondenza. Le prove online lo hanno collegato al furto di un furgone postale a mano arma...

2026-01-20 MIT Technology Review

Caos degli agenti IA: i dati ci salveranno?

L'adozione degli agenti IA sta crescendo rapidamente, ma molte aziende non sono pronte. Un'infrastruttura dati solida è essenziale per evitare il caos e massimizzare il valore dell'IA. I leader di mercato investono in dati di qualità per garantire l'...

2026-01-20 404 Media

FAA: divieto di volo per droni vicino ad agenti e strutture DHS

La Federal Aviation Administration (FAA) ha istituito una zona di divieto di volo per droni entro 3.000 piedi da strutture e mezzi mobili del Dipartimento per la Sicurezza Interna (DHS). La misura, che rimpiazza un divieto precedente limitato a basi ...

2026-01-20 The Register AI

OpenAI cerca il modello di business: il futuro è nelle mani dell'IA?

Sarah Friar, CFO di OpenAI, ha delineato una visione ottimistica per il futuro dell'azienda, nonostante le sfide economiche attuali. L'articolo esplora come il successo di OpenAI, e potenzialmente l'economia globale, dipendano dalla capacità di trova...

2026-01-20 Phoronix

Linux 7.0: aggiornamenti firmware GPU Intel anche su sistemi non-x86

In arrivo con Linux 7.0 il supporto per aggiornare il firmware delle GPU discrete Intel su sistemi diversi da x86. Le patch necessarie sono pronte per essere integrate nel prossimo ciclo del kernel Linux 6.20~7.0, ampliando la compatibilità hardware ...

#Hardware
2026-01-20 The Register AI

Vulnerabilità in Chainlit espongono i cloud aziendali ad attacchi

Il framework open-source Chainlit presenta due vulnerabilità che potrebbero compromettere seriamente gli ambienti cloud aziendali. Secondo Zafran, le falle sono facilmente sfruttabili e potrebbero portare alla perdita di dati o al controllo completo ...

2026-01-20 LocalLLaMA

DeepSeek: spunta un nuovo modello, nome in codice "model1"

Una repository di DeepSeek è stata aggiornata con un riferimento a un nuovo modello identificato come "model1". La scoperta è avvenuta tramite un file all'interno della repository FlashMLA di DeepSeek su GitHub. Al momento non sono disponibili ulteri...

2026-01-20 TechCrunch AI

Emergent: startup indiana di vibe-coding raccoglie $70M

La startup indiana Emergent, specializzata in "vibe-coding", ha annunciato un round di finanziamento da 70 milioni di dollari, raggiungendo una valutazione di 300 milioni. Tra gli investitori figurano SoftBank e Khosla Ventures. L'azienda punta a rag...

2026-01-20 OpenAI Blog

ServiceNow integra OpenAI per l'AI enterprise

ServiceNow potenzia la sua piattaforma integrando i modelli avanzati di OpenAI. L'obiettivo è migliorare i flussi di lavoro aziendali basati sull'intelligenza artificiale, la sintesi di informazioni, la ricerca e le funzionalità vocali all'interno de...

2026-01-20 Tech.eu

Regno Unito: rimborso visti per i talenti tech esteri

Il governo britannico ha annunciato un pacchetto di misure per attrarre talenti nel settore tecnicico, offrendo il rimborso delle spese per il visto a figure chiave che lavorano in startup promettenti nel Regno Unito. L'iniziativa mira a posizionare ...

2026-01-20 The Register AI

Windows 11 ha innescato il ciclo di upgrade dei PC, non l'AI

Nel 2025, l'aggiornamento dell'hardware aziendale è stato guidato dalla necessità di mantenere il supporto, piuttosto che dall'entusiasmo per le nuove funzionalità legate all'intelligenza artificiale. I reparti IT hanno rinnovato i sistemi per restar...

#Hardware
2026-01-20 LocalLLaMA

LocalLLaMA: l'inarrestabile ascesa dei modelli linguistici locali

Un post su Reddit mette in evidenza le capacità sorprendenti dei modelli linguistici eseguiti in locale con LocalLLaMA. La discussione sottolinea come questi modelli, pur girando su hardware consumer, dimostrino una comprensione del contesto e una ca...

#Hardware
2026-01-20 LocalLLaMA

GLM-4.7-Flash: un modello LLM con un processo di pensiero chiaro

Un utente ha testato GLM-4.7-Flash e ha notato un processo di pensiero molto chiaro, suddiviso in fasi distinte come l'analisi della richiesta, il brainstorming, la stesura e la revisione della risposta. Nonostante la maggiore durata del processo, il...

#Fine-Tuning
2026-01-20 Tom's Hardware

Micron acquisisce sito produttivo PSMC a Taiwan per 1,8 miliardi

Micron Technology ha annunciato l'acquisizione di un sito produttivo da PSMC (Powerchip Semiconductor Manufacturing Corp.) a Taiwan per 1,8 miliardi di dollari. L'operazione mira a espandere le capacità produttive di Micron nella regione. L'accordo s...

2026-01-20 The Register AI

Windows 95: il trucco (bizzarro) per riavvii più veloci

Un veterano di Microsoft svela un metodo inatteso per velocizzare il riavvio di Windows 95: tenere premuto il tasto Shift. Questa semplice azione apparentemente bypassava alcuni processi, riducendo i tempi di attesa. Un aneddoto che riporta alla luce...

2026-01-20 LocalLLaMA

GLM-4.7-Flash: il modello di Z.ai per inferenza locale

Z.ai ha presentato GLM-4.7-Flash, un modello MoE da 30B progettato per l'inferenza locale. Ottimizzato per coding, workflow agent e chat, il modello vanta prestazioni elevate con soli 3.6B di parametri attivi e supporta un contesto di 200K token. GLM...

#Fine-Tuning
2026-01-20 The Next Web

Odoo supera i 7 miliardi di valutazione con General Atlantic

La società belga di software gestionali Odoo ha raggiunto una nuova valutazione record, superando i 7 miliardi di euro. L'investitore General Atlantic ha aumentato la sua quota, acquistando ulteriori azioni da Wallonie Entreprendre. L'operazione non ...

2026-01-20 Phoronix

DragonFlyBSD: supporto opzionale per AMD GCN 1.1 nel driver AMDGPU

Il driver grafico del kernel AMDGPU di DragonFlyBSD continua a essere una derivazione del driver del kernel Linux AMDGPU. L'ultimo sforzo di porting per la grafica AMD su DragonFlyBSD abilita ora il supporto opzionale per i processori grafici GCN 1.1...

#Hardware
2026-01-20 Tom's Hardware

Tesla rilancia il supercomputer Dojo con chip AI5 proprietario

Elon Musk ha annunciato la ripresa del progetto Dojo, il supercomputer di Tesla. Il rinnovato interesse è legato ai progressi nella progettazione del chip AI5, interamente sviluppato internamente. Dojo sarà il primo supercomputer Tesla a usare hardwa...

#Hardware
2026-01-20 Wired AI

Compagni digitali: boom di fidanzati virtuali basati su IA in Cina

Le donne della Gen Z in Cina stanno abbracciando in massa la compagnia digitale offerta da fidanzati virtuali basati sull'intelligenza artificiale. Alcune arrivano persino ad organizzare incontri con persone reali che replicano le caratteristiche dei...

2026-01-20 Tom's Hardware

NYSE verso un mercato tokenizzato attivo 24/7 basato su blockchain

Il New York Stock Exchange (NYSE) sta valutando la creazione di una piattaforma di scambio per azioni ed ETF tokenizzati, operativa 24 ore su 24, 7 giorni su 7. L'iniziativa mira a sfruttare la tecnicia blockchain per modernizzare le negoziazioni e c...

2026-01-20 The Register AI

Regno Unito cerca CTO per la sanità: stipendio fino a 335.000 €

Il Dipartimento della Salute e dell'Assistenza Sociale inglese è alla ricerca di un responsabile per la tecnicia, il digitale e i dati. La retribuzione massima offerta è di 285.000 sterline annue, cifra superiore a quella del diretto superiore. Il ru...

2026-01-20 DigiTimes

Server AI: boom per la supply chain di Taiwan previsto nel 2025

Si prevede che la domanda di server AI avrà un impatto significativo sulla supply chain di Taiwan nel 2025. I maggiori beneficiari saranno i produttori ODM/EMS, le aziende specializzate in sistemi di raffreddamento e i fornitori di componenti ottici....

#Hardware
2026-01-20 Tech.eu

Orbem raccoglie 55,5 milioni di euro per l'imaging MRI con IA

La società deeptech Orbem, con sede a Monaco, ha chiuso un round di finanziamento di Serie B da 55,5 milioni di euro. L'azienda utilizza l'intelligenza artificiale per industrializzare la risonanza magnetica, con applicazioni in agricoltura, produzio...

2026-01-20 The Next Web

Eventi tech: i leader del settore preferiscono incontri più mirati

Un tempo, gli eventi tecnicici puntavano sulla quantità. Più partecipanti significavano maggiore successo. Ma questo modello è superato. Oggi, i leader del settore cercano eventi più ristretti e mirati, dove la qualità delle interazioni è superiore a...

2026-01-20 Tech.eu

Stilla: 5 milioni per l'AI che potenzia la collaborazione nei team

Stilla, startup con sede a Stoccolma, ha raccolto 5 milioni di dollari per sviluppare una piattaforma che migliora la collaborazione tra persone e sistemi di intelligenza artificiale. L'obiettivo è fornire un livello di intelligenza che connetta stru...

2026-01-20 DigiTimes

Musk sfida Wikipedia con una nuova piattaforma di conoscenza

Elon Musk si prepara a lanciare una piattaforma di conoscenza, entrando in competizione diretta con Wikipedia. La mossa arriva mentre Wikipedia intensifica le collaborazioni nel campo dei dati e dell'intelligenza artificiale, aprendo nuove prospettiv...

2026-01-20 LocalLLaMA

Deepseek-R1: un anno dal rilascio del modello linguistico

È trascorso un anno dal lancio di Deepseek-R1, un modello linguistico che ha suscitato interesse nella comunità. La notizia è stata diffusa tramite un post su Reddit, segnalando l'anniversario del rilascio e invitando a ulteriori discussioni sul mode...

2026-01-20 LocalLLaMA

GLM 4.7 Flash GGUF disponibile grazie a Bartowski

Bartowski ha rilasciato GLM 4.7 Flash GGUF, una nuova versione del modello linguistico. I file sono disponibili su Hugging Face. La comunità di LocalLLaMA discute attivamente le implicazioni e le potenzialità di questa nuova consegna. L'iniziativa mi...

2026-01-20 DigiTimes

Tensioni sulla catena di approvvigionamento delle terre rare

Le strategie della catena di approvvigionamento sono in fase di revisione a causa delle nuove restrizioni cinesi sull'esportazione di terre rare. La mossa ha generato preoccupazioni a livello globale, spingendo le aziende a diversificare le proprie f...

2026-01-20 DigiTimes

Taiwan punta sugli algoritmi per la prossima crescita degli IC

I progettisti di circuiti integrati (IC) di Taiwan stanno investendo in nuovi algoritmi per alimentare la prossima ondata di crescita del settore. L'obiettivo è migliorare l'efficienza e l'innovazione nella progettazione dei chip, in un mercato sempr...

2026-01-20 DigiTimes

CviLux capitalizza il boom dei server AI grazie ai connettori HVDC

CviLux beneficia della crescente domanda di server basati su intelligenza artificiale. La transizione verso sistemi di alimentazione HVDC (High Voltage Direct Current) nei data center sta generando nuove opportunità nel mercato dei connettori, con Cv...

2026-01-20 DigiTimes

Nvidia Alpamayo: scatta la corsa alla potenza di calcolo VLA

Nvidia ha presentato Alpamayo, una serie di modelli vision-language-action (VLA) open-source, aprendo una nuova fase nello sviluppo della guida autonoma. La presentazione ha intensificato la competizione tra le case automobilistiche globali, che ora ...

#Hardware
2026-01-20 DigiTimes

Alibaba integra l'IA Qwen direttamente nei servizi consumer

Alibaba sta espandendo l'integrazione del suo modello di intelligenza artificiale Qwen direttamente nei servizi rivolti ai consumatori. Questa mossa strategica mira a migliorare l'esperienza utente e a offrire funzionalità avanzate basate sull'IA in ...

2026-01-20 DigiTimes

Cina: prezzi delle terre rare in aumento per il sesto trimestre

I prezzi delle terre rare in Cina continuano a salire, segnando il sesto trimestre consecutivo di aumenti. Questa tendenza al rialzo sta riportando pressioni inflazionistiche sulla catena di approvvigionamento globale, con potenziali impatti su diver...

2026-01-20 DigiTimes

Nvidia punta a lanciare notebook Windows on Arm nel 2026

Secondo indiscrezioni, Nvidia starebbe pianificando di entrare nel mercato dei notebook Windows on Arm a partire dal 2026. Questa mossa strategica potrebbe portare a una maggiore competizione nel settore dei processori per PC portatili, attualmente d...

#Hardware
2026-01-20 DigiTimes

Architetture server AI: connettori di alimentazione in forte crescita

L'evoluzione delle architetture di alimentazione dei server dedicati all'intelligenza artificiale sta generando una crescita significativa nel settore dei connettori di alimentazione. Questo sviluppo è trainato dalla crescente domanda di soluzioni di...

#Hardware
2026-01-20 DigiTimes

HTC punta sull'AI con i suoi visori AR e partnership in Cina

HTC sta accelerando lo sviluppo del suo ecosistema di visori per realtà aumentata (AR) integrati con intelligenza artificiale. La società taiwanese ha delineato una roadmap per l'AR e sta stringendo collaborazioni in Cina per l'integrazione di modell...

2026-01-20 LocalLLaMA

Unsloth rilascia GLM-4.7-Flash in formato GGUF

Unsloth ha reso disponibile il modello linguistico GLM-4.7-Flash nel formato GGUF (GPT-Generated Unified Format). Questo formato facilita l'utilizzo del modello su diverse piattaforme hardware, rendendolo accessibile a un pubblico più ampio di svilup...

#Hardware
2026-01-20 LocalLLaMA

Disponibile GLM-4.7-Flash-GGUF per l'inferenza locale di LLM

È stata rilasciata una nuova versione di GLM-4.7-Flash-GGUF, un modello linguistico di grandi dimensioni (LLM) progettato per l'inferenza locale. Questa implementazione, disponibile su Hugging Face, permette agli utenti di eseguire il modello diretta...

#Hardware
2026-01-20 OpenAI Blog

L'IA per l'auto-potenziamento: nuove opportunità di crescita

L'intelligenza artificiale può ampliare le capacità umane, colmando il divario di competenze e sbloccando nuove opportunità di produttività e crescita per individui, aziende e nazioni. Un'analisi su come l'IA può favorire l'auto-potenziamento e lo sv...

2026-01-19 LocalLLaMA

GLM 4.7 Flash: supporto ufficiale integrato in llama.cpp

Il supporto ufficiale per GLM 4.7 Flash è stato integrato in llama.cpp. Questa integrazione, segnalata su Reddit, permette agli sviluppatori di sfruttare al meglio le capacità di GLM 4.7 Flash all'interno dell'ambiente llama.cpp, aprendo nuove possib...

#Hardware #LLM On-Premise
2026-01-19 LocalLLaMA

GLM 4.7 Flash: un agente LLM affidabile per hardware meno potenti?

Un utente segnala ottime prestazioni di GLM 4.7 Flash come agente LLM, anche su sistemi con GPU meno potenti. Il modello sembra gestire task complessi come la clonazione di repository GitHub e la modifica di file senza errori, aprendo nuove possibili...

#Hardware
2026-01-19 Phoronix

Valve: miglioramenti al power management per GPU AMD GCN 1.0

Un contractor di Valve ha significativamente migliorato il driver AMDGPU per le vecchie GPU GCN 1.0 e GCN 1.1. Grazie a Linux 6.19, AMDGPU è ora l'impostazione predefinita per queste GPU, offrendo prestazioni superiori e supporto RADV Vulkan. Ulterio...

#Hardware
2026-01-19 LocalLLaMA

Gemma 3:1b: quali sono i casi d'uso dei modelli piccoli?

Un utente si interroga sui possibili impieghi di modelli di linguaggio di dimensioni ridotte come Gemma 3:1b. Questi modelli, pur girando su hardware meno potente, aprono scenari interessanti. Resta da capire se siano adatti per compiti di base o cal...

#Hardware
2026-01-19 Ars Technica AI

Musk chiede 134 miliardi a OpenAI: "Calcoli inventati?"

Elon Musk ha intentato una causa contro OpenAI, chiedendo un risarcimento danni compreso tra 79 e 134 miliardi di dollari. Musk accusa OpenAI di aver abbandonato la sua missione no-profit e di averlo "preso in giro" come investitore iniziale. L'ammon...

2026-01-19 TechCrunch AI

USA: startup IA raccolgono finanziamenti record nel 2025

Il 2024 è stato un anno cruciale per l'intelligenza artificiale negli Stati Uniti e non solo. Resta da vedere se il 2025 sarà altrettanto positivo. Un'analisi rivela che numerose startup del settore hanno raccolto finanziamenti superiori a 100 milion...

2026-01-19 LocalLLaMA

Nvidia GB10 vs GH200: primi benchmark di performance

Trapelano online i primi benchmark che confrontano le performance della GPU Nvidia GB10 con la GH200. I dati, provenienti da una fonte su Reddit, offrono un'anteprima delle potenzialità della nuova architettura di Nvidia, sebbene vadano presi con le ...

#Hardware
2026-01-19 LocalLLaMA

llama.cpp adotta l'API Messages di Anthropic

La libreria llama.cpp ha integrato la Messages API di Anthropic, aprendo nuove possibilità per l'interazione con i modelli linguistici. Questa integrazione, annunciata su Reddit e Hugging Face, permette agli sviluppatori di sfruttare al meglio le cap...

#LLM On-Premise
2026-01-19 LocalLLaMA

Z-AI (GLM): Sviluppatori scelgono la via 'aggressiva'

Gli sviluppatori di Z-AI (GLM) hanno intrapreso una strategia di sviluppo definita 'aggressiva'. Un post su Reddit evidenzia questa scelta, suggerendo una competizione diretta con altri team, in particolare quelli di Qwen. La discussione online si co...

2026-01-19 Tom's Hardware

Eric Demers, padre di Radeon e Adreno, passa da Qualcomm a Intel

Eric Demers, figura chiave nello sviluppo delle GPU Radeon e Adreno, lascia Qualcomm dopo 14 anni per approdare in Intel. Questa mossa rappresenta un importante rinforzo per il team di Intel, guidato da Lip-Bu Tan, nel settore delle schede grafiche d...

#Hardware
2026-01-19 LocalLLaMA

GLM-4.7-Flash: un modello da 30B impressionante nel BrowseComp

Un post su Reddit evidenzia le prestazioni del modello GLM-4.7-Flash da 30 miliardi di parametri nel contesto di BrowseComp, suggerendo che Qwen potrebbe dover recuperare terreno. Il confronto include anche GPT-OSS-20B. Il modello è disponibile su Hu...

2026-01-19 LocalLLaMA

Rilasciato GLM 4.7 Flash: incrementi prestazionali?

È stata annunciata la release di GLM 4.7 Flash. La comunità open source si interroga sui potenziali incrementi prestazionali rispetto a Qwen 30b, con particolare attenzione ai benchmark. Al momento mancano dati oggettivi a supporto.

#Fine-Tuning
2026-01-19 LocalLLaMA

GLM-4.7-Flash: nuovo modello linguistico open-source su Hugging Face

È disponibile su Hugging Face il modello linguistico GLM-4.7-Flash. La notizia è stata diffusa su Reddit, aprendo un filone di discussione nella comunità LocalLLaMA. Il modello open-source promette nuove opportunità per lo sviluppo di applicazioni di...

2026-01-19 IEEE Spectrum

L'IA accelera le carriere scientifiche, ma appiattisce la scoperta

Un'analisi di oltre 40 milioni di articoli scientifici rivela che gli scienziati che utilizzano strumenti di IA pubblicano di più e raggiungono posizioni di leadership più velocemente. Tuttavia, la ricerca basata sull'IA tende a concentrarsi su aree ...

2026-01-19 LocalLLaMA

Agente browser on-device con Qwen: demo in locale su Chrome

Una nuova demo mostra un agente browser locale, basato su Web GPU Liquid LFM e sui modelli Qwen di Alibaba, in esecuzione come estensione di Chrome. L'agente apre 'All in Podcast' su YouTube. Il codice sorgente è disponibile su GitHub per chi volesse...

#Hardware
2026-01-19 LocalLLaMA

In arrivo GLM-4.7-Flash: indiscrezioni sul nuovo modello linguistico

Trapelano indizi su un possibile rilascio imminente di GLM-4.7-Flash. Un aggiornamento della collezione GLM-4.7, contenente un elemento nascosto, ha destato l'attenzione degli esperti. Le prime analisi suggeriscono che Zai stia preparando il lancio d...

#LLM On-Premise
2026-01-19 Phoronix

Ray tracing: il driver RADV Vulkan accelera le prestazioni

Il driver RADV Vulkan di Valve continua a migliorare le prestazioni del ray tracing su Linux. L'ultima implementazione, HPLOC, promette un ulteriore incremento prestazionale per i giochi che sfruttano questa tecnicia. Mesa 26.0 includerà questo aggio...

#Hardware
2026-01-19 Phoronix

Intel LLM-Scaler-Omni: miglioramenti per ComfyUI e SGLang su Arc Graphics

Intel ha rilasciato un aggiornamento per LLM Scaler Omni, focalizzato sulla generazione di immagini, audio e video tramite Omni Studio e Omni Serving. Questa release segue l'aggiornamento della scorsa settimana di Intel LLM-Scaler-vLLM, progettato pe...

#Hardware #LLM On-Premise
2026-01-19 Phoronix

Tool per SPDX SBOM proposto per il kernel Linux

Una serie di patch proposte per il kernel Linux introduce un tool di generazione SPDX SBOM. L'obiettivo è aumentare la trasparenza dei componenti software, migliorare la gestione delle vulnerabilità, garantire la conformità delle licenze e proteggere...

2026-01-19 LocalLLaMA

Top-K: algoritmo ottimizzato fino a 20x più veloce di PyTorch

Un tecnico ha sviluppato un'implementazione ottimizzata di Top-K, cruciale per il campionamento nei modelli linguistici di grandi dimensioni (LLM). L'ottimizzazione, basata su AVX2, surclassa le prestazioni di PyTorch su CPU da 4 a 20 volte, a second...

#Hardware #LLM On-Premise
2026-01-19 The Next Web

L'Europa investe 307 milioni di euro in progetti di IA

La Commissione Europea ha stanziato 307,3 milioni di euro per finanziare progetti di intelligenza artificiale e tecnicie correlate nell'ambito del programma Horizon Europe. L'iniziativa mira a promuovere un'IA affidabile e l'autonomia digitale europe...

2026-01-19 Tech.eu

CoolSem raccoglie finanziamenti per il thermal management dei wafer

CoolSem Technologies, con sede nei Paesi Bassi, ha chiuso un round di finanziamento pre-seed guidato da High-Tech Gründerfonds (HTGF). L'azienda sviluppa soluzioni avanzate per la gestione termica a livello di wafer, con l'obiettivo di migliorare l'e...

#Hardware
2026-01-19 DigiTimes

Tesla accelera lo sviluppo di chip AI nonostante le sfide

Tesla sta intensificando gli sforzi nello sviluppo di chip per l'intelligenza artificiale. Questa mossa arriva in un momento cruciale, mentre l'azienda affronta sfide significative legate alla sicurezza e al software dei suoi veicoli. L'obiettivo è m...

2026-01-19 DigiTimes

Taiwan si ritaglia una nicchia nella robotica umanoide

Taiwan si sta posizionando come un attore chiave nel settore della robotica, in particolare nello sviluppo di umanoidi. L'isola punta a sfruttare le proprie competenze tecniciche e industriali per competere in questo mercato in crescita, con un focus...

2026-01-19 LocalLLaMA

JARVIS: Aggiornamenti sullo sviluppo di un agente LLM

Un utente di Reddit ha condiviso un aggiornamento sullo sviluppo di JARVIS, un agente basato su modelli linguistici di grandi dimensioni (LLM). Il post originale include un link a un video dimostrativo del progetto. Lo sviluppo di agenti LLM rapprese...

2026-01-19 DigiTimes

Quanta accelera le assunzioni per la forte domanda di server IA

Quanta Computer sta intensificando le assunzioni e ampliando le proprie attività per far fronte alla sostenuta domanda di server dedicati all'intelligenza artificiale. La società punta a rafforzare la propria posizione in un mercato in rapida espansi...

#Hardware
2026-01-19 DigiTimes

L'Europa punta a rafforzare la rete internet satellitare OneWeb

L'Europa intensifica gli sforzi per consolidare la propria infrastruttura internet satellitare attraverso un nuovo ordine per la costellazione OneWeb. Questa mossa strategica mira a garantire una maggiore autonomia e resilienza nel settore delle comu...

2026-01-19 ArXiv cs.CL

Agent conversazionali: la concisione ne riduce la competenza?

Un nuovo studio analizza gli effetti collaterali inattesi derivanti dall'uso di specifiche caratteristiche stilistiche nei prompt per agent conversazionali basati su modelli linguistici di grandi dimensioni (LLM). La ricerca rivela come la richiesta ...

#Fine-Tuning
2026-01-19 ArXiv cs.CL

BYOL: un framework per LLM su misura per lingue a basse risorse

Un nuovo studio introduce BYOL, un framework per migliorare le prestazioni dei modelli linguistici di grandi dimensioni (LLM) in lingue con scarsa presenza digitale. BYOL classifica le lingue in base alle risorse disponibili e adatta le tecniche di t...

2026-01-19 ArXiv cs.AI

LLM: come valutano l'affidabilità delle informazioni online?

I modelli linguistici di grandi dimensioni (LLM) stanno diventando sempre più importanti nei sistemi di ricerca e raccomandazione online. Una nuova ricerca analizza come questi modelli codificano l'affidabilità percepita nelle narrazioni web, rivelan...

#Fine-Tuning
2026-01-19 ArXiv cs.AI

Giappone: sistema di agenti AI per la vaccinazione contro l'HPV

Un nuovo sistema di agenti basato su intelligenza artificiale è stato sviluppato in Giappone per affrontare le esitazioni sulla vaccinazione contro il papillomavirus umano (HPV). Il sistema fornisce informazioni verificate tramite un'interfaccia conv...

2026-01-19 DigiTimes

Fotocamera e semiconduttori: Asia Optical nel mirino

I produttori di componenti ottici rafforzano i legami con le aziende di semiconduttori nella corsa alla fotonica del silicio. Asia Optical è tra le società più interessanti per queste partnership strategiche. Il presidente di Asia Optical, I-Jen Lai,...

2026-01-19 LocalLLaMA

cuda-nn: motore di inferenza MoE in Rust/CUDA senza PyTorch

È stato presentato cuda-nn, un motore di inferenza MoE (Mixture of Experts) sviluppato in Rust, Go e CUDA. Questo progetto open source si distingue per la sua capacità di gestire modelli con 6,9 miliardi di parametri senza l'ausilio di PyTorch, grazi...

2026-01-19 LocalLLaMA

OpenAI dovrebbe rilasciare GPT-4o in open source? Un'opinione

Un utente ha suggerito che OpenAI dovrebbe rilasciare il modello GPT-4o in open source. Nonostante le preoccupazioni relative alla sicurezza, l'iniziativa potrebbe coprire le attività open source di OpenAI per i prossimi mesi e consentirebbe di rispa...

#Fine-Tuning
2026-01-19 LocalLLaMA

Strix Halo come server LLM: quale distribuzione Linux scegliere?

Un utente sta valutando di utilizzare il proprio Strix Halo come server per modelli linguistici di grandi dimensioni (LLM) e media server, cercando la distribuzione Linux più adatta. Fedora 43 è già installata, ma si valutano alternative per un suppo...

2026-01-19 LocalLLaMA

Chatterbox: picchi di memoria durante la conversione di PDF?

Un utente segnala un problema di consumo eccessivo di memoria con Chatterbox-TTS-Server durante la conversione di un PDF in audiolibro. Il processo, basato su una fast API wrapper, incrementa l'utilizzo della memoria da 3GB a oltre 8GB elaborando pic...

2026-01-19 LocalLLaMA

DetLLM: strumento per garantire inferenza deterministica negli LLM

Uno sviluppatore ha creato DetLLM per risolvere il problema della non riproducibilità nell'inferenza degli LLM. Lo strumento verifica la ripetibilità a livello di token, genera un report e crea un pacchetto di riproduzione minimo per ogni esecuzione,...

2026-01-19 LocalLLaMA

SLM e Prompt: come superare i modelli linguistici più grandi?

Un utente si chiede come ottenere il massimo dai modelli linguistici di dimensioni ridotte (SLM), in particolare quando sono ottimizzati per un argomento specifico. La sfida è che i prompt tradizionali, efficaci con i modelli linguistici di grandi di...

2026-01-19 DigiTimes

Dazi USA-Taiwan: cooperazione nella difesa si intensifica

Secondo DIGITIMES, i legami tra Stati Uniti e Taiwan nel settore della difesa si stanno rafforzando, grazie anche a un tetto massimo del 15% sui dazi. Questa mossa sottolinea la crescente collaborazione tra le due nazioni in un'area strategicamente c...

2026-01-19 DigiTimes

OpenAI investe 10 miliardi di dollari in chip IA di Cerebras

OpenAI ha scelto Cerebras per un progetto di sviluppo di chip per l'intelligenza artificiale che prevede un investimento di 10 miliardi di dollari. La collaborazione mira a potenziare le capacità di calcolo necessarie per i modelli di linguaggio di g...

#Hardware
2026-01-19 LocalLLaMA

Configurazione hardware con 3 GPU V620 per 96GB di VRAM

Un utente ha condiviso online la propria nuova configurazione hardware, che include tre schede grafiche V620 per un totale di 96GB di VRAM. Questa configurazione è pensata per applicazioni che richiedono elevate capacità di memoria video, come l'adde...

#Hardware
2026-01-19 LocalLLaMA

GFN v2.5.0: inferenza O(1) e sequenze extrapolate 500x

Presentata la versione 2.5.0 di GFN (Geodesic Flow Networks), un'architettura che riformula il sequence modeling come dinamica di particelle. GFN offre inferenza O(1) e stabilità grazie all'integrazione simplettica. Dimostrata la generalizzazione zer...

#Fine-Tuning
2026-01-18 DigiTimes

AI: identità macchina superano quelle umane in Asia-Pacifico

L'intelligenza artificiale sta rimodellando il panorama della sicurezza informatica nella regione Asia-Pacifico, con un aumento esponenziale delle identità macchina. Questo cambiamento impone nuove sfide per la protezione dei sistemi e dei dati, rich...

2026-01-18 DigiTimes

Polarizzatori di Taiwan puntano su medicale e semiconduttori

I produttori taiwanesi di polarizzatori stanno diversificando la loro attività, spostandosi dai mercati tradizionali verso settori più specializzati come il medicale e i semiconduttori. Questa strategia è una risposta alla sovrabbondanza di offerta p...

2026-01-18 LocalLLaMA

Come si pronuncia "GGUF"? Il dilemma della pronuncia nell'AI

La pronuncia di "GGUF", un formato di file utilizzato nell'ambito dell'intelligenza artificiale, sta generando un acceso dibattito nella comunità. Le opzioni più comuni includono "jee-guff", "giguff" e "jee jee you eff". La discussione evidenzia le s...

2026-01-18 LocalLLaMA

Gli agenti LLM usano liste di cose da fare?

Un utente ha sollevato un interrogativo interessante riguardo all'architettura interna dei principali agenti basati su modelli linguistici di grandi dimensioni (LLM). Sembra che molti di questi agenti suddividano i compiti complessi in semplici liste...

2026-01-18 LocalLLaMA

Supporto ROCm/Linux per Strix Halo: aggiornamento previsto per il 2026

Un utente ha segnalato su Reddit il futuro rilascio di un aggiornamento di stabilità per il supporto ROCm e Linux su Strix Halo. La consegna, prevista per gennaio 2026, mira a migliorare l'integrazione di queste tecnicie. Strix Halo è una piattaforma...

#Hardware
2026-01-18 LocalLLaMA

RLVR e GRPO: implementazione da zero con notebook

È disponibile un notebook di codice che illustra l'implementazione da zero di RLVR (Reinforcement Learning Value Retrieval) con GRPO (Gradient Ratio Policy Optimization). La risorsa, ospitata su GitHub, è stata condivisa su Reddit ed è pensata per ch...

2026-01-18 Phoronix

Linux 6.19: risolti problemi USB su Mac M1/M2

In arrivo con Linux 6.19-rc6, due correzioni USB specifiche per i Mac Apple con chip M1 e M2. Le patch, destinate al kernel principale, verranno retro-portate alle versioni stabili di Linux. Questo dovrebbe migliorare la compatibilità hardware per ch...

#Hardware
2026-01-18 OpenAI Blog

OpenAI: un modello di business scalabile con l'intelligenza

Il modello di business di OpenAI si espande in parallelo con le capacità dell'intelligenza artificiale. L'azienda sfrutta abbonamenti, API, pubblicità, commercio ed elaborazione, alimentati dalla crescente adozione di ChatGPT. Questa strategia permet...

2026-01-18 Tom's Hardware

Tesla: nuovi chip AI ogni nove mesi, sfida a Nvidia e AMD

Elon Musk punta a un ciclo di sviluppo e rilascio di nuovi acceleratori AI più rapido rispetto a quello di Nvidia e AMD. L'obiettivo è produrre chip in volumi elevatissimi, ma la sfida ingegneristica è notevole. Tesla intende così accelerare la propr...

#Hardware #Fine-Tuning
2026-01-18 LocalLLaMA

Mercato GPU in Germania e UE: situazione critica

Un post su Reddit evidenzia le difficoltà nel reperire alcune schede grafiche (GPU) in Germania e nell'Unione Europea. La disponibilità limitata di questi componenti hardware rappresenta una sfida per gli appassionati di gaming, i professionisti dell...

#Hardware
2026-01-18 Tom's Hardware

Resurrezione vintage: Altair 8800 del 1974 torna in vita nel 2026

Un computer Altair 8800 del 1974, assemblato in modo errato, è stato riparato e ha eseguito con successo il suo primo programma nel 2026. La macchina, alimentata da un processore Intel 8080, ha visto la luce oltre cinquant'anni dopo la sua costruzion...

#Hardware
2026-01-18 Tom's Hardware

Musk e xAI: stretta dell'EPA sui generatori a turbina a gas

L'EPA (Environmental Protection Agency) statunitense ha stabilito che i generatori a turbina a gas utilizzati da xAI, la società di Elon Musk, non sono esenti dai permessi ambientali. La decisione chiude una scappatoia che consentiva di evitare le au...

2026-01-18 The Register AI

Nvidia punta sull'emulazione per le prestazioni HPC

Nvidia sta intensificando l'uso dell'emulazione per migliorare le prestazioni dei suoi chip di intelligenza artificiale nel calcolo scientifico ad alte prestazioni (HPC). Questa strategia emerge in un contesto di crescente competizione con AMD, che h...

#Hardware
2026-01-18 LocalLLaMA

Ministral 3 Reasoning Heretic: Modelli LLM senza censure e GGUF

Disponibili i modelli Ministral 3 Reasoning Heretic, versioni non censurate con capacità di visione. L'utente coder3101 ha rilasciato i modelli quantizzati (Q4, Q5, Q8, BF16) con MMPROJ per funzionalità di visione, accelerando i tempi di rilascio per...

#Hardware
2026-01-18 LocalLLaMA

Newelle 1.2: l'assistente AI per Linux si aggiorna

È disponibile la versione 1.2 di Newelle, l'assistente AI progettato per Linux. L'aggiornamento include l'integrazione di llama.cpp, una nuova libreria di modelli per ollama/llama.cpp e una ricerca ibrida ottimizzata per la lettura dei documenti. Tra...

#LLM On-Premise #RAG
2026-01-18 LocalLLaMA

Analisi di un milione di email per l'ingegneria del contesto

Un team ha elaborato oltre un milione di email per trasformarle in contesto strutturato per agenti di intelligenza artificiale. L'analisi ha rivelato che la ricostruzione dei thread è complessa, gli allegati sono fondamentali, le conversazioni multil...

← Torna ai Topic