Questa settimana tre segnali separati raccontano la stessa cosa: la fase "Nvidia mangia tutto" del ciclo AI è finita. Cisco ha annunciato 4.000 licenziamenti per riallocare capex su AI e sicurezza. AMD ha chiuso il Q1 FY26 con 10,25 miliardi di dollari di ricavi (+38% YoY) e 5,78 miliardi nel data center (+57%), con commitment di 6 GW MI450 da Meta e 6 GW da OpenAI — 12 GW totali. Wall Street, intanto, ha smesso di comprare solo NVDA e ha cominciato a ruotare su AMD, Intel e Micron. Nvidia non è in crisi: il data center vale 193,5 miliardi a fine FY26. Ma il mercato sta finalmente capendo che il TAM AI è multi-fornitore. Non è una notizia, è un cambio di regime.
[IMG-1]

La settimana in cui la geografia dell'AI capex è cambiata
Tre titoli, due giorni, una sola tesi. Il 14 maggio Cisco annuncia che taglia circa 4.000 dipendenti — il 5% della forza lavoro — nonostante ricavi e utili sopra le stime, per "ristrutturare il cost base" e spostare cassa su AI e cybersecurity. L'8 maggio CNBC titola che Wall Street ha già smesso di comprare solo Nvidia e sta piling-in su Intel, AMD e Micron. Il 5 maggio AMD chiude il trimestre con numeri che sei mesi fa erano impensabili per chiunque non si chiamasse Nvidia.
Singolarmente nessuna delle tre notizie giustifica un articolo. Insieme dicono che il mercato sta riprezzando l'intera filiera AI in base a un'ipotesi nuova: non esiste un solo fornitore di compute. Esiste un sistema multi-vendor in cui Nvidia resta dominante ma non più monopolista, AMD è il challenger serio, Intel torna in gioco con i CPU Xeon di nuova generazione, Micron e SK Hynix incassano la scarsità HBM.
Lettura strategica: il ciclo AI sta entrando nella sua "fase 2". Fase 1 = chi controlla la GPU controlla il margine. Fase 2 = chi controlla l'integrazione (memoria, CPU, networking, software) si prende fette di torta che prima erano implicitamente di Nvidia.
[IMG-2]

Cisco taglia 4.000 per pagare AI — il sintomo enterprise
Il dettaglio meno discusso del comunicato Cisco: i licenziamenti arrivano in un trimestre con "record quarterly revenue". Non è downsizing per difesa, è riallocazione. Il messaggio agli analisti — letto fra le righe — è "il networking tradizionale e l'identity management on-prem non scalano abbastanza in fretta, vogliamo riconvertire payroll in capex AI".
Cisco non è sola. Microsoft ha annunciato a inizio anno spese capex 2026 stimate sopra 95 miliardi, quasi interamente data center AI. Meta nel Q1 ha ribadito 60-65 miliardi. Google e Amazon viaggiano nello stesso ordine di grandezza. La novità Cisco è che adesso anche il middleware/networking enterprise — categoria storicamente cash cow ma lenta — accetta di tagliare per finanziare AI.
Punto strutturale: quando un vendor con margini operativi sopra il 30% taglia 4.000 persone per pagare GPU che useranno i suoi clienti, non i suoi prodotti, significa che il mercato considera l'AI compute infrastructure più strategica del proprio business legacy. È una resa, non una scelta.
[IMG-3]

AMD prende 12 GW da Meta e OpenAI — il numero che rompe l'equilibrio
I numeri AMD Q1 FY26, riportati il 5 maggio:
— Ricavi totali: 10,25 miliardi USD (+38% YoY)
— Data center: 5,78 miliardi USD (+57% YoY)
— Stock: +97% YTD, +327% a 12 mesi
Sopra questo, due commitment che valgono più dei numeri trimestrali. Meta ha firmato per 6 GW di Instinct MI450. OpenAI ha firmato per altri 6 GW di MI450. Dodici gigawatt totali — capacità equivalente a 12 grandi centrali nucleari — su un singolo prodotto che esce in volume nel 2026/2027.
Per contesto: Microsoft, Google e Amazon insieme nel 2024 ordinarono qualcosa nell'ordine di 8-10 GW di GPU Nvidia. AMD adesso ha più volume committed da due soli clienti di quanto il triumvirato cloud Nvidia gestisse due anni fa.
La domanda interessante non è "AMD pareggia Nvidia". La domanda è "perché Meta e OpenAI hanno deciso di committarsi così tanto su un secondo fornitore". Tre risposte plausibili:
a) Pricing leverage. Comprare 6 GW da un secondo vendor crea automatic pressure sul primo. Anche se l'MI450 fosse peggio del corrispettivo Nvidia, vale come arma di trattativa per sconti future.
b) Supply risk. Foxconn ransomware (questa settimana stessa, sempre nelle news), TSMC capacity squeeze, export control su Nvidia verso la Cina. Il single-vendor risk è oggettivamente cresciuto.
c) Software stack maturity. ROCm — il CUDA di AMD — nel 2024 era una barzelletta. Nel 2026 ha PyTorch, JAX, vLLM, SGLang nativi. La portabilità del codice non è più una scusa.
Lezione per chi costruisce: se stai facendo training o inference su scala produttiva, scrivere CUDA-puro adesso è debito tecnico. ROCm e il triton-based stack rendono il codice portabile a basso costo. Pagare il piccolo overhead architetturale oggi vale i 20-30% di risparmio negoziale di domani.
[IMG-4]

Wall Street ruota da Nvidia a memory, CPU e secondi fornitori
CNBC l'8 maggio sintetizza il pattern: "Wall Street AI chip love moves from Nvidia to Intel, AMD and Micron". Non è retorica da titolista. Micron — azienda di 47 anni con cultura corporate sleepy — è diventato uno dei trade più caldi degli ultimi dodici mesi per via della shortage globale HBM. La memoria è il collo di bottiglia reale dei rack AI moderni: una H200 o una MI450 senza HBM3e sufficiente è un sandwich senza pane.
Intel, dato per morto cinque volte negli ultimi otto anni, è tornato in gioco su due assi: i CPU Xeon di sesta generazione (necessari per orchestrare i nodi GPU multi-tenant) e Foundry, dove ha vinto qualche allocation per nodi N18A da clienti non-Nvidia.
Lisa Su ha detto agli analisti che il mercato CPU server crescerà sopra il 35% annuo fino al 2030, raggiungendo oltre 120 miliardi USD. Il motivo non è "torna il general computing". Il motivo è agentic AI: ogni agente che gira non è 100% GPU-bound. Ha bisogno di orchestrazione, tool-calling, retrieval, scheduler. Tutta carne per CPU.
Punto strutturale: nei prossimi 24 mesi il bull case per i fornitori non-Nvidia non è "battiamo Nvidia". È "Nvidia è l'80% del compute ma il 30% della spesa". I restanti 70% (memory + CPU + storage + networking + software) sono in palio.
[IMG-5]

Nvidia non è morta — è solo finita la fase mono-vendor
Per non andare in narrative trap: Nvidia FY2026 ha chiuso con 193,5 miliardi di ricavi data center, su da 116,2 del FY25. Crescita superiore al 65%. Il prossimo Rubin (lanciato a CES 2026) ha booking pieno fino al 2027. Jensen Huang a GTC ha dichiarato che il CPU Nvidia (Vera) sarà un'arma diretta contro Intel Xeon nei sistemi GB300+.
Quello che è cambiato è la struttura del margine. Nei trimestri 2023-2024 Nvidia stampava margini netti sopra il 55%. Il consenso analisti adesso prezza un 47-50% nel FY27, con compressione dovuta a: (a) mix che si sposta su clienti hyperscaler con sconti volumetrici, (b) pressure competitiva da AMD, (c) costi HBM crescenti girati a margine.
Tradotto: Nvidia continua a fare i numeri della crescita, ma il mercato sta riprezzando l'esclusività del suo pricing power. La P/E si normalizza non perché il fatturato cala, ma perché il rischio competitivo è finalmente prezzato.
Lettura strategica: i 4 trillion di market cap raggiunti l'estate scorsa non erano sostenibili in un mondo multi-vendor. Adesso siamo a circa 3,8-4 trillion ma con base ricavi raddoppiata. Più sano, meno bolla.
[IMG-6]

OpenAI Deployment Co + Tomoro — il vendor lock-in cambia forma
Notizia laterale ma rilevante della stessa settimana: OpenAI lancia "OpenAI Deployment Co.", una società di consulting per aiutare aziende a "implementare AI", e acquisisce Tomoro, applied AI consulting & engineering firm. Anthropic aveva già fatto qualcosa di simile.
Significato: il margine di OpenAI sulla pura API sta diventando insufficiente. Per giustificare la run-rate revenue dichiarata (sopra 13 miliardi annualizzati), serve catturare il layer di servizi sopra il modello. È il classico move da Oracle/SAP fine anni '90: vendi il database, poi vendi i consulenti che lo configurano, poi i 3-year deal di managed services.
È anche il segnale che il modello-as-a-service puro non genera enough sticky revenue. Le aziende switchano API in 48 ore (Claude→GPT→Gemini→Claude di nuovo). I deal di consulting biennali no.
Punto strutturale per chi vende software AI-powered: il lock-in non è più sul modello. È sull'integrazione, sui dati, sui workflow custom. Costruire layer applicativi indipendenti dal foundation model è oggi una strategia di sopravvivenza, non un nice-to-have.
[IMG-7]

Cosa significa per chi costruisce
Tre conseguenze pratiche delle notizie di questa settimana, applicabili da chi non lavora in hyperscaler ma deve comunque fare scelte di stack:
— Inference cost optimization: il prezzo dell'inference H100 spot è sceso del 22% negli ultimi 6 mesi grazie alla competizione AMD/Groq/Cerebras. Se stai pagando ancora list price per inference batch, stai sovrappagando. Vendor come Together, Fireworks, Lambda Labs hanno ormai stack misti.
— Foundation model neutrality: il vendor lock-in di OpenAI/Anthropic è reale e crescente (vedi Deployment Co.). Costruire le proprie applicazioni dietro un abstraction layer (LiteLLM, OpenRouter, Portkey) è la mossa difensiva ovvia. Costo: ore di dev. Risparmio: 10-30% sui costi LLM in 18 mesi.
— Capex su hardware proprio: se sei una mid-cap o sopra che fa inference >$2M/anno, il break-even di un cluster on-prem con MI300X o MI450 è ormai sotto i 18 mesi. Conviene il calcolo. Quattro anni fa non conveniva a nessuno tranne hyperscaler.
Take-away
— Fase 2 del ciclo AI: multi-vendor. Nvidia dominante ma non più monopolista. AMD challenger serio con 12 GW committed.
— Cisco licenzia 4.000 per riallocare capex su AI. Sintomo di transizione enterprise generalizzata.
— Wall Street ruota su memory (Micron), CPU (Intel/AMD), networking. Il TAM oltre la GPU è in palio.
— Nvidia FY26: 193,5 miliardi data center. Crescita ok, margine compresso. P/E si normalizza.
— OpenAI lancia consulting (Deployment Co. + Tomoro). Il margine API non basta più: serve sticky enterprise revenue.
— Per chi costruisce: portabilità ROCm + abstraction layer foundation model + capex on-prem se inference > $2M/anno.
