Forward Deployed Engineers e il pivot dell’AI a Consulting

Mag 18, 2026

OpenAI ha lanciato l'11 maggio la "Deployment Company": $4 miliardi di capitale iniziale, valutazione $14 miliardi, 19 investitori istituzionali (TPG, Bain Capital, Advent, Brookfield, SoftBank, Goldman, BBVA, McKinsey, Capgemini). Allo stesso annuncio: acquisizione di Tomoro, consulting AI con 150 Forward Deployed Engineers e clienti come Tesco e Virgin Atlantic. Anthropic, in parallelo, dichiara $30 miliardi di run-rate revenue — +80x in tre anni — con oltre 1.000 clienti enterprise sopra $1 milione/anno (raddoppiati in due mesi). IBM ha chiuso a marzo l'acquisizione di Confluent per $11 miliardi cash. Tre eventi, una sola lettura: il margine della fase 2026 non sta nel modello, sta nel deployment. Chi vende solo token sta perdendo soldi che lascia agli integratori.

[IMG-1]

Cosa è successo l'11 maggio

OpenAI ha annunciato "OpenAI Deployment Company", subsidiary majority-owned, con un primo round da oltre $4 miliardi. Lead: TPG. Co-lead: Advent International, Bain Capital, Brookfield. Altri 15 investitori includono SoftBank, Goldman Sachs, Warburg Pincus, BBVA, B Capital, Emergence Capital, più Bain & Company, Capgemini, McKinsey come partner consulenziali. La valutazione del veicolo: $14 miliardi prima di vendere un dollaro di servizi.

Contestualmente OpenAI ha acquisito Tomoro, boutique inglese di applied AI con ~150 "Forward Deployed Engineers" (l'espressione che Palantir ha reso celebre vent'anni fa per definire ingegneri che vivono on-site dal cliente). I clienti dichiarati di Tomoro: Tesco (più grande retailer UK), Virgin Atlantic, Supercell. Tutti contesti dove il modello in sé non basta: serve pipeline dati, integrazione con sistemi legacy, governance, SLA.

Denise Dresser, Chief Revenue Officer di OpenAI, in un'intervista CNBC dello stesso giorno: "siamo a un tipping point nell'adozione enterprise". Dato concreto che cita: l'enterprise è oggi il 40% del revenue OpenAI e si prevede arrivi al 50% entro fine 2026.

[IMG-2]

Anthropic, specchio inverso: $30b senza una consulting co

Mentre OpenAI annuncia una società di consulting, Anthropic comunica la traiettoria revenue più aggressiva mai vista in software: $87 milioni di run-rate a gennaio 2024, $1 miliardo a dicembre 2024, $9 miliardi a fine 2025, $14B a febbraio 2026, $19B a marzo, $30B ad aprile. Crescita 80x in tre anni. I clienti business che spendono >$1M/anno sono passati da ~500 (febbraio) a >1.000 (aprile). Raddoppio in meno di due mesi.

Anthropic non ha (per ora) una Deployment Co. dedicata. Però ha annunciato il 14 maggio una partnership da $200 milioni con la Gates Foundation, Claude for Small Business il 13 maggio, e un veicolo enterprise services con Blackstone, Hellman & Friedman e Goldman Sachs il 4 maggio. È la stessa cosa con un nome diverso: outsourcing del go-to-market enterprise a private equity che porta clienti e capitale.

Lettura strategica: Anthropic non vende "consulting", vende "compute partnership" — Google-Broadcom-TPU. OpenAI non vende "consulting", vende "deployment". Sono due dialetti dello stesso pivot. Il modello come prodotto stand-alone vende, ma sotto-monetizza enormemente i workflow enterprise dove il valore reale per il cliente è 10-100x quello del token consumato.

[IMG-3]

Forward deployed engineer: il termine non è nuovo

L'espressione "Forward Deployed Engineer" la lanciò Palantir intorno al 2008. Ingegneri-consulenti che vivono dal cliente per 6-18 mesi, capiscono il dominio (intelligence, banche, oil & gas), scrivono integrazioni custom, gestiscono il modello dati. Margine alto, ricavi sticky, switching cost enorme. È il modello che ha portato Palantir a $3 miliardi di revenue e a ~$200 miliardi di market cap.

OpenAI sta replicando esattamente questo schema. Tomoro ha 150 FDE — circa la stessa dimensione del nucleo FDE di Palantir nei primi anni. La cosa interessante: i partner consulenziali (Bain, McKinsey, Capgemini) entrano nel cap table, non solo come canale di vendita. È un vincolo strutturale. Quando un Big-4 ha equity in un veicolo OpenAI, smette di proporre Anthropic e Gemini sui deal CIO Fortune 500. Lock-in lato sales, non solo lato modello.

Punto strutturale: il margine vero dell'AI enterprise 2026 non è il prezzo del token (in caduta libera, -90% in 18 mesi su modelli equivalenti). È il costo evitato di trovare 150 ingegneri che sappiano deployare LLM in produzione. Sono persone che non esistono sul mercato. Tomoro non è stata acquistata per i clienti — è stata acquistata per il talent pool.

[IMG-4]

IBM/confluent $11b: real-time data è il collo di bottiglia

Il 17 marzo IBM ha chiuso l'acquisizione di Confluent per $11 miliardi cash ($31/share). Confluent è la commercial company dietro Apache Kafka: streaming di dati event-driven, adottato da 6.500 enterprise e ~40% delle Fortune 500. IBM la sta integrando con watsonx.data, IBM MQ, webMethods e IBM Z (mainframe).

La narrativa ufficiale: "real-time data, the engine of enterprise AI and agents". Tradotto: gli agenti AI in produzione non funzionano se i dati arrivano in batch giornaliero. Un agente customer-service che cerca lo status di un ordine deve leggere un evento Kafka emesso 200 ms fa, non un report S3 di stanotte. Senza una pipeline event-driven, l'agente è una demo. Con essa, è infrastruttura.

Questo è il terzo pezzo dello stesso puzzle. OpenAI compra Forward Deployed Engineers per fare l'integrazione applicativa. Anthropic costruisce con Google/Broadcom il layer compute. IBM compra il layer data-in-motion per servirlo a watsonx. Il modello LLM in sé sta diventando una commodity orchestrata da tre layer ortogonali: compute, data, deployment. Chi controlla uno solo dei tre layer in modo verticale verrà incanalato dagli altri due.

[IMG-5]

Margine dei modelli vs margine del deployment

Faccio i conti grossolani. Un contratto enterprise tipo "agente customer-service per call center retail" su modello frontier oggi paga in token $200k-500k/anno. Il deployment (integrazione CRM, vector DB, eval suite, RBAC, audit log, change management, retraining) paga ai system integrator $2-5 milioni/anno. Margine sul deployment: 40-60% (consulting tradizionale). Margine sul token: 5-15% per chi rivende API, 60-70% per chi possiede il modello ma compete con prezzi in caduta libera.

Conclusione: il valore enterprise è 10x sul deployment rispetto al token. Chi vende solo modelli sta lasciando 90 cent di ogni dollaro sul tavolo. OpenAI con DeployCo intercetta il 90 cent. Anthropic con i partner PE intercetta forse il 60. Google con Vertex AI e i consulenti Accenture/Deloitte intercetta forse il 50. Meta — che ha modelli ma nessun GTM enterprise — sta intercettando zero.

Lezione per chi costruisce: se vendete API LLM come SaaS classico, state replicando il modello margine di Twilio. Va bene, ma non vi prepara alla fase in cui il margine si sposta sul lavoro di integrazione. Se invece costruite il livello deployment (vertical agent + SDK + servizi gestiti), siete posizionati come Accenture-of-AI per il vostro settore. È il pattern che pagherà 5-10 anni.

[IMG-6]

Cosa significa per l'europa e per l'Italia

In Europa il vincolo aggiuntivo è regolatorio. Il 7 maggio Consiglio e Parlamento UE hanno raggiunto accordo politico sull'AI Omnibus: posticipo dei requisiti per sistemi high-risk, sandbox nazionali entro 2 agosto 2027, riduzione del grace period per trasparenza contenuti generati da 6 a 3 mesi (deadline 2 dicembre 2026). Il messaggio: l'EU sta abbassando l'attrito sull'adozione enterprise, non aumentandolo. Le lettere di ASML, Airbus e Mistral hanno funzionato.

Conseguenza pratica: i system integrator europei (Reply, Engineering, Capgemini Italia, Accenture Italia, NTT Data) sono in posizione di mercato simmetrica a Tomoro pre-acquisizione. Hanno relazione con clienti enterprise italiani, conoscono i vincoli del GDPR/AI Act, parlano italiano nelle riunioni. Non hanno (mediamente) Forward Deployed Engineers AI-native al livello di Tomoro. Probabili scenari nei prossimi 12 mesi: acquisizioni di boutique AI italiane da parte di SI grandi, o partnership formali con DeployCo/Anthropic.

Per chi costruisce SaaS verticale in Italia: il momento è ora. Vertical agent + integrazione su 1-2 ERP nazionali (Zucchetti, TeamSystem) + pipeline dati real-time = ARR difendibile. Non avete bisogno del modello migliore. Avete bisogno del deployment più veloce, con onboarding sotto 30 giorni e change management gestito.

[IMG-7]

Take-away operativi

— Il margine 2026 si sposta dal layer modello al layer deployment. Pricing del token in caduta libera (-90% in 18 mesi). Pricing dell'integrazione tiene il 40-60% margin.

— Forward Deployed Engineer è il ruolo più scarso sul mercato. Salario medio US: $220-280k base. In Italia: introvabile sotto i 60-80k netti per profilo senior.

— Tre layer ortogonali si stanno consolidando: compute (NVIDIA, TPU, Trainium), data-in-motion (Kafka/Confluent post-IBM), deployment (DeployCo, Palantir, Big-4 con equity nei vendor).

— Per chi costruisce: non competete sul modello. Competete sulla pipeline di onboarding e sul tempo da "deal firmato" a "in produzione". Sub-30 giorni è la nuova soglia enterprise.

— Per i Big-4 europei: senza FDE AI-native, l'M&A è una necessità, non un'opzione. Aspetto 3-5 acquisizioni italiane entro fine 2026.

— L'AI Omnibus EU abbassa l'attrito regolatorio. Niente più alibi "non lo posso fare per il GDPR". Le aziende italiane che rinviano l'adozione perderanno il vantaggio di apprendimento permanente.