Waarom was Uber's AI-budget in vier maanden op?

Uber rolde Claude Code uit naar 5.000 engineers en had geen quotas of plafonds ingesteld. Het gebruik groeide explosief: 70% van alle code werd met AI geschreven en 84% van de engineers werkte met agents. De kosten per engineer liepen op tot 500–2.000 dollar per maand, wat resulteerde in een volledig verbruikt jaarbudget in vier maanden.

Hoe bereken je de ROI van AI-tools in een organisatie?

Gebruik de 'delete it tonight'-test van Prosus: vraag per AI-tool of -agent wat het kost als je hem vanavond permanent uitzet, uitgedrukt in omzet, kosten of tijd. Zo maak je de waarde concreet. Verbruik (tokencount, percentage AI-gegenereerde code) is geen ROI-maatstaf — aantoonbare output en bespaarde tijd wel.

Hoe zet ik als organisatie een rem op AI-kosten zonder de voordelen weg te gooien?

Stel maandelijkse plafonds per gebruiker in: hogere limieten voor engineers die intensief met agents werken, lagere voor kenniswerkers die AI gebruiken voor tekst en samenvatten. Zorg voor een dashboard dat het totaalverbruik per team zichtbaar maakt. Zo behoud je de hefboom waar die het meeste oplevert en begrens je de risico's.

Grip op AI-kosten: de les van Uber en Microsoft

Vorige maand zat ik in een paar dagen door een budget heen dat een maand had moeten meegaan. Niet door één dure fout. Gewoon door Claude Code en Cursor te gebruiken zoals het bedoeld is.

Dit is precies wat er bij Uber gebeurde. Alleen daar ging het niet om een paar honderd euro, maar om een jaarbudget dat in vier maanden op was.

TL;DR

Uber was in vier maanden door zijn AI-jaarbudget heen. Niet omdat de tools tegenvallen, maar omdat engineers ze zo intensief gebruiken dat niemand een rem had gezet.
De explosie zit bij programmeurs, niet bij de gemiddelde gebruiker. Een engineer die de hele dag met agents werkt kost 500 tot 2.000 dollar per maand; een collega die een mail laat nakijken is een fractie.
Wie "AI terugdraaien" als conclusie trekt, gooit de winst weg. De besparingen vallen bij gewone kenniswerkers — de kosten exploderen bij een kleine groep zware bouwers.
De huidige tokenprijs is gesubsidieerd door investeerders. OpenAI verbrandt naar schatting 14 miljard dollar in 2026. Prijsnormalisatie van 30–50% binnen één tot twee jaar is realistisch.
De fix is simpel: plafonds, zichtbaarheid en onderscheid per gebruikerstype. Niet minder AI, maar weten waar de meter doorslaat.

Wat er echt gebeurde bij Uber, Microsoft en Nvidia

Je hebt de verhalen waarschijnlijk voorbij zien komen. Ze gaan deze weken hard rond op LinkedIn en X, meestal met dezelfde strekking: kijk, zelfs de grote techbedrijven draaien hun AI terug, de rekening is te hoog, de bubbel knapt.

Dat klopt niet. Of beter: het klopt half, en de helft die ontbreekt is de interessante helft.

Uber rolde Claude Code eind 2025 uit naar ongeveer 5.000 engineers. In april 2026 was het complete AI-budget voor het hele jaar op. De CTO gaf het toe tegenover The Information, via Fortune (opent in nieuw venster): het budget dat hij dacht nodig te hebben, was al verdampt. Niet omdat de tools tegenvielen. Het tegenovergestelde. Het gebruik liep op tot 70% van alle code die het bedrijf opleverde, geschreven met hulp van AI, en het aandeel engineers dat met agents werkte schoot in twee maanden van 32% naar 84%. Een agent is een AI die niet één antwoord geeft, maar zelfstandig een hele reeks stappen uitvoert, taken plant en uitvoert zonder dat je er steeds bij hoeft te zitten. De kosten per engineer liepen op tot tussen de 500 en 2.000 dollar per maand.

Microsoft deed iets soortgelijks. In mei begon het bedrijf interne Claude Code-licenties in te trekken in zijn Experiences + Devices-divisie, het team achter Windows, Office, Teams en Surface. Engineers moeten over naar GitHub Copilot CLI, met een deadline op 30 juni. Dat is, niet toevallig, de laatste dag van het fiscale jaar. De officiële reden is "toolchain-unificatie". De echte reden zit volgens The Next Web (opent in nieuw venster) in de kalender en in de rekening. Claude Code werd zo populair dat het Microsofts eigen Copilot intern begon te verdringen. Je kunt moeilijk Copilot aan de hele wereld verkopen terwijl je eigen mensen massaal iets anders gebruiken.

En toen was er Bryan Catanzaro, VP bij Nvidia. Hij zei tegen Axios, opgetekend door Fortune (opent in nieuw venster): "For my team, the cost of compute is far beyond the costs of the employees." De rekenkracht die zijn team verbruikt, is duurder dan de salarissen van datzelfde team. Wel goed om te weten dat hij het over zijn eigen research-team had, een van de meest compute-zware teams die er bestaan, dus dat is geen uitspraak over jouw kantoor maar over de extreme bovenkant.

Drie verhalen, één rode draad. En die draad is niet "AI werkt niet". De draad is: AI werkt zo goed dat mensen het niet meer weglegen, en niemand had bedacht wat dat zou kosten.

De eerste kostenpost die meegroeit met enthousiasme

Hier zit het punt dat ik in bijna geen enkele analyse terugzie. Denk even na over hoe bedrijfskosten normaal werken.

Personeel schaalt met loon. Meer mensen, hogere loonsom. Voorspelbaar. Klanten schalen met support. Meer klanten, meer vragen, meer servicedesk. Ook voorspelbaar. Bijna elke klassieke kostenpost groeit mee met iets wat je kunt meten en begroten.

Token-verbruik niet. Even voor de duidelijkheid: een token is een stukje tekst, ongeveer een woord, en je betaalt AI-tools per token dat ze lezen en schrijven. Hoe meer je de tool laat werken, hoe meer tokens, hoe hoger de rekening. En dat verbruik groeit mee met hoe nuttig en hoe leuk je mensen de tool vinden. Een enthousiaste engineer die de hele dag met een agent werkt kost je een veelvoud van een collega die er nauwelijks naar omkijkt. Dezelfde functie, hetzelfde salaris, een totaal andere AI-rekening. Dat is een nieuw type kostenpost, en geen enkel budgetteringsmodel is daarop gebouwd.

Het wordt nog gekker. Bij Uber, en volgens AI Magazine (opent in nieuw venster) ook bij Meta, hingen interne leaderboards waarop teams werden gerangschikt op token-verbruik. "Tokenmaxxing" noemen ze het. Je werd dus aangemoedigd om méér te verbruiken, alsof verbruik hetzelfde is als productiviteit. Dat is het niet. Het is de meterstand van je enthousiasme, niet van je output.

Dit is trouwens precies de paradox van Jevons, waar ik eerder over schreef in de gouden eeuw van de programmeur. Maak iets efficiënter en goedkoper, en je gaat er niet minder van gebruiken. Je gaat er veel meer van gebruiken. De prijs per token daalt al jaren. Het totale verbruik rent harder.

Het zit bij de programmeurs, niet bij de gemiddelde gebruiker

En dan kom ik bij het stuk dat de meeste virale posts plat slaan. Want "AI wordt te duur" is veel te grof. De vraag is niet óf AI duur is. De vraag is wáár.

De explosie zit op één specifieke plek: bij intensief agentic gebruik door programmeurs. Claude Code, Cursor, agents die zelfstandig een hele codebase doorlopen, stappen plannen, bestanden lezen en herschrijven. Zo'n agent verbruikt in één opdracht meer tokens dan een gewone gebruiker in een week. Bij Uber werd op een gegeven moment 11% van de live backend-updates volledig door agents uitgevoerd, zonder menselijke tussenkomst. Dat is fantastisch voor de snelheid. En het is een bodemloze put voor je tokenbudget.

Maar de gemiddelde gebruiker in je organisatie zit hier mijlenver vandaan. Iemand die ChatGPT gebruikt om een mail te herschrijven, een vergadering samen te vatten of een stuk te structureren, verbruikt een fractie. Voor die persoon valt het kostenplaatje reuze mee, en levert AI juist tijdwinst en besparing op. Dat is mijn eigen ervaring, en die van vrijwel iedereen die ik erover spreek. De doorsnee kenniswerker kost je een paar tientjes per maand en bespaart je uren.

Dat onderscheid bepaalt of je de juiste conclusie trekt. Als je de verhalen over Uber leest en in paniek je hele AI-toegang dichtdraait, dan los je een probleem bij een handvol zware gebruikers op door de winst bij de grote meerderheid weg te gooien. Dat is geen AI-kostenbeheersing. Dat is jezelf in de voet schieten.

De fout zit niet in AI. De fout zit in het over één kam scheren van een agent die een nacht doordraait en een collega die een mailtje laat nakijken.

Wie bewaakt eigenlijk de meter?

Toen de cloud volwassen werd, kregen bedrijven er een nieuwe discipline bij: FinOps, een samentrekking van financieel beheer en operations. Het was niets anders dan een manier om grip te houden op cloudrekeningen die plots niet meer voorspelbaar waren, omdat je betaalde voor gebruik in plaats van voor een vast pakket. Niemand vond dat spannend. Het werd gewoon onderdeel van hoe je een serieuze organisatie runt.

AI staat nu op exact datzelfde punt: AI FinOps. Alleen jaren eerder dan de meeste bestuurders beseffen. Een Nederlandse analyse van BeSharp (opent in nieuw venster) verwoordt het scherp: organisaties die jarenlang konden rekenen op vaste licentiekosten krijgen nu een dynamische kostenstructuur die moeilijk te voorspellen en lastig te begrenzen is. Je betaalde vroeger een vast bedrag per gebruiker, nu betaal je naar verbruik. Je AI-rekening gaat meer op een energierekening lijken dan op een vast abonnement.

En dan komt de vraag die in de meeste directiekamers nog niet gesteld is. Wie is eigenlijk eigenaar van het AI-verbruik? Bij wie ligt de rem? In de meeste organisaties die ik spreek is het antwoord: niemand. Het is verspreid over teams, niemand ziet het totaal, en de eerste keer dat iemand schrikt is als de jaarrekening binnenkomt.

Dat is geen IT-detail, maar een bestuursverantwoordelijkheid. Ik schreef eerder over de blinde vlek in de boardroom als het gaat om technische expertise op bestuursniveau. Dit is dezelfde blinde vlek, maar dan met een prijskaartje dat elke maand oploopt. En onbeheerste AI-kosten zijn ook een VOR-onderwerp: een bestuur dat verklaart operationele risico's te beheersen, moet ook laten zien dat het eigenaarschap van die kosten geregeld is.

De fix is niet ingewikkeld. Geef elke gebruiker een maandplafond. Stel een hogere limiet in voor wie zwaar met agents werkt en een lagere voor de rest, zodat de mensen met de meeste hefboom de ruimte krijgen en de overige gebruikers een redelijk maximum. En vooral: zorg voor zicht. Een dashboard waarop je ziet wie wat verbruikt en waaraan. Dat is geen luxe. Dat is het verschil tussen sturen en achteraf schrikken.

Volg mij op LinkedIn

Volg mijn updates over AI, strategie en ondernemen op LinkedIn

De ROI-vraag wordt onontkoombaar, en dat is gezond

Er is nog een laag die ik niet wil overslaan. Want je kunt wel grip krijgen op het verbruik, maar de echte vraag voor een bestuurder is een andere: hoe hou je het vol om hier zoveel geld in te blijven steken? Wat is de ROI, het rendement op je investering?

Daar zit de pijnlijkste zin uit het hele Uber-verhaal. Het was niet de CTO die zei dat het budget op was. Het was de COO, Andrew Macdonald, die volgens dezelfde Fortune-publicatie toegaf dat hij geen directe lijn kon trekken tussen al die AI-uitgaven en aantoonbare verbeteringen voor de klant. 95% van de engineers gebruikte AI maandelijks, 70% van de code kwam eruit, en alsnog kon hij niet hardmaken wat het opleverde.

Dat is het echte probleem. Niet de hoogte van de rekening, maar de afwezigheid van een antwoord op de vraag wat je ervoor terugkrijgt. Zolang AI goedkoop en nieuw was, hoefde niemand die vraag te stellen. Je deed mee, want je moest meedoen. Die fase is voorbij. Als de rekening serieus wordt, wordt de ROI-vraag onontkoombaar.

En dat is gezond. Het dwingt je om de juiste vraag te stellen. Niet "hoeveel kost AI ons?" maar "wat houden we eraan over nadat we het verbruik, het toezicht en het herwerk hebben afgetrokken?" Een analyse over AI-waarderealisatie (opent in nieuw venster) zegt het treffend: zonder die koppeling blijft AI een oncontroleerbare kostenpost in plaats van een strategische investering.

Het volledige kader voor grip op AI-kosten en ROI brengt die koppeling bij elkaar.

Er is een verrassend simpele manier om die vraag te beantwoorden. Prosus (opent in nieuw venster), het moederbedrijf achter onder andere Thuisbezorgd, bouwde 60.000 AI-agents en bedacht de "delete it tonight"-test. Managers kregen één vraag: wat gebeurt er als we deze agent vanavond permanent uitzetten, wat kost dat aan omzet, kosten of tijd? Plotseling konden ze de ROI wél benoemen.

Wij deden dat vroeger ook, alleen noemden we het de pieptest. Twijfelden we of iemand een functie nog gebruikte, dan zetten we hem gewoon uit en wachtten een week. Piepte niemand, dan was het antwoord duidelijk. Piepte er wel iemand, dan wist je meteen wie de echte gebruiker was en wat het hem waard was. Dezelfde logica, andere woorden. De kracht zit in de herformulering: niet "wat doet dit voor ons", maar "wat missen we als het weg is".

En dan de prijs die je niet zelf in de hand hebt

Tot nu toe ging dit stuk over kosten die je zelf kunt sturen. Je verbruik, je quota, je ROI. Maar er is een tweede bodem onder dit hele verhaal, en die is ongemakkelijker, omdat hij buiten je eigen invloed ligt.

De prijs die je vandaag per token betaalt, is waarschijnlijk niet de echte prijs. De grote AI-labs draaien op dit moment verlies. OpenAI verbrandt naar verwachting 14 miljard dollar in 2026, en volgens Axios (opent in nieuw venster) blijven de marges van de modelmakers negatief, ondanks dalende tokenprijzen. Dat is geen toeval. Ze verkopen bewust onder de kostprijs om marktaandeel te pakken, gefinancierd door de grootste kapitaalinjectie uit de techgeschiedenis. De prijslijst op je API-dashboard is gesubsidieerd door investeerders die hun geld ooit terug willen zien.

Meerdere analyses, waaronder die van AI Automation Global (opent in nieuw venster), gaan ervan uit dat die prijzen binnen één tot twee jaar normaliseren. Omhoog dus, met schattingen van 30 tot 50 procent. Niet omdat de techniek duurder wordt, maar omdat de subsidie een keer ophoudt.

Nu komt het interessante. Dit is voor jou als gebruiker geen reden tot paniek — het is juist een meevaller zolang het duurt. Je bouwt nu op compute die goedkoper is dan ze eigenlijk hoort te zijn. Maar er zit één voorwaarde aan. Je mag je hele bedrijfsvoering niet bouwen op de stilzwijgende aanname dat deze prijs blijft.

Dat is een governance-vraag, geen inkoopdetail. Wie nu een proces volledig afhankelijk maakt van één model bij één leverancier tegen de huidige prijs, neemt een risico dat losstaat van zijn eigen verbruik. De verzekering ertegen heet model-onafhankelijkheid: zorg dat je kunt wisselen van leverancier als de prijs verschuift. Dat is dezelfde redenering die je bij elke andere kritieke leverancier zou volgen. Bij AI vergeet bijna iedereen het, omdat de prijzen tot nu toe alleen maar daalden.

Jij hebt geen miljardenbuffer

Wat me het meest opvalt aan de hele discussie: iedereen praat over Uber, Microsoft en Nvidia. Maar dat zijn precies de bedrijven die dit kunnen hebben.

Uber gaf in 2025 alleen al 3,4 miljard dollar uit aan R&D. Toen het complete AI-budget in vier maanden verdampte, haalde het bedrijf zijn schouders op, deed een interne review en ging door. Een organisatie met een miljardenbuffer kan een budgetexplosie absorberen en er een leerervaring van maken.

Jij waarschijnlijk niet. En daar zit de echte les. Als de giganten met onbeperkte middelen hierop vastlopen, wat denk je dan dat er bij een bedrijf van vijftig man gebeurt zonder dashboards, zonder quota, zonder iemand die het verbruik bewaakt? Daar is de marge voor fouten veel kleiner, en juist daar wordt nauwelijks over geschreven.

Het goede nieuws is dat je de fix vandaag al kunt instellen, en dat hij niets kost. Zet een plafond per gebruiker. Geef je zware bouwers ruimte en de rest een redelijk maximum. Zorg dat iemand het totaal ziet, niet pas bij de jaarrekening. En houd dat onderscheid scherp tussen de agent die een nacht doordraait en de collega die een mail laat nakijken, want daar zit de hele kostenverdeling in.

Ik begon dit stuk met mijn eigen rekening die in dagen verdampte. Het grappige is: ik heb mijn gebruik daarna niet teruggeschroefd. Ik kreeg er te veel voor terug. Ik heb alleen geleerd waar de meter doorslaat, en daar een rem op gezet. Dat is geen terugtrekking. Dat is grip.

En dat gesprek, over wie verantwoordelijk is voor wat AI kost en oplevert, begint niet bij IT. Dat begint in de bestuurskamer.

Update juni 2026: AI FinOps is geen bijzaak meer

Sinds ik dit schreef, is het van anekdote naar industrie-erkenning gegaan. De FinOps Foundation noemt AI-kostenbeheersing inmiddels de belangrijkste vooruitkijkende prioriteit voor FinOps-teams (opent in nieuw venster). Rond de FinOps X 2026-conferentie ging het over weinig anders, met cijfers die erop wijzen dat een ruime meerderheid van de organisaties de eigen AI-begroting overschreed (opent in nieuw venster). Mijn vraag "wie bewaakt eigenlijk de meter?" is in een half jaar een vakgebied geworden.

Het Jevons-punt uit dit stuk werd ook scherper zichtbaar. De gemengde prijs per miljoen tokens daalde volgens data rond FinOps X met tientallen procenten op jaarbasis (opent in nieuw venster), en tóch liepen de rekeningen op, omdat het verbruik harder groeide dan welke begroting dan ook. Goedkopere tokens, hogere rekening. Precies de paradox die ik beschreef.

En de gesubsidieerde prijs blijft de stille bodem onder alles. OpenAI's eigen prognose gaat nog steeds uit van een verlies rond de 14 miljard dollar in 2026, met break-even pas verwacht eind 2027 (opent in nieuw venster). Wie vandaag zijn hele bedrijfsvoering op de huidige tokenprijs bouwt, rekent met een prijs die volgens de leveranciers zelf nog niet kostendekkend is.