Ga naar inhoud
AI & Governance · 31 mei 2026 · 11 min leestijd

AI energieverbruik meten kan niet, en dat is bewust zo

Over energielabels die er niet zijn, ranglijsten die de verkeerde modellen meten, en wat je morgen toch kunt doen.

Illustratie bij artikel: AI energieverbruik meten kan niet, en dat is bewust zo

Vorige week vroeg iemand me welk AI-model het zuinigst is. Niet welk model het slimst is. Niet welk model het goedkoopst is. Welk model het minste stroom verbruikt.

Ik had geen antwoord. Dat verbaasde me zelf ook. Want wie het AI energieverbruik van modellen wil vergelijken en daarvoor de bestaande ranglijsten opzoekt, stuit op een fundamenteel probleem: de modellen die jij waarschijnlijk dagelijks gebruikt, zijn bewust buiten het meetsysteem gehouden. Niet door technische onmogelijkheid, maar door keuze.

AI energieverbruik groeit snel, maar het debat klopt niet

De IEA publiceerde in april 2026 een rapport (opent in nieuw venster) waaruit blijkt dat het stroomverbruik van AI-gerichte datacenters in 2025 met 50 procent steeg. Het totale verbruik van alle datacenters samen lag rond de 485 terawattuur (dat is 485 miljard kilowattuur, ongeveer wat een land als Frankrijk in een half jaar verbruikt), en de verwachting is dat dit tegen 2030 verdubbelt naar zo'n 950 terawattuur. Dat laatste cijfer is vergelijkbaar met het totale jaarlijkse elektriciteitsverbruik van Japan.

Toch ontbreekt er een nuance in het publieke debat die er echt toe doet. De meeste mensen denken bij "AI en energie" aan de training van grote modellen. GPT-4 trainen kostte naar schatting 50 gigawattuur (genoeg om een paar duizend huishoudens een jaar lang van stroom te voorzien), wat enorm klinkt, maar het was een eenmalige investering. Wat er daarna dagelijks gebeurt, is een ander verhaal.

Inferentie, het dagelijks beantwoorden van vragen door een model, is verantwoordelijk voor 60 tot 90 procent van het totale energieverbruik over de levensduur van een model, afhankelijk van de bron. De IEA laat dit patroon ook zien (opent in nieuw venster): als je AI gebruikt in je bedrijf, is het dagelijkse gebruik het relevante getal, niet de trainingskosten van het model. Daarmee wordt de vraag van vorige week ineens een strategische vraag.

Het probleem: de modellen die je gebruikt, zijn niet te meten

Er bestaat inmiddels een serieus initiatief om het energieverbruik van AI-modellen inzichtelijk te maken: de AI Energy Score van Hugging Face (opent in nieuw venster). Het werkt als een energielabel voor een koelkast, een 1-tot-5-sterrenbeoordeling op basis van het stroomverbruik per taak. Er staan inmiddels 166 modellen op.

Maar er is een fundamenteel gat. Sasha Luccioni, de onderzoekster die het initiatief trekt, schreef in april 2025 openlijk dat de frontier-modellen ontbreken (opent in nieuw venster): de zwaarste, krachtigste modellen aan de voorhoede van de technologie, zoals ChatGPT, Claude en Gemini, precies de modellen die de meeste bedrijven dagelijks gebruiken, staan er niet op. Sterker: volgens OpenRouter-data geciteerd door Hugging Face (opent in nieuw venster) zijn 15 van de 20 meest gebruikte AI-modellen gesloten, oftewel closed-source: hun techniek is niet openbaar. Hun energieverbruik is daardoor niet te meten, omdat ze draaien in de afgesloten datacenters van OpenAI, Anthropic en Google.

Het systeem bestaat en is toegankelijk, maar de aanbieders kiezen er collectief voor om niet mee te doen. Eén uitzondering is er: Google publiceerde in augustus 2025 als enige grote speler wél een eigen meting, waarover later meer. Maar een meting die een aanbieder zelf doet en zelf naar buiten brengt, is iets anders dan een onafhankelijke ranglijst waarop je modellen objectief naast elkaar kunt leggen.

Luccioni heeft een veilige testomgeving gebouwd waarin providers hun eigen modellen kunnen laten meten zonder dat ze hun broncode hoeven prijs te geven. Geen enkele grote aanbieder heeft dat gedaan. Niet uit technische beperking, maar uit keuze. En dat is geen randdetail, maar het centrale gat in het hele verhaal.

De workaround die wél werkt (maar niet perfect is)

Er is één platform dat de vergelijking toch gedeeltelijk mogelijk maakt: Artificial Analysis (opent in nieuw venster). Ze vergelijken alle grote modellen op kwaliteit, snelheid en prijs per miljoen tokens. Een token is een stukje tekst, ongeveer een woorddeel, en het is de eenheid waarin AI-modellen rekenen en afrekenen. Hun overzicht dekt alle grote namen, inclusief GPT, Claude en Gemini.

Artificial Analysis meet geen stroomverbruik direct, maar er zit een logica achter die werkt: de prijs die providers rekenen per token hangt samen met de rekenkracht die nodig is. Sommige modellen gebruiken een slimme techniek waarbij niet het hele model meedenkt bij elke vraag, maar alleen het relevante deel ervan. Die modellen zijn flink goedkoper per token, en goedkoper per token is op dit moment de beste indicatie van zuiniger verbruik die we hebben voor de gesloten modellen.

De paradox die je moet kennen

Het intuïtieve idee is: kleiner model = zuiniger. En voor de meeste taken klopt dat ook gewoon. Een klein model dat een e-mail samenvat of een simpele vraag beantwoordt, verbruikt een fractie van wat een zwaar redeneermodel nodig heeft.

Maar bij complexe taken ligt het genuanceerder. Redeneermodellen zoals de o3-serie van OpenAI verbruiken per vraag significant meer stroom, en dan niet een beetje: onderzoekers van de universiteiten van Rhode Island en Tunis schatten in hun paper How Hungry is AI? (opent in nieuw venster) dat een lange vraag aan o3 bijna 39 wattuur kost, tegenover 0,24 wattuur voor een gemiddelde vraag aan Gemini, waar Google zelf onderzoek naar deed (opent in nieuw venster). Dat is meer dan honderd keer zoveel voor één vraag. Ter vergelijking: die ene zware vraag verbruikt ongeveer evenveel stroom als twintig minuten televisiekijken.

Toch is het verhaal niet zo simpel als "redeneren is slecht voor het klimaat". Als zo'n zwaar model een ingewikkeld programmeerprobleem in één keer oplost, terwijl een lichter model er drie pogingen voor nodig heeft met tussentijdse correcties, is het totale energieverbruik onderaan de streep soms lager voor het zware model. Efficiëntie meet je dus per succesvol resultaat, niet per losse vraag.

Maar hier is de eerlijke kanttekening: de meeste bedrijven zetten AI in voor relatief eenvoudige taken. E-mails schrijven, teksten samenvatten, informatie opzoeken. Voor die toepassingen geldt de paradox niet. Daar is een kleiner, zuiniger model gewoon beter, zowel qua CO2 als qua kosten.

Wat de EU hiermee doet (en wat dat voor jou betekent)

De EU AI Act verplicht providers van grote AI-modellen (opent in nieuw venster) om het energieverbruik te documenteren. Die verplichting geldt voor OpenAI, Anthropic en Google, en de handhaving start in augustus 2026. Misschien verschijnen de grote modellen dan eindelijk op de ranglijst van Hugging Face. Dat zou een flinke stap zijn.

Tot nu toe hielden partijen als Google en Anthropic de exacte verbruikscijfers grotendeels geheim, om concurrentieredenen. Maar de druk neemt toe, en niet alleen op stroomverbruik. Het waterverbruik voor de koeling van datacenters is een tweede milieu-aspect dat steeds vaker wordt meegenomen, en dat in de huidige metingen nog volledig ontbreekt. Daarnaast klinkt vanuit de sector de roep om gestandaardiseerde groene AI-labels, vergelijkbaar met wat Hugging Face nu bouwt maar dan voor alle modellen. Dat is nog geen verplichting, maar de richting is helder.

Voor jou als bedrijf dat AI gebruikt, geldt die documentatieplicht niet direct. Maar als je valt onder de CSRD, de Europese richtlijn die grotere bedrijven verplicht om over hun duurzaamheid te rapporteren, dan moet je ook de uitstoot in je keten meenemen. Denk aan alles wat je inkoopt, en daar horen digitale diensten steeds vaker bij. Dat is nu nog niet verplicht voor AI-gebruik specifiek, maar de richting is helder. Wie er nu al over nadenkt, staat straks niet voor verrassingen. De vraag welk model je gebruikt, zal op termijn onderdeel worden van die duurzaamheidsrapportage.

Ik schreef eerder al over de bredere governance-uitdagingen rondom de EU AI Act in mijn blog over het AI Act-uitstel dat niet doorging. De energierapportage is een van de weinig concrete verplichtingen die er wél doorheen kwamen.

Wat je morgen kunt doen

Ik had de vraag niet kunnen beantwoorden. Inmiddels kan ik dat beter, en ik zie drie stappen die voor elke organisatie logisch zijn.

Stap 1: Inventariseer welke modellen je organisatie gebruikt. Niet "we gebruiken AI", maar welke modellen concreet. ChatGPT via de browser, Claude via de API, Gemini via Google Workspace, een intern model. Per afdeling, per use case. Dit overzicht heb je sowieso nodig voor de EU AI Act, dus die investering is sowieso nuttig.

Stap 2: Kijk op Artificial Analysis. Zoek de modellen die je gebruikt op via artificialanalysis.ai (opent in nieuw venster) en vergelijk kwaliteit, snelheid en prijs per token. De prijs per token is, zoals hierboven uitgelegd, op dit moment de beste indicatie van het verbruik die je hebt voor de gesloten modellen.

Stap 3: Maak de afweging expliciet. Kwaliteit, prijs en CO2-voetafdruk zijn drie assen. Voor eenvoudige taken loont het om een kleiner, goedkoper en zuiniger model te gebruiken in plaats van standaard het zwaarste model te kiezen. Voor complexe taken ligt het genuanceerder. Maar de bewuste afweging maken, dat is al winst.

Het antwoord is ingewikkelder dan de vraag

Na een week uitzoeken is mijn conclusie helder: het antwoord is er gewoon niet, en dat heeft een reden. De modellen die de meeste mensen gebruiken, zijn expres onmeetbaar gehouden. Niet door technische onmogelijkheid, maar door keuze van de aanbieders.

Dat verandert niet vanzelf. Maar als de handhaving van de EU AI Act in augustus 2026 begint, en als de duurzaamheidsrapportage verder aantrekt, komt er druk. De vraag welk model het zuinigst is, zal dan niet meer beantwoord worden door een onderzoekster op een ranglijst, maar moet je zelf kunnen onderbouwen. En de route ernaartoe begint simpelweg met het stellen van de vraag.


Bronnen