Ga naar inhoud
AI & Strategie · 18 mei 2026 · 10 min leestijd

Je ChatGPT wordt dommer. Dat is geen bug — dat is het plan.

Gratis AI was altijd een proefmonster. Nu begint de echte rekening.

Illustratie bij artikel: Je ChatGPT wordt dommer. Dat is geen bug — dat is het plan.

Vorige week vroeg ik ChatGPT om hulp met een stuk dat ik eerder in een paar minuten zelf had laten opzetten, maar het antwoord dat terugkwam was korter dan verwacht en vlakker dan ik gewend was. Ik dacht eerst dat ik te weinig context had meegegeven, probeerde het opnieuw met meer context, en kreeg hetzelfde resultaat. Een uur later verscheen de melding dat ik mijn limiet had bereikt en werd doorgeschakeld naar een kleiner model.

Op dat moment besefte ik iets ongemakkelijks: ik was junk geworden, en de dealer was net stilletjes de doses gaan verdunnen.

TL;DR

  • Gratis AI wordt stilletjes slechter. OpenAI en Anthropic verdunnen de doses door limieten, automatische degradatie naar lichtere modellen, en stille retraining die niemand aankondigt.
  • Dit is geen samenzwering, maar een businessmodel dat versterkt wordt door fysieke schaarste: stroomtekort en chiptekort dwingen labs om hun rekenkracht aan de hoogste bieder te geven.
  • Model collapse maakt het erger: een internet dat voor 74% uit AI-tekst bestaat vervuilt de trainingsdata van toekomstige modellen, en die gevolgen landen vooral op de gratis tier.
  • Drie concrete acties: erken dat AI een vaste kostenpost wordt, routeer per taak over meerdere leveranciers, en bouw zelf een "thermometer" om modeldegradatie te meten.

Anthropic doet exact hetzelfde, al klinkt dat misschien raar om hardop te zeggen. Ik betaal 100 dollar per maand voor Claude Max en zat de afgelopen maanden vrijwel iedere week tegen mijn limiet aan, soms al op woensdag, waarna mijn werkdagen zich begonnen in te delen rond de teller in plaats van rond de inhoud. Afgelopen week was het rustiger en raakte ik de limiet niet, maar in plaats van blij te zijn vroeg ik me af of Anthropic stilletjes wat ruimte had teruggegeven, of dat ik toevallig minder zwaar had gewerkt.

Dat is precies het type vraag waar je niet uitkomt, want de meters zijn niet van jou — ze zijn van het lab. Anthropic geeft openlijk toe dat ze actief sleutelen aan de capaciteit van Claude om de vraag te beheersen (The Register, maart 2026 (opent in nieuw venster)). De richting is wisselend: vorige week soepeler, daarvoor strenger, volgende week wie weet. Niemand zegt het hardop, en jij merkt het pas als de teller anders loopt.

OpenAI was de dealer. En wij wisten het.

Het is het oudste trucje uit het boekje: eerst gratis spul om je te laten kennismaken, goed spul ook, zo goed dat je niet meer terug wilt. Dan zie je een paar kleine veranderingen die niet groot genoeg zijn om over te klagen — een limiet die opduikt, een vraag die niet meer wordt opgepakt, een antwoord dat dunner uitvalt — en tegen die tijd zit je al aan het abonnement. En als dat ook niet meer genoeg is, is er een Pro-tier voor 200 dollar per maand, en daarboven nog een laag voor wie écht werk wil laten doen.

Dit is geen samenzwering. Dit is een businessmodel.

OpenAI's gratis tier accepteert nu nog 10 berichten per vijf uur op het topmodel (OpenAI Help Center, 2026 (opent in nieuw venster)), waarna je automatisch terugvalt op een mini-versie die merkbaar minder kan. GPT-4o, het model waarmee miljoenen gebruikers verliefd werden op de tool, is op 13 februari 2026 stilletjes uit ChatGPT gehaald (OpenAI Help Center (opent in nieuw venster)) — zonder aankondigingsvideo, zonder afscheidsblog, gewoon een artikel in de helpdesk. De rekening wordt verdeeld: wie veel wil, betaalt veel, en wie niets betaalt, krijgt een pillenfles met steeds minder pillen erin.

Hoe je merkt dat de gratis dosis verdund is

Er zijn een paar signalen die ik herken uit eigen gebruik en uit gesprekken in mijn netwerk, en wie ze eenmaal kent, ziet ze overal.

De harde limiet die er een jaar geleden niet was

Een jaar geleden was de gratis ChatGPT vrijwel onbeperkt voor losse vragen en wat schrijfwerk, maar nu is het een stopwatch: tien berichten, dan een kleinere kamer in, en op piekmomenten gebeurt dat sneller dan op de homepage staat. Het is alsof je in een restaurant zit waar de portie groter wordt aangekondigd dan hij op je bord ligt, en niemand het meet.

De automatische degradatie naar lichtere modellen

Modeldegradatie is de stille overgang van een topmodel naar een lichter model zonder dat de gebruiker dat ziet. Als je je limiet bereikt, word je niet uitgelogd maar onmerkbaar doorgeschakeld op een kleinere variant — de interface blijft hetzelfde, de output is anders, en iedereen die zegt "ja maar ik heb gisteren nog wel dit kunnen doen" mist het: je deed het gisteren met een ander model dan vandaag.

De technische sluier rond hoe modellen denken

Bij Anthropic speelt er iets vergelijkbaars, maar dan technischer. Begin 2026 introduceerde Anthropic met Claude Opus 4.6 een "effort"-instelling waarmee het model zelf bepaalt hoeveel het nadenkt, van laag naar maximaal, en voor lange gesprekken voegden ze context compaction toe: een functie die oudere stukken van een gesprek automatisch inkort zodra het contextvenster vol dreigt te raken. Technisch kloppen die verbeteringen, maar je verliest er iets bij — namelijk het zicht op wat er onder de motorkap gebeurt.

De stilte rond retraining

Geen lab kondigt aan dat ze een model goedkoper hebben gemaakt, maar wel verschijnen er ineens berichten van gebruikers dat antwoorden minder diepgaand zijn dan twee weken eerder, wat soms wordt afgedaan als "prompt drift" — de term die labs gebruiken om te zeggen dat jij het bent, niet zij. Er is een kans dat een deel van die klachten inderdaad gebruikersbias is, maar er is ook een kans dat labs knoppen hebben verzet om kosten te drukken, en het probleem is dat je het niet kunt narekenen. Dat is niet onschuldig. Dat is structureel.

Sora is dood, en dat zegt alles

De duidelijkste bevestiging van dit hele verhaal is wat er met Sora gebeurde, want Sora was OpenAI's prestige-product voor video: in februari 2024 aangekondigd met clips die de hele wereld lieten gapen, en in december 2025 gevolgd door een licentiedeal met Disney van een miljard dollar waarbij personages uit Marvel en Star Wars in Sora verwerkt zouden worden (Variety, 2026 (opent in nieuw venster)).

Op 24 maart 2026 kwam het bericht dat Sora wordt stopgezet — geen overgang, geen alternatief, de app eruit op 26 april en de API tot september (OpenAI Help Center (opent in nieuw venster)). Disney hoorde het minder dan een uur voor de publieke aankondiging, wat betekent dat een deal van een miljard dollar in vlammen opging zonder dat de partner ook maar enige tijd had om te reageren.

Waarom? Volgens reportages van TechCrunch verbrandde Sora ongeveer een miljoen dollar per dag aan rekenkracht, terwijl het gebruikersaantal van een piek van een miljoen mensen instortte naar minder dan de helft (TechCrunch, 29 maart 2026 (opent in nieuw venster)). Sam Altman koos voor de B2B-route omdat Anthropic bezig was de softwareontwikkelaars en zakelijke klanten te winnen die echt geld opleveren, en OpenAI moest GPU's vrijspelen voor GPT-5 redeneermodellen die zakelijk werk doen in plaats van voor consumenten die deepfake-clips van Pikachu maken.

Lees dat nog eens goed: een miljard aan Disney werd opgegeven omdat consumentenvideo niet rendabel was, de deal werd in december 2025 getekend en de stopzetting kwam op 24 maart 2026, wat betekent dat een leiderschap in een paar weken besloot dat de eigen prestige-tak niet kostendekkend te krijgen was en koos voor brandstof voor de zakelijke route. Zo wegen de cijfers nu op tegen het verhaal.

De échte reden zit niet in een boardroom, maar in een stopcontact

Hier wordt het verhaal interessant, want zelfs als OpenAI de aardigste club ter wereld was geweest, had gratis AI het binnen twee jaar niet gered. Het probleem is namelijk fysiek.

Stroom is het echte plafond

Datacenters zijn op weg naar meer dan 1.000 terawattuur stroomverbruik in 2026 — in het slechtste scenario richting de 1.050 — wat neerkomt op het stroomverbruik van heel Japan (IEA Energy and AI report (opent in nieuw venster)). Anthropic schat zelf dat het trainen van één frontier-model in 2028 een datacenter van 5 gigawatt vermogen vereist, wat neerkomt op het vermogen van een middelgrote stad voor één enkele trainingsrun (Anthropic, Build AI in America, juli 2025 (opent in nieuw venster)).

Chips zijn het tweede plafond

En dan zijn er nog de chips, want daar wordt het persoonlijk. De Nvidia Blackwell B200 was eind april 2026 op spotmarkten te huur voor 4,08 dollar per uur, een stijging van 48% in slechts twee maanden tijd (KuCoin (opent in nieuw venster)), terwijl levertijden voor nieuwe Blackwell-systemen oplopen tot een jaar en Nvidia een orderportefeuille van zo'n 3,6 miljoen units heeft die nog uitstaat (Spheron, 2026 (opent in nieuw venster)).

Wat schaarste doet met je toegang

Wat doe je als AI-lab als je niet genoeg chips en niet genoeg stroom hebt? Je geeft de chips als eerste aan de klanten die het meeste betalen — de B2B-klanten met meerjarige contracten — terwijl de gratis consument krijgt wat overblijft, en "wat overblijft" wordt elke maand minder. Geen hebzucht. Gewoon schaarste, en schaarste die je niet ziet omdat het stroomnet nu eenmaal niet werkt als marketingboodschap.

Model collapse: het vergif zit in de eigen leveranciersketen

Er speelt nog een tweede probleem dat bijna niemand benoemt, en dat heeft te maken met de grondstof waarop de hele sector draait. Model collapse is het kwaliteitsverlies dat optreedt wanneer AI-modellen worden getraind op data die zelf grotendeels door AI is gegenereerd. Het internet vult zich razendsnel met AI-tekst, en als de volgende generatie modellen wordt getraind op een internet dat voor driekwart uit eigen output bestaat, treedt er kwaliteitsverlies op waarbij modellen variatie verliezen, zeldzame patronen vergeten en steeds meer op zichzelf gaan lijken. In april 2025 was al ruim 74% van de nieuwe webpagina's AI-gegenereerd (Wikipedia model collapse (opent in nieuw venster)).

Die gevolgen landen niet op de Pro-tier, want daar betaal je voor de schoonst getrainde modellen. Ze landen op de gratis tier, op de kleine modellen, op de plek waar de kwaliteit het minst zichtbaar is.

Wat het voor jou betekent

Eerst even het optimistische deel: voor heel veel taken is de huidige gratis AI nog steeds prima, want een boodschappenlijstje, een brainstorm of een samenvatting van een mailtje — dat werkt, en het werkt goed. Maar als jij of je organisatie AI inzet voor iets dat ertoe doet, dan zijn er drie dingen die ik je serieus mee wil geven.

1. Erken dat de gratis fase voorbij is

Doe niet alsof je geen budget nodig hebt voor AI, want je hebt het wel nodig, net zo goed als je budget hebt voor stroom, internet, telefonie en software. AI gaat een vaste kostenpost worden in plaats van een experiment, en als je dat nu niet erkent, ga je je over een halfjaar verbazen waarom je AI-output niet meer voldoet aan wat je gewend was.

2. Stop met blind vertrouwen op één leverancier

Als je organisatie hard leunt op één model, ben je kwetsbaar voor de stille degradatie van dat model zonder dat je het doorhebt. Ik schreef eerder over waarom shadow AI blokkeren niet werkt en hoe medewerkers altijd hun weg zoeken naar tools die werken, maar de andere kant van die medaille is dat je een routeringsregime nodig hebt.

In mijn eigen werk gebruik ik Perplexity en Gemini voor zoekwerk waar ik recente data verwacht, de nieuwste Codex CLI voor webdesign omdat die echt goed is, Claude Code voor het zware codeerwerk en de complexe redeneerklussen, en Sonnet 4.6 voor eenvoudige taken die ik niet door een duurder model wil halen. Daarbij zorg ik dat mijn claude.md actueel is maar niet zo uitgebreid dat hij zelf het contextvenster vol vreet. Een routeringsregime is geen gimmick — het is je verzekering tegen een leverancier die ineens andere knoppen verzet.

3. Bouw je eigen thermometer

Dat is makkelijker dan het klinkt. Ik doe het zelf met een vaste prompt die ik elke twee weken opnieuw uitvoer op mijn hoofdmodel: een instructie die telt ("schrijf precies 60 woorden"), een instructie die redeneren vraagt ("geef drie tegenwerpingen, elk in één zin"), en een instructie die initiatief vraagt ("sluit af met één vervolgvraag aan de auteur"), waarbij ik altijd hetzelfde stuk tekst als input meestuur en de output met datum bewaar.

Wat je gaat zien is herkenbaar: in periodes van schaarste klopt het woordenaantal ineens niet meer, krijg je twee tegenwerpingen in plaats van drie, of wordt de vervolgvraag generieker. Ik zie het zelf terugkomen in mijn wekelijkse test, en de variatie in output is mijn eerlijkste graadmeter voor wat er achter de schermen verandert — geen technische benchmark, geen Pythonkennis, gewoon een mapje met datums.

De gratis fase van AI was geen cadeau, maar een investering van miliarden om jou afhankelijk te maken. Dat is gelukt, ook bij mij, en nu begint de terugverdienperiode. Dat hoeft geen ramp te zijn, maar wegkijken is ook een keuze: blijf je reageren op wat de labs jou geven, of beslis je zelf wat je gebruikt en waarom? Ik kies het tweede, niet omdat ik van betalen houd, maar omdat afhankelijkheid van iets wat je niet kunt zien of meten het duurste is wat er bestaat.


Veelgestelde vragen

Is gratis AI echt voorbij?

Voor losse, eenvoudige taken zoals een samenvatting, een boodschappenlijstje of een korte brainstorm werkt gratis AI nog prima. Maar voor werk dat ertoe doet — content waar je naam onder staat, beslissingen die je organisatie raken, code die in productie draait — is de gratis fase praktisch voorbij. De combinatie van strakkere limieten, automatische degradatie naar lichtere modellen en stille retraining maakt de output op de gratis tier minder betrouwbaar dan een jaar geleden, en die richting wordt versterkt door fysieke schaarste op stroom en chips.

Hoe weet ik of mijn ChatGPT of Claude slechter is geworden?

Je weet het niet zeker, want de labs publiceren geen kwaliteitsmetrics per gebruiker. Wat je wel kunt doen is een eigen "thermometer" bouwen: een vaste prompt met meetbare elementen (precies 60 woorden schrijven, drie tegenwerpingen geven, één vervolgvraag stellen) die je elke twee weken op dezelfde manier draait, met dezelfde input. Bewaar de output met datum. Als het woordenaantal ineens afwijkt, of het aantal tegenwerpingen klopt niet, dan zie je dat de output is veranderd zonder dat er een aankondiging is geweest.

Waarom werd Sora stopgezet terwijl er een Disney-deal van een miljard liep?

OpenAI verbrandde naar schatting een miljoen dollar per dag aan rekenkracht voor Sora terwijl het gebruikersaantal halveerde, en Anthropic was bezig zakelijke softwareontwikkelaars te winnen waar veel meer geld zit dan in consumenten-video. Door Sora stop te zetten konden GPU's worden vrijgespeeld voor GPT-5 redeneermodellen die zakelijk werk doen. Het was een keuze tussen prestige (de Disney-deal) en cash flow (B2B-klanten), en die keuze maakt duidelijk welke kant OpenAI op gaat.

Wat is model collapse en waarom raakt het mij?

Model collapse is het kwaliteitsverlies dat optreedt wanneer AI-modellen worden getraind op data die zelf grotendeels door AI is gegenereerd. Modellen verliezen variatie, vergeten zeldzame patronen en gaan steeds meer op zichzelf lijken. Omdat in 2025 al 74% van nieuwe webpagina's AI-gegenereerd was, vervuilt elke nieuwe trainingsronde de data van toekomstige modellen verder. Pro-tier modellen krijgen de schoonste data, maar gratis modellen krijgen wat overblijft, en daar landt het effect dus eerst.

Wat kost serieus gebruik van AI per maand in 2026?

Het hangt af van wat je doet, maar verwacht voor zwaar professioneel gebruik (codeerwerk, contentcreatie, onderzoek) een vaste post tussen de 100 en 300 dollar per maand per gebruiker, gespreid over twee of drie leveranciers. Voor lichter zakelijk gebruik volstaat vaak één Pro-abonnement van 20 tot 30 dollar. Dat klinkt veel, maar als je het vergelijkt met de uren die het bespaart, is het meestal goedkoper dan een uurtje van een externe consultant.

Welke AI-modellen kun je het beste combineren?

Routeer per taak in plaats van per favoriete merk. Voor recente informatie en zoekwerk werken Perplexity en Gemini goed omdat die actief web-search integreren. Voor zwaar codeerwerk en complexe redeneerklussen is Claude Code op dit moment sterk. Voor webdesign en frontend-werk is de nieuwste Codex CLI van OpenAI uitstekend. Voor eenvoudige taken die het topmodel niet rechtvaardigen kun je Claude Sonnet 4.6 of GPT-mini gebruiken. Drie of vier abonnementen klinkt veel, maar het beschermt je tegen de stille degradatie van één leverancier.


Bronnen