Gratis AI voorbij: waarom ChatGPT dommer wordt

Q: Wat kost serieus gebruik van AI per maand in 2026?

Verwacht voor zwaar professioneel gebruik een vaste post tussen de 100 en 300 dollar per maand per gebruiker, gespreid over twee of drie leveranciers. Voor lichter zakelijk gebruik volstaat vaak één Pro-abonnement van 20 tot 30 dollar per maand.

Q: Welke AI-modellen kun je het beste combineren?

Routeer per taak in plaats van per merk. Perplexity en Gemini voor recente informatie en zoekwerk, Claude Code voor zwaar codeerwerk en complexe redeneerklussen, Codex CLI voor webdesign en frontend, en Claude Sonnet of GPT-mini voor eenvoudige taken. Drie of vier abonnementen beschermen je tegen de stille degradatie van één leverancier.

Vorige week vroeg ik ChatGPT om hulp met een stuk dat ik eerder in een paar minuten zelf had laten opzetten, maar het antwoord dat terugkwam was korter dan verwacht en vlakker dan ik gewend was. Ik dacht eerst dat ik te weinig context had meegegeven, probeerde het opnieuw met meer context, en kreeg hetzelfde resultaat. Een uur later verscheen de melding dat ik mijn limiet had bereikt en werd doorgeschakeld naar een kleiner model.

Op dat moment besefte ik iets ongemakkelijks: ik was junk geworden, en de dealer was net stilletjes de doses gaan verdunnen.

TL;DR

Gratis AI wordt stilletjes slechter. OpenAI en Anthropic verdunnen de doses door limieten, automatische degradatie naar lichtere modellen, en stille retraining die niemand aankondigt.
Dit is geen samenzwering, maar een businessmodel dat versterkt wordt door fysieke schaarste: stroomtekort en chiptekort dwingen labs om hun rekenkracht aan de hoogste bieder te geven.
Model collapse maakt het erger: een internet dat voor 74% uit AI-tekst bestaat vervuilt de trainingsdata van toekomstige modellen, en die gevolgen landen vooral op de gratis tier.
Drie concrete acties: erken dat AI een vaste kostenpost wordt, routeer per taak over meerdere leveranciers, en bouw zelf een "thermometer" om modeldegradatie te meten.

Anthropic doet exact hetzelfde, al klinkt dat misschien raar om hardop te zeggen. Ik betaal 100 dollar per maand voor Claude Max en zat de afgelopen maanden vrijwel iedere week tegen mijn limiet aan, soms al op woensdag, waarna ik mijn werkdagen begon in te delen rond de teller in plaats van rond de inhoud. Afgelopen week was het rustiger en raakte ik de limiet niet, maar in plaats van blij te zijn vroeg ik me af of Anthropic stilletjes wat ruimte had teruggegeven, of dat ik toevallig minder zwaar had gewerkt.

Dat is precies het type vraag waar je niet uitkomt, want de meters zijn niet van jou — ze zijn van het lab. Anthropic geeft openlijk toe dat ze actief sleutelen aan de capaciteit van Claude om de vraag te beheersen (The Register, maart 2026 (opent in nieuw venster)). De richting is wisselend: vorige week soepeler, daarvoor strenger, volgende week wie weet. Niemand zegt het hardop, en jij merkt het pas als de teller anders loopt.

OpenAI was de dealer. En wij wisten het.

Het is het oudste trucje uit het boekje: eerst gratis spul om je te laten kennismaken, goed spul ook, zo goed dat je niet meer terug wilt. Dan zie je een paar kleine veranderingen die niet groot genoeg zijn om over te klagen — een limiet die opduikt, een vraag die niet meer wordt opgepakt, een antwoord dat dunner uitvalt — en tegen die tijd zit je al aan het abonnement. En als dat ook niet meer genoeg is, is er een Pro-tier voor 200 dollar per maand, en daarboven nog een laag voor wie écht werk wil laten doen.

Dit is geen samenzwering. Dit is een businessmodel.

OpenAI's gratis tier accepteert nu nog 10 berichten per vijf uur op het topmodel (OpenAI Help Center, 2026 (opent in nieuw venster)), waarna je automatisch terugvalt op een mini-versie die merkbaar minder kan. GPT-4o, het model waarmee miljoenen gebruikers verliefd werden op de tool, is op 13 februari 2026 stilletjes uit ChatGPT gehaald (OpenAI Help Center (opent in nieuw venster)) — zonder aankondigingsvideo, zonder afscheidsblog, gewoon een artikel in de helpdesk. De rekening wordt verdeeld: wie veel wil, betaalt veel, en wie niets betaalt, krijgt een pillenfles met steeds minder pillen erin.

Hoe je merkt dat de gratis dosis verdund is

Er zijn een paar signalen die ik herken uit eigen gebruik en uit gesprekken in mijn netwerk, en wie ze eenmaal kent, ziet ze overal.

De harde limiet die er een jaar geleden niet was

Een jaar geleden was de gratis ChatGPT vrijwel onbeperkt voor losse vragen en wat schrijfwerk, maar nu is het een stopwatch: tien berichten, dan een kleinere kamer in, en op piekmomenten gebeurt dat sneller dan op de homepage staat. Het is alsof je in een restaurant zit waar de portie groter wordt aangekondigd dan hij op je bord ligt, en niemand het meet.

De automatische degradatie naar lichtere modellen

Modeldegradatie is de stille overgang van een topmodel naar een lichter model zonder dat de gebruiker dat ziet. Als je je limiet bereikt, word je niet uitgelogd maar onmerkbaar doorgeschakeld op een kleinere variant — de interface blijft hetzelfde, de output is anders, en iedereen die zegt "ja maar ik heb gisteren nog wel dit kunnen doen" mist het: je deed het gisteren met een ander model dan vandaag.

De technische sluier rond hoe modellen denken

Bij Anthropic speelt er iets vergelijkbaars, maar dan technischer. Begin 2026 introduceerde Anthropic met Claude Opus 4.6 een "effort"-instelling waarmee het model zelf bepaalt hoeveel het nadenkt, van laag naar maximaal, en voor lange gesprekken voegden ze context compaction toe: een functie die oudere stukken van een gesprek automatisch inkort zodra het contextvenster vol dreigt te raken. Technisch kloppen die verbeteringen, maar je verliest er iets bij — namelijk het zicht op wat er onder de motorkap gebeurt.

De stilte rond retraining

Geen lab kondigt aan dat ze een model goedkoper hebben gemaakt, maar wel verschijnen er ineens berichten van gebruikers dat antwoorden minder diepgaand zijn dan twee weken eerder, wat soms wordt afgedaan als "prompt drift" — de term die labs gebruiken om te zeggen dat jij het bent, niet zij. Er is een kans dat een deel van die klachten inderdaad gebruikersbias is, maar er is ook een kans dat labs knoppen hebben verzet om kosten te drukken, en het probleem is dat je het niet kunt narekenen. Dat is niet onschuldig. Dat is structureel.

Sora is dood, en dat zegt alles

De duidelijkste bevestiging van dit hele verhaal is wat er met Sora gebeurde, want Sora was OpenAI's prestige-product voor video: in februari 2024 aangekondigd met clips die de hele wereld lieten gapen, en in december 2025 gevolgd door een licentiedeal met Disney van een miljard dollar waarbij personages uit Marvel en Star Wars in Sora verwerkt zouden worden (Variety, 2026 (opent in nieuw venster)).

Op 24 maart 2026 kwam het bericht dat Sora wordt stopgezet — geen overgang, geen alternatief, de app eruit op 26 april en de API tot september (OpenAI Help Center (opent in nieuw venster)). Disney hoorde het minder dan een uur voor de publieke aankondiging, wat betekent dat een deal van een miljard dollar in vlammen opging zonder dat de partner ook maar enige tijd had om te reageren.

Waarom? Volgens reportages van TechCrunch verbrandde Sora ongeveer een miljoen dollar per dag aan rekenkracht, terwijl het gebruikersaantal van een piek van een miljoen mensen instortte naar minder dan de helft (TechCrunch, 29 maart 2026 (opent in nieuw venster)). Sam Altman koos voor de B2B-route omdat Anthropic bezig was de softwareontwikkelaars en zakelijke klanten te winnen die echt geld opleveren, en OpenAI moest GPU's vrijspelen voor GPT-5-redeneermodellen die zakelijk werk doen in plaats van voor consumenten die deepfake-clips van Pikachu maken.

Lees dat nog eens goed: een miljard aan Disney werd opgegeven omdat consumentenvideo niet rendabel was, de deal werd in december 2025 getekend en de stopzetting kwam op 24 maart 2026, wat betekent dat het leiderschap in een paar weken besloot dat de eigen prestige-tak niet kostendekkend te krijgen was en koos voor brandstof voor de zakelijke route. Zo wegen de cijfers nu op tegen het verhaal.

De échte reden zit niet in een boardroom, maar in een stopcontact

Hier wordt het verhaal interessant, want zelfs als OpenAI de aardigste club ter wereld was geweest, had gratis AI het binnen twee jaar niet gered. Het probleem is namelijk fysiek.

Stroom is het echte plafond

Datacenters zijn op weg naar meer dan 1.000 terawattuur stroomverbruik in 2026 — in het slechtste scenario richting de 1.050 — wat neerkomt op het stroomverbruik van heel Japan (IEA Energy and AI report (opent in nieuw venster)). Anthropic schat zelf dat het trainen van één frontier-model in 2028 een datacenter van 5 gigawatt vermogen vereist, wat neerkomt op het vermogen van een middelgrote stad voor één enkele trainingsrun (Anthropic, Build AI in America, juli 2025 (opent in nieuw venster)).

Chips zijn het tweede plafond

En dan zijn er nog de chips, want daar wordt het persoonlijk. De Nvidia Blackwell B200 was eind april 2026 op spotmarkten te huur voor 4,08 dollar per uur, een stijging van 48% in slechts twee maanden tijd (KuCoin (opent in nieuw venster)), terwijl levertijden voor nieuwe Blackwell-systemen oplopen tot een jaar en Nvidia een orderportefeuille van zo'n 3,6 miljoen units heeft die nog uitstaat (Spheron, 2026 (opent in nieuw venster)).

Wat schaarste doet met je toegang

Wat doe je als AI-lab als je niet genoeg chips en niet genoeg stroom hebt? Je geeft de chips als eerste aan de klanten die het meeste betalen — de B2B-klanten met meerjarige contracten — terwijl de gratis consument krijgt wat overblijft, en "wat overblijft" wordt elke maand minder. Geen hebzucht. Gewoon schaarste, en schaarste die je niet ziet omdat het stroomnet nu eenmaal niet werkt als marketingboodschap.

Volg mij op LinkedIn

Volg mijn updates over AI, strategie en ondernemen op LinkedIn

Model collapse: het vergif zit in de eigen leveranciersketen

Er speelt nog een tweede probleem dat bijna niemand benoemt, en dat heeft te maken met de grondstof waarop de hele sector draait. Model collapse is het kwaliteitsverlies dat optreedt wanneer AI-modellen worden getraind op data die zelf grotendeels door AI is gegenereerd. Het internet vult zich razendsnel met AI-tekst, en als de volgende generatie modellen wordt getraind op een internet dat voor driekwart uit eigen output bestaat, treedt er kwaliteitsverlies op waarbij modellen variatie verliezen, zeldzame patronen vergeten en steeds meer op zichzelf gaan lijken. In april 2025 was al ruim 74% van de nieuwe webpagina's AI-gegenereerd (Wikipedia model collapse (opent in nieuw venster)).

Die gevolgen landen niet op de Pro-tier, want daar betaal je voor de schoonst getrainde modellen. Ze landen op de gratis tier, op de kleine modellen, op de plek waar de kwaliteit het minst zichtbaar is.

Wat het voor jou betekent

Eerst even het optimistische deel: voor heel veel taken is de huidige gratis AI nog steeds prima, want een boodschappenlijstje, een brainstorm of een samenvatting van een mailtje — dat werkt, en het werkt goed. Maar als jij of je organisatie AI inzet voor iets dat ertoe doet, dan zijn er drie dingen die ik je serieus mee wil geven.

1. Erken dat de gratis fase voorbij is

Doe niet alsof je geen budget nodig hebt voor AI, want je hebt het wel nodig, net zo goed als je budget hebt voor stroom, internet, telefonie en software. AI gaat een vaste kostenpost worden (opent in nieuw venster) in plaats van een experiment, en als je dat nu niet erkent, ga je je over een halfjaar verbazen waarom je AI-output niet meer voldoet aan wat je gewend was.

2. Stop met blind vertrouwen op één leverancier

Als je organisatie hard leunt op één model, ben je kwetsbaar voor de stille degradatie van dat model zonder dat je het doorhebt. Ik schreef eerder over waarom shadow AI blokkeren niet werkt en hoe medewerkers altijd hun weg zoeken naar tools die werken, maar de andere kant van die medaille is dat je een routeringsregime (opent in nieuw venster) nodig hebt.

In mijn eigen werk gebruik ik Perplexity en Gemini voor zoekwerk waar ik recente data verwacht (opent in nieuw venster), de nieuwste Codex CLI voor webdesign omdat die echt goed is, Claude Code voor het zware codeerwerk en de complexe redeneerklussen, en Sonnet 4.6 voor eenvoudige taken die ik niet door een duurder model wil halen. Daarbij zorg ik dat mijn claude.md actueel is maar niet zo uitgebreid dat hij zelf het contextvenster vol vreet. Een routeringsregime is geen gimmick — het is je verzekering tegen een leverancier die ineens andere knoppen verzet.

3. Bouw je eigen thermometer

Dat is makkelijker dan het klinkt. Ik doe het zelf met een vaste prompt die ik elke twee weken opnieuw uitvoer op mijn hoofdmodel: een instructie die telt ("schrijf precies 60 woorden"), een instructie die redeneren vraagt ("geef drie tegenwerpingen, elk in één zin"), en een instructie die initiatief vraagt ("sluit af met één vervolgvraag aan de auteur"), waarbij ik altijd hetzelfde stuk tekst als input meestuur en de output met datum bewaar.

Wat je gaat zien is herkenbaar: in periodes van schaarste klopt het woordenaantal ineens niet meer, krijg je twee tegenwerpingen in plaats van drie, of wordt de vervolgvraag generieker. Ik zie het zelf terugkomen in mijn wekelijkse test, en de variatie in output is mijn eerlijkste graadmeter voor wat er achter de schermen verandert — geen technische benchmark, geen Pythonkennis, gewoon een mapje met datums.

De gratis fase van AI was geen cadeau, maar een investering van miljarden om jou afhankelijk te maken. Dat is gelukt, ook bij mij, en nu begint de terugverdienperiode. Dat hoeft geen ramp te zijn, maar wegkijken is ook een keuze: blijf je reageren op wat de labs jou geven, of beslis je zelf wat je gebruikt en waarom? Ik kies het tweede, niet omdat ik van betalen houd, maar omdat afhankelijkheid van iets wat je niet kunt zien of meten het duurste is wat er bestaat.

Stand van zaken — juni 2026

Toen ik dit schreef in mei 2026 stond de huurprijs van een Nvidia B200 op 4,08 dollar per uur. Die schaarste is niet weggetrokken, integendeel. In mei lag de gemiddelde huurprijs rond de 4,98 dollar per uur en staan er nog altijd zo'n 3,6 miljoen chips in de wachtrij, met de geavanceerde verpakkingscapaciteit bij TSMC als knelpunt (Spheron, 2026 (opent in nieuw venster)). Analisten verwachten pas tegen het einde van 2026 enige verlichting richting 2,50 tot 3 dollar per uur (Thunder Compute, juni 2026 (opent in nieuw venster)). Het plafond waar ik het over had, staat er dus gewoon nog.

En de stille degradatie? Die ging precies zo door als ik vreesde. Op 12 juni 2026 verdween GPT-5.2 zonder veel rumoer uit ChatGPT en schoven lopende gesprekken automatisch door naar de opvolger (OpenAI Help Center, juni 2026 (opent in nieuw venster)). Tegelijk verschenen meldingen dat de gratis tier verder werd dichtgedraaid: beeldgeneratie naar drie per dag, en tekstlimieten die op piekmomenten tot vier berichten per vijf uur zakten, account voor account uitgerold zonder aankondiging (AI Weekly, 2026 (opent in nieuw venster)). Dat is exact het patroon uit dit stuk, nu in het echt.

Ook het structurele deel werd scherper. Recente analyses stellen dat model collapse geen toekomstig risico meer is maar iets wat nu al in productiesystemen gebeurt (AI Safety Directory, 2026 (opent in nieuw venster)). En de stroomhonger groeit door: het IEA rekent voor 2026 op meer dan 1.000 terawattuur stroomverbruik door datacenters, ongeveer het verbruik van heel Japan (IEA, 2026 (opent in nieuw venster)). Geen van deze ontwikkelingen spreekt de kern van dit artikel tegen. Ze bevestigen hem alleen scherper dan me lief is.

Veelgestelde vragen

Is gratis AI echt voorbij?

Voor losse, eenvoudige taken zoals een samenvatting, een boodschappenlijstje of een korte brainstorm werkt gratis AI nog prima. Maar voor werk dat ertoe doet — content waar je naam onder staat, beslissingen die je organisatie raken, code die in productie draait — is de gratis fase praktisch voorbij. De combinatie van strakkere limieten, automatische degradatie naar lichtere modellen en stille retraining maakt de output op de gratis tier minder betrouwbaar dan een jaar geleden, en die richting wordt versterkt door fysieke schaarste op stroom en chips.

Hoe weet ik of mijn ChatGPT of Claude slechter is geworden?

Je weet het niet zeker, want de labs publiceren geen kwaliteitsmetrics per gebruiker. Wat je wel kunt doen is een eigen "thermometer" bouwen: een vaste prompt met meetbare elementen (precies 60 woorden schrijven, drie tegenwerpingen geven, één vervolgvraag stellen) die je elke twee weken op dezelfde manier draait, met dezelfde input. Bewaar de output met datum. Als het woordenaantal ineens afwijkt, of het aantal tegenwerpingen klopt niet, dan zie je dat de output is veranderd zonder dat er een aankondiging is geweest.

Waarom werd Sora stopgezet terwijl er een Disney-deal van een miljard liep?

OpenAI verbrandde naar schatting een miljoen dollar per dag aan rekenkracht voor Sora terwijl het gebruikersaantal halveerde, en Anthropic was bezig zakelijke softwareontwikkelaars te winnen waar veel meer geld zit dan in consumentenvideo. Door Sora stop te zetten konden GPU's worden vrijgespeeld voor GPT-5-redeneermodellen die zakelijk werk doen. Het was een keuze tussen prestige (de Disney-deal) en cashflow (B2B-klanten), en die keuze maakt duidelijk welke kant OpenAI op gaat.

Wat is model collapse en waarom raakt het mij?

Model collapse is het kwaliteitsverlies dat optreedt wanneer AI-modellen worden getraind op data die zelf grotendeels door AI is gegenereerd. Modellen verliezen variatie, vergeten zeldzame patronen en gaan steeds meer op zichzelf lijken. Omdat in 2025 al 74% van nieuwe webpagina's AI-gegenereerd was, vervuilt elke nieuwe trainingsronde de data van toekomstige modellen verder. Pro-tier modellen krijgen de schoonste data, maar gratis modellen krijgen wat overblijft, en daar landt het effect dus eerst.

Wat kost serieus gebruik van AI per maand in 2026?

Het hangt af van wat je doet, maar verwacht voor zwaar professioneel gebruik (codeerwerk, contentcreatie, onderzoek) een vaste post tussen de 100 en 300 dollar per maand per gebruiker, gespreid over twee of drie leveranciers. Voor lichter zakelijk gebruik volstaat vaak één Pro-abonnement van 20 tot 30 dollar. Dat klinkt veel, maar als je het vergelijkt met de uren die het bespaart, is het meestal goedkoper dan een uurtje van een externe consultant.

Welke AI-modellen kun je het beste combineren?

Routeer per taak in plaats van per favoriete merk. Voor recente informatie en zoekwerk werken Perplexity en Gemini goed omdat die actief web-search integreren. Voor zwaar codeerwerk en complexe redeneerklussen is Claude Code op dit moment sterk. Voor webdesign en front-endwerk is de nieuwste Codex CLI van OpenAI uitstekend. Voor eenvoudige taken die het topmodel niet rechtvaardigen kun je Claude Sonnet 4.6 of GPT-mini gebruiken. Drie of vier abonnementen klinkt veel, maar het beschermt je tegen de stille degradatie van één leverancier.

Bronnen

The Register, maart 2026: Anthropic tweaks usage limits (opent in nieuw venster)
OpenAI Help Center: ChatGPT free tier FAQ (opent in nieuw venster)
OpenAI Help Center: GPT-4o retirement (opent in nieuw venster)
Variety, 2026: OpenAI shutting down Sora (opent in nieuw venster)
OpenAI Help Center: Sora discontinuation (opent in nieuw venster)
TechCrunch, 29 maart 2026: Why OpenAI really shut down Sora (opent in nieuw venster)
IEA: Energy and AI report (opent in nieuw venster)
Anthropic: Build AI in America, juli 2025 (opent in nieuw venster)
KuCoin: Nvidia GPU rental prices surge (opent in nieuw venster)
Spheron, 2026: GPU shortage 2026 (opent in nieuw venster)
Wikipedia: Model collapse (opent in nieuw venster)