·9m leestijd·1,650 woorden·

Je coding agent heeft geen wereldmodel. Jij hebt er een omheen gebouwd.

Yann LeCun zegt dat de weg naar echte intelligentie via wereldmodellen loopt, niet via LLMs. Hij heeft waarschijnlijk gelijk. En het verklaart precies waarom je agent-loop werkt.

In november 2025 betoogde Yann LeCun dat de weg naar superintelligentie waarschijnlijk niet via grote taalmodellen loopt. Volgens hem ontbreekt er iets fundamenteels aan de huidige aanpak. Een paar weken later vertrok hij na meer dan tien jaar bij Meta. In maart 2026 had hij ruim een miljard dollar opgehaald voor een nieuw bedrijf, AMI Labs, gebouwd rond een idee dat lijnrecht ingaat tegen vrijwel alles waar de industrie nu geld in pompt.

Het is verleidelijk om dit weg te zetten als een ruzie om de macht. Hij is weg, hij haalt geld op tegen precies datgene waar zijn oude werkgever alles op heeft ingezet, natuurlijk noemt hij het een doodlopende weg.

Doe dat niet.

Wie zegt dit eigenlijk

LeCun is geen man die vanaf de tribune staat te schreeuwen.

Hij deelde in 2018 de Turing Award, zo'n beetje de Nobelprijs van de informatica, met Geoffrey Hinton en Yoshua Bengio. Eind jaren tachtig en in de jaren negentig deed hij het fundamentele werk aan convolutionele neurale netwerken. Dat is de architectuur die de handgeschreven cijfers op bankcheques leerde lezen en die de moderne deep-learningrevolutie in computervisie mogelijk maakte. Vrijwel alle huidige beeldherkenningssystemen bouwen voort op ideeën die uit dat werk zijn voortgekomen, van de gezichtsontgrendeling op je telefoon tot het model dat een tumor van een scan afleest. Hij richtte in 2013 Facebook AI Research op en gaf tien jaar lang leiding aan Meta's AI-wetenschap.

Als deze man zegt dat LLMs op zichzelf waarschijnlijk niet voldoende zijn voor echte algemene intelligentie, dan is het de moeite waard om te begrijpen wat hij bedoelt voordat je besluit dat hij ongelijk heeft.

Het verschil, uitgelegd alsof je zestien bent

Hier is het hele meningsverschil, tot op het bot uitgekleed.

Een groot taalmodel wordt getraind door het voorspellen van het volgende woord. Volgens LeCun verklaart dat ook de fundamentele beperking ervan. Het heeft een enorme hoeveelheid tekst gelezen en met griezelige precisie geleerd welke woorden meestal op welke andere woorden volgen. Stel het een vraag en het genereert een antwoord, één token tegelijk, elk token gekozen omdat het statistisch het meest waarschijnlijke is om te volgen. Ik schreef er eerder over: het is een briljante papegaai, een systeem dat prachtige zinnen produceert zonder enig beeld van waar die zin over gaat.

Stel je iemand voor die elk boek heeft gelezen dat ooit is geschreven, maar nooit één keer de kamer heeft verlaten. Diegene praat vloeiend over zwaartekracht. Heeft nog nooit iets zien vallen.

Een wereldmodel is de andere manier van weten.

Een tweejarige heeft nul boeken gelezen. Maar duw een beker naar de rand van de tafel en die peuter weet al, ergens in zijn lijf, dat hij gaat vallen en kapotgaat. Dat heeft hij niet uit een zin geleerd. Hij leerde het door naar de wereld te kijken, duizenden keren, tot hij een intern gevoel had van hoe dingen zich gedragen. Rol een bal achter de bank en hij kijkt waar die er aan de andere kant uitkomt. Er draait een model van de wereld in zijn hoofd, en hij gebruikt het om te voorspellen wat er gaat gebeuren en om te bedenken wat hij eraan gaat doen.

Dat is wat LeCun wil bouwen. Geen systeem dat het volgende woord voorspelt, maar een systeem dat voorspelt wat de wereld gaat doen.

Wat JEPA eigenlijk doet

De aanpak van zijn team heet JEPA, Joint Embedding Predictive Architecture, en de videoversie, V-JEPA, is getraind op meer dan een miljoen uur aan internetvideo.

Het slimme zit hem in wat het weigert te doen. Een voor de hand liggende manier om een model iets over de wereld te leren, is het laten voorspellen wat het volgende videobeeld wordt, pixel voor pixel. Dat mislukt, want de meeste fijne details zijn werkelijk onvoorspelbaar. Je kunt niet raden waar precies elk blad heen waait of hoe het licht flikkert, en het toch proberen dwingt het model om al zijn kracht aan ruis te verspillen.

Dus voorspelt JEPA op het niveau van de grote lijn. Het kijkt naar een fragment, verbergt een deel ervan, en voorspelt een abstracte samenvatting van het ontbrekende stuk: "er is een beker, hij is dicht bij de rand, hij beweegt." Niet de exacte pixels. De betekenis. Het leert het deel van de toekomst te bewaren dat ertoe doet en het deel weg te gooien dat alleen maar ruis is.

Dat klinkt als een kleine technische keuze. Dat is het niet. Volgens LeCun brengt een systeem dat de grote lijn van wat er gaat gebeuren kan voorspellen je dichter bij iets wat huidige LLMs moeilijk kunnen: expliciet redeneren over mogelijke toekomstige toestanden van de wereld. Het kan "als ik dit doe, wordt de wereld zo" vooruit afspelen in zijn hoofd, de uitkomst vergelijken met een doel, en een actie kiezen. Dat is plannen. Dat lijkt meer op plannen. Moderne LLMs kunnen verrassend goed plannen binnen een taak, maar volgens LeCun missen ze nog steeds een expliciet model van hoe de wereld zich gedraagt.

Hier zit een harde wiskundige kant aan. LeCun wijst er graag op dat als een model blind genereert, stap voor stap, met zelfs maar 1 procent kans dat het bij elke stap misgaat en geen manier om zichzelf te controleren, honderd stappen achter elkaar nog maar zo'n 37 procent kans hebben om helemaal goed te zijn. Fouten stapelen op. Een systeem dat niet kan zien waar het naartoe gaat, loopt vaak genoeg van de weg af.

Dit is het papegaaiprobleem in formele notatie. Geen intern beeld, geen plan, geen zelfcontrole.

Het stuk dat niemand aan code koppelt

Hier wordt het interessant voor iedereen die zijn dag doorbrengt in een agent-loop.

LeCun beschrijft een gat: de LLM heeft geen wereldmodel. En de hele praktijk van agentic coding is, of we het nu hardop zeggen of niet, een manier om dat gat van buitenaf op te vullen.

Denk na over wat Claude Code, of welke fatsoenlijke coding agent dan ook, eigenlijk laat werken. Het is niet dat het model eindelijk een intern begrip van jouw systeem heeft gekregen. Het is het harnas eromheen. De compiler die onzin weigert. De typechecker die zegt "die functie bestaat niet." De testsuite die op rood springt. Het bestandssysteem dat het kan teruglezen. De loop die elke foutmelding meteen terugvoert naar de volgende poging.

Je kunt dat harnas zien als een extern wereldmodel. Het zit alleen buiten de gewichten in plaats van erin.

Het model stelt een actie voor, de wereld (jouw codebase, jouw compiler, jouw tests) reageert, en het model mag de reactie zien en zich aanpassen. Dat is de peuter-en-de-beker-loop, opnieuw opgebouwd uit CI en stacktraces. We hebben niet gewacht tot het model leerde hoe onze software zich gedraagt. We bouwden een omgeving die het hem laat zien, bij elke stap.

Dit is waarom ChatGPT in 2023, kaal in een tekstvak geplakt, voelde als een knappe truc, en een agent die in 2025 was vastgeknoopt aan een echte toolchain voelde als een collega. Hetzelfde soort model eronder. Het verschil is het kunstmatige wereldmodel dat we eromheen wikkelden.

Waar de prothese ophoudt

Zodra je agentic coding zo bekijkt, kun je precies voorspellen waar je agent scherp is en waar hij blind wordt.

Hij is scherp overal waar het wereldmodel goedkoop naar buiten te halen is. Streng getypeerde code, een snelle testsuite, een strakke compile-loop, duidelijke runtime-fouten. In die omgeving krijgt de agent bij elke zet dichte, eerlijke feedback, en dan is hij echt goed. De wereld vertelt hem wanneer hij fout zit.

Hij wordt blind overal waar je het wereldmodel niet naar buiten kunt halen. "Maak dit wat fijner." "Is dit de juiste abstractie." "Snappen gebruikers dit." Ongeteste lijmcode waar niets op rood springt als het breekt. Productintentie die alleen in jouw hoofd leeft. Er bestaat geen compiler voor smaak. De agent loopt van de weg af, vol vertrouwen, omdat niets in zijn omgeving terugduwde. Dit is dezelfde reden waarom de prompt niet de spec is: de structuur moet ergens vandaan komen, en op dit moment ben jij dat ergens.

De praktische les schrijft zich dus vanzelf. Stop met hopen dat het model oordeelsvermogen krijgt en begin bewust het externe wereldmodel te bouwen. Tests zijn niet meer alleen voor het vangen van regressies, ze zijn de zintuigen waarmee je agent de codebase voelt. Types zijn niet alleen documentatie, ze zijn vangrails waar de agent niet doorheen kan rijden. Een strakke feedback-loop is geen leuke extra, het is het verschil tussen een agent die bijstuurt en een die zijn eigen fouten opstapelt richting die 37 procent.

Wat er gebeurt als LeCun gelijk heeft

Als LeCun gelijk heeft en wereldmodellen een essentieel ontbrekend ingrediënt blijken te zijn, begint het ding dat we nu van buitenaf vastschroeven naar binnen te verhuizen. Een model dat echt kan plannen, gevolgen kan voorstellen en zichzelf kan toetsen aan een intern gevoel van hoe systemen zich gedragen, heeft veel minder steigerwerk nodig. Het harnas wordt dunner. De agent heeft jou niet meer nodig als zijn ogen.

Als de inzet niet uitpakt, of langzaam, verandert er niets aan je werk. Jij blijft het wereldmodel. Jij blijft de structuur leveren, de tests, het oordeel, het beeld van waar de code naartoe hoort te gaan dat het model simpelweg niet heeft.

Hoe dan ook, de zet van vandaag is dezelfde, en het is de oninteressante: bouw de omgeving die het model eerlijke feedback geeft, want die omgeving doet het denkwerk dat het model niet kan.

LeCun voorspelt niet de dood van je coding agent. Hij legt, preciezer dan wie dan ook die je de agent verkoopt, het steigerwerk uit waar je al op staat.

De papegaai kan nog steeds niet zien waar hij heen gaat. Jij hebt alleen geleerd om een paar ogen voor hem te bouwen, van je testsuite.

Bronnen: MIT Technology Review over AMI Labs, Meta AI over V-JEPA 2, The Decoder over LeCuns vertrek.