De Ferrari heeft een begrenzer: een dag met Claude Fable 5

Anthropic bracht gisteren Claude Fable 5 uit en noemde het het krachtigste algemeen beschikbare model ooit. De benchmarks maken die kop waar. De pers deed zijn werk. Rond lunchtijd stond mijn tijdlijn vol met screenshots van apps die in één prompt klaar waren en met "dit ding is een beest."

Ik heb er een dag mee gewerkt. Het stelde me teleur, en niet omdat het model zwak is.

Het stelde me teleur omdat het krachtigste model ter wereld weigerde het enige werk te doen dat ik er echt voor had, en het tweede klusje maar net iets beter deed dan het ding waar ik al voor betaal.

Laat me uitleggen wat er gebeurde, en daarna wat er echt aan de hand is.

Fable kan echt wat

Ik ga niet doen alsof het niks kan. Dat doet het wel.

Fable 5 is de publieke versie, "veilig voor algemeen gebruik," van Anthropics Mythos-klasse, de laag die nu boven Opus zit. Hetzelfde onderliggende model als Mythos 5, dat achter een besloten programma genaamd Project Glasswing blijft. De API-id is claude-fable-5. Het heeft een context window van 1M tokens en tot 128k tokens output, en het houdt over dat hele window zijn focus vast op een manier die Opus 4.8 duidelijk niet haalt.

De cijfers zijn echt sterk. Op SWE-bench Pro haalt het 80,3%, tegenover 58,6% voor GPT-5.5. Op Terminal-Bench 2.1 komt het op 88,0%, vóór Opus 4.8 met 82,7%, GPT-5.5 met 83,4% en Gemini 3.1 Pro met 70,7%. Stripe zegt een migratie van vijftig miljoen regels in een dag te hebben gedraaid, tegen een schatting van twee maanden. Simon Willison gooide er moeilijke problemen tegenaan en noemde het een beest. Hij heeft geen ongelijk.

Het is ook zuiniger met tokens. Sommige mensen melden hetzelfde resultaat met ongeveer de helft van de tokens, en dat gaat meetellen zodra het over de rekening gaat.

Dus: echt model, echte vooruitgang. Eer wie eer toekomt. Ik wilde het voor twee dingen gebruiken. Hier ging het mis.

Het werk dat het weigerde

Ik schrijf al sinds de jaren 80 code, en tegenwoordig bestaat een groot deel van mijn werk uit het auditen van codebases van anderen. Soms gaat dat over de securitykant: redeneren over exploitatiepaden, offensieve tooling doorlopen, het soort audit waarbij de diepgang van het model het hele punt is. Dat was het eerste waar ik Fable 5 voor pakte.

Dat wilde het niet.

Niet met een weigering. Er verscheen een gele balk: Fable's veiligheidsmaatregelen hadden mijn bericht aangemerkt als cybersecurity, en het was overgeschakeld naar Opus 4.8. Eerlijk is eerlijk, die balk zegt het hardop, en geeft zelfs zwart op wit toe dat die maatregelen "ook veilige, normale content kunnen aanmerken." Je kunt het gedrag aanpassen in /config.

Het zei het me dus. En vervolgens schoof het me alsnog door, op een legitieme audit waarvan het zelf toegeeft dat die niet aangemerkt had moeten worden.

Dit is het deel van de lancering dat de kop niet haalde. Fable 5 wordt geleverd met een classifier die let op risicovolle domeinen, offensieve cybersecurity en exploitatie, het meeste rond biologie en chemie, alles wat op een distillatiepoging lijkt, en als die afgaat, wordt je prompt in plaats daarvan door het zwakkere model beantwoord. Anthropic zegt dat dit in minder dan 5% van de sessies gebeurt. Minstens 95% van het Fable-verkeer draait volgens hen volledig op Fable.

Dat getal is technisch geruststellend en in de praktijk waardeloos. Die 5% is niet gelijk over iedereen verdeeld. Het zit geconcentreerd in precies de taken die werkende professionals draaien. Binnen een paar uur na de release gingen er screenshots rond van doodgewone cryptografie- en openssl-achtige vragen die de cyber-classifier lieten afgaan. De gangbare theorie in de community is de voor de hand liggende: als gelegenheidsgebruiker word je bijna nooit doorgeschoven, en doe je echt securitywerk, dan gebeurt het bijna de hele sessie.

Dit is het vlaggenschip, het model dat iedereen een beest noemt. Op de ene taak waar de diepgang de hele reden was om het te gebruiken, kreeg ik het model dat ik al had. Wil je weten hoe goed Opus 4.8 nog steeds is, daar schreef ik over. Het is een goed model. Alleen niet het model waarvoor ik kwam. Een balk die me vertelt dat ik ben gedegradeerd, maakt de degradatie niet ongedaan, en "we kunnen veilige content aanmerken" is geen feature, het is een bekentenis.

De hand die je niet ziet

En dan het deel dat die balk niet dekt.

De modelwissel is zichtbaar. Mooi. Maar de safeguards zijn niet alleen een schakelaar naar een ander model. Ze bevatten ook prompt-aanpassing en steering vectors: ingrepen op je verzoek, ín het model, die je niet ziet en waar geen balk voor verschijnt. De prompt die jij schreef is niet altijd de prompt die het model beantwoordt, en er wordt nergens gemeld wanneer dat gebeurt. De luide ingreep krijgt een melding. De stille niet.

Nathan Lambert verwoordde het beter dan ik kan. Een AI die vanzelf minder intelligent wordt, zonder het je te vertellen, is per definitie misaligned. Op die test doet Anthropic de modelwissel goed: het vertelt het je. Het is de laag eronder die niet gemeld wordt, de steering die je niet ziet en niet kunt uitzetten in /config, die het contract breekt.

En dan de timing, die het lastig maakt om dit als pure veiligheid te lezen. Anthropic bracht dit uit een paar dagen nadat ze publiekelijk waarschuwden dat AI te snel gaat en zichzelf binnenkort misschien gaat verbeteren. En toen brachten ze toch hun krachtigste publieke model uit, met de scherpste ingrepen op precies de domeinen waar een concurrent ze zou kunnen inhalen. Lambert leest het zo, en ik ook: een mix van redelijke, transparante veiligheid op bio en cyber, en stilletjes uitgerolde marktbescherming op alles wat op frontier-onderzoek lijkt. Het bio-slot kan ik verdedigen. De onzichtbare nerf niet.

Heb je de wapenwedloop om je vertrouwen gelezen, dan is dit dezelfde zet met een grotere motor.

Het werk dat het niet weigerde

Het tweede dat ik wilde, was een logica-audit. Geen cyber, geen bio, niets waar de classifier zich druk om maakt. Gewoon het slimste publieke model op een echte codebase richten en vragen wat er stuk is.

Hier draait het model op volle kracht. Geen routing, geen begrenzer. De eerlijke frontier-ervaring.

Het vond één edge case.

Een echte edge case, dat wel. Een serieuze bug die ik in review met plezier eruit had gehaald. Maar één, op een pass op volle kracht, van het model dat 80,3% scoort op SWE-bench Pro en vijftig miljoen regels in een dag migreert. Opus 4.8 vindt dat soort dingen ook. Het verschil tussen die twee modellen op de benchmark vertaalde zich niet naar een verschil op mijn bureau.

Dat is de stillere teleurstelling, en degene die in het begrenzer-rumoer ondersneeuwt. Zelfs als Fable 5 op volle kracht mag draaien, zijn het cijfer uit de kop en het resultaat op je bureau niet hetzelfde. Ik maakte dat argument eerder over benchmarks, en Fable 5 is er het duurste bewijs van tot nu toe. De papegaai kreeg een grotere woordenschat. Hij weet nog steeds niet welke van je bugs ertoe doet.

De rekening, en de afgrond

Over die kosten.

Fable 5 is $10 per miljoen input-tokens en $50 per miljoen output. Dat is ruwweg het dubbele van Opus, en Anthropic is er open over dat het het duurste grote model van het moment is. Sessies op serieus werk vreten met gemak 500k tot een miljoen tokens. Dat het zuiniger met tokens omgaat scheelt, maar het blijft de hoofdprijs voor een topmodel dat me op mijn twee echte taken één model gaf dat ik al heb, en één edge case.

En de teller staat op het punt aan te gaan. Fable zit tot 22 juni in de betaalde plannen. Na de 23e komt het uit je usage credits. Het venster waarin iedereen het een beest noemt, is dus ook het venster waarin niemand er per token voor betaalt. Dat verandert recensies meestal. Ik heb die teller eerder zien aangaan.

Wat ik je echt zou zeggen

Doe je losse dingen, prototypes, documentanalyse, langlopend onderzoek met veel context, dan gaat de begrenzer nooit af en is het model het beste dat je kunt kopen. Echt. Gebruik het.

Doe je security, cryptografie, alles waar de cyber-classifier scheef naar kijkt, ga er dan van uit dat je het grootste deel van de tijd met Opus 4.8 praat, en prijs je werk daarop. Let op de gele balk. Die vertelt je wanneer de motor is ingeruild voor een kleinere, en dat is eerlijker dan de meeste van deze branche het doet. Alleen maakt het Opus daarmee nog geen Fable.

Houd dus je hand aan het stuur. Het vertelt je wanneer het de motor inruilt. Het vertelt je niet wanneer het stilletjes aan het stuur draait.

Het rumoer kwam binnen een paar uur uit op de juiste metafoor: een Ferrari met een begrenzer op 30. Wat iedereen te enthousiast is om hardop te zeggen, is dat de begrenzer niet op de auto zit. Hij zit op de wegen waar je echt rijdt.

Fable kan echt wat ​

Het werk dat het weigerde ​

De hand die je niet ziet ​

Het werk dat het niet weigerde ​

De rekening, en de afgrond ​

Wat ik je echt zou zeggen ​

gerelateerd

De MCP-supply chain is de nieuwe npm, en hij is al vergiftigd

Er zat niemand achter het stuur: de eerste inbraak die een agent zelf uitvoerde

Het gat dat je sandbox bruikbaar maakt