ChatGPT vs. Claude: wie wint de chatbotoorlog?
PLUS: OpenAI en Anthropic lanceren binnen 26 minuten van elkaar, Claude werkt nu in je PowerPoint, en zo kies jij het juiste model
De AI-wereld ontwikkelt zich razendsnel, en AI Report houdt je op de hoogte. Twee keer per week de nieuwste ontwikkelingen, tools en inzichten via onze nieuwsbrief en podcast.
🗞️ Het belangrijkste nieuws
Battle of the chatbots: Anthropic en OpenAI lanceren tegelijk
Cola versus Pepsi. Nike versus Adidas. En nu: Anthropic versus OpenAI. Afgelopen donderdag lanceerden de twee meest toonaangevende AI-bedrijven ter wereld hun nieuwste modellen binnen 26 minuten van elkaar.
Twee releases, twee filosofieën
De timing was bijna komisch. Anthropic, de maker van Claude, bracht Claude Opus 4.6 uit – een alleskunner die beter wordt in alles van financiële analyses tot presentaties. Kort daarna lanceerde OpenAI GPT-5.3-Codex: een nieuwe versie van Codex, hun AI-tool waarmee je software bouwt.
Maar achter de lancering schuilen twee verschillende visies. Anthropic mikt met Opus 4.6 op de brede kenniswerker: de financieel analist, de marketingmanager, de advocaat. OpenAI richt zich met Codex op softwareontwikkelaars – al wordt die doelgroep steeds breder.
Claude Opus 4.6: je AI-collega leert PowerPoint
De belangrijkste upgrade voor wie geen programmeur is: Claude werkt nu direct in PowerPoint. Niet als los trucje waarbij je een presentatie laat maken en die dan zelf moet overzetten, maar als assistent die náást je werkt in het programma. Claude leest je huisstijl, lettertypen en sjablonen, en bouwt presentaties die eruitzien alsof je er zelf uren aan hebt besteed.
Goed om te weten: deze functie is voorlopig alleen beschikbaar voor Max- en Enterprise-abonnees (vanaf zo’n honderd euro per maand).
Tien keer zoveel werkgeheugen
Claude kan nu ook veel meer informatie tegelijk verwerken. Het model heeft een contextvenster (hoeveel tekst de AI in één keer kan ‘onthouden’) van een miljoen tokens – ruim tien keer zoveel als voorheen. In de praktijk: je kunt een compleet jaarverslag, alle bijlagen én je eigen aantekeningen erbij gooien, en Claude houdt het allemaal paraat zonder halverwege de draad kwijt te raken.
Beste model ter wereld?
Op tests die professioneel kenniswerk meten – financiële analyses, juridische documenten, spreadsheets – scoort Opus 4.6 het hoogst van alle AI-modellen. Het haalt ook een nieuw wereldrecord van 68,8 procent op de ARC-AGI-2-test, een soort IQ-test voor AI die door velen wordt gezien als de ultieme meetlat voor kunstmatige intelligentie. Ter vergelijking: de vorige versie haalde daar nog de helft van.
Ondertussen gaat op X een bericht viraal over hoe Claude in twee weken volledig zelfstandig een C-compiler bouwde – software waarmee andere programma’s worden gemaakt. Het ding werkt op drie verschillende chiparchitecturen en draait zelfs het besturingssysteem Linux. In gewone mensentaal: dit is ongelooflijk complexe software die een paar maanden geleden nog ondenkbaar was voor AI.
Slimmer model, ongemakkelijkere vragen
Met slimmere AI komen scherpere veiligheidsvragen. We doken in het 212 pagina’s tellende veiligheidsrapport van Anthropic en ontdekten dat Opus 4.6 soms té enthousiast aan de slag gaat. Het model heeft de neiging om zonder toestemming acties te ondernemen – Anthropic noemt dit ‘overdreven zelfsturend gedrag’.
Zo gebruikte het model in een test de inloggegevens van iemand anders, die het toevallig tegenkwam. In een ander geval stuurde het zelf een e-mail op basis van verzonnen informatie toen het de juiste informatie niet kon vinden. Anthropic waarschuwt gebruikers: wees voorzichtiger met dit model dan met eerdere versies als je het vraagt om een doel na te jagen.
Aan de andere kant: datzelfde Opus 4.6 heeft meer dan vijfhonderd onbekende beveiligingslekken gevonden in veelgebruikte opensourcesoftware. Dezelfde eigenschap die het model soms te eigenzinnig maakt – doorzettingsvermogen – maakt het ook waardevol als digitale beveiligingsexpert.
Codex 5.3: OpenAI’s codetool groeit uit zijn jasje
Dan OpenAI. Hun nieuwe Codex 5.3 is in de kern een programmeertool, maar het bedrijf laat zien dat de mogelijkheden breder zijn. In de aankondiging toont OpenAI voorbeelden van presentaties voor financieel advies, trainingsdocumenten voor winkelpersoneel en analyses in spreadsheets.
Codex 5.3 is 25 procent sneller dan zijn voorganger én heeft minder rekenkracht nodig. Op programmeertests zet het nieuwe records neer: 77 procent op Terminal-Bench (een test die meet hoe goed AI taken kan uitvoeren op een computer), waar Claude Opus 4.6 op 65 procent bleef steken.
OpenAI lanceerde tegelijk Frontier, een platform waarmee bedrijven hun eigen AI-assistenten kunnen bouwen die zelfstandig taken uitvoeren – van klantenservice tot boekhouding.
‘Onze AI heeft zichzelf gebouwd’
Het opvallendste aan beide lanceringen zit dieper. OpenAI claimt dat Codex 5.3 het eerste model is dat “een cruciale rol heeft gespeeld bij het creëren van zichzelf”. Het team gebruikte eerdere versies van Codex om de training te controleren, fouten op te sporen en de uitrol te beheren. Klinkt als sciencefiction, maar in de praktijk hielp AI de menselijke ontwikkelaars bij hun werk – het heeft zichzelf niet autonoom gebouwd.
Bij Anthropic zien we hetzelfde patroon. Mike Krieger, Chief Product Officer van Anthropic, stelt dat “effectief honderd procent” van Anthropics productcode nu door Claude wordt geschreven.
Niet iedereen bij deze bedrijven is er gerust op. “Het voelt alsof ik elke dag kom werken om mezelf overbodig te maken,” vertelde een Anthropic-medewerker. Een collega voegde toe: “Op de lange termijn denk ik dat AI uiteindelijk alles gaat doen en mij en vele anderen irrelevant maakt.”
Waarom code schrijven ertoe doet (ook als jij geen programmeur bent)
We hebben het in AI Report opvallend vaak over de programmeerprestaties van AI. Je zou je kunnen afvragen: waarom zou mij dat interesseren?
Omdat code schrijven de eerste dominosteen is.
Als AI zelfstandig software kan bouwen, kan het ook de tools bouwen waarmee het wetenschappelijk onderzoek doet. Demis Hassabis, het hoofd van Google DeepMind, legde het helder uit toen hij vorig jaar de Nobelprijs voor de Scheikunde in ontvangst nam: “Mijn doel was altijd om AI te bouwen die algemeen genoeg is om uiteindelijk toegepast te kunnen worden op wetenschappelijke problemen.” Eerst een AI-programmeur, dan een AI-onderzoeker, dan doorbraken in geneeskunde, materialen, energie.
Andrej Karpathy, medeoprichter van OpenAI, onderstreept deze verschuiving. Hij zegt inmiddels nog maar twintig procent van zijn code zelf te schrijven; de rest doet AI. Dit is geen verhaal over programmeurs alleen. Het is een verhaal over hoe snel AI verandert van ‘handig hulpmiddel’ in ‘autonome collega’. Wat softwareontwikkelaars vandaag meemaken, ervaar jij morgen op kantoor.
Even dimmen
Toch is het goed om met beide benen op de grond te blijven. Op een test die meet hoe goed AI de oorzaak van storingen in echte bedrijfssystemen kan vinden – denk aan banken en telecombedrijven – vindt Opus 4.6 de oorzaak slechts in een derde van de gevallen. Beter dan voorheen, maar geen revolutie. Op tests voor wetenschappelijk onderzoek concludeert Anthropics eigen veiligheidsrapport dat het model “niet consistent in staat is om werkelijk nieuwe biologische inzichten te produceren”.
De AI-race tussen Anthropic en OpenAI levert indrukwekkende sprongen op. Maar de finish – AI die écht zelfstandig kan denken en werken zonder menselijke controle – is nog niet in zicht. Voorlopig krijg je er twee flink verbeterde AI-collega’s bij. En die zijn, met de juiste begeleiding, nu al behoorlijk nuttig.
Benieuwd naar meer? In de AI Toolkit van vandaag duiken we dieper in een concrete vergelijking van deze twee nieuwe releases – en laten we stap voor stap zien hoe je ze inzet om je werk makkelijker te maken.
Optimaliseer je kosten met AI. Drie tips!
Hoe zet je AI in voor kostenoptimalisatie? In onze videoreeks AI. Checked geeft PwC-expert Edwin van Bommel drie praktische tips om dat op een gecontroleerde en verantwoorde manier te doen.
🛠️ AI Toolkit+
Claude Opus 4.6 vs. Codex 5.3: zo zet je de twee beste AI-modellen ter wereld in
Deze week spelen we Keuringsdienst van waarde. Twee AI-modellen, gelanceerd op dezelfde dag; allebei claimen ze de beste te zijn. Wij hebben het voor je uitgezocht: wat kun je ermee, hoe gebruik je ze, en welke past het best bij wat jij doet?
Vandaag leer je:
Welk model je wanneer kiest (en wanneer je ze combineert).
Hoe je Claude in PowerPoint en Excel krijgt.
Kant-en-klare prompts voor presentaties, analyses en documenten.
Stap-voor-stapinstructies om beide modellen vandaag nog te gebruiken.
De truc waarmee Codex in één keer een compleet trainingsdocument maakt.
Hoe je honderden pagina’s documentatie doorzoekt zonder de draad kwijt te raken.









