Bouw je eigen AI-agent in gewonemensentaal

PLUS: OpenAI in crisismodus vervroegt lancering GPT-5.2, kleine start-up kraakt 'onmogelijke' AI-test, en zo bespaar je een uur per dag met AI

Xiang Yu Yeung, Alexander Klöpping, Wietse Hage, en Ernst-Jan Pfauth

dec 09, 2025

∙ Betaald

De AI-wereld ontwikkelt zich razendsnel, en AI Report houdt je op de hoogte. Twee keer per week de nieuwste ontwikkelingen, tools en inzichten via onze nieuwsbrief en podcast.

🗞️ Het belangrijkste nieuws

OpenAI schakelt over op crisismodus – en dat is goed nieuws voor jou

Sam Altman, de topman van OpenAI, heeft intern ‘code rood’ afgekondigd. De reden: Googles nieuwe AI-model Gemini 3 presteert op belangrijke tests beter dan ChatGPT. Het gevolg? OpenAI parkeert nieuwe snufjes en focust weer op wat ertoe doet: een chatbot die gewoon goed werkt.

Wat is er aan de hand?

Google lanceerde vorige maand Gemini 3, en dat model versloeg ChatGPT op meerdere fronten. Denk aan abstract redeneren, wetenschappelijke kennis en visueel begrip. Altman noemde Gemini 3 publiekelijk een ‘geweldig model’ – niet bepaald de reactie van iemand die rustig achterover leunt.

Intern was de toon scherper. Volgens The Information stuurde Altman een memo naar medewerkers waarin hij aangaf dat ChatGPT moet verbeteren om bij te blijven. Het resultaat: OpenAI’s volgende update, GPT-5.2, wordt naar voren gehaald. Oorspronkelijk gepland voor eind december, nu mogelijk al deze week.

Google zet de toon

Deze week maakte Google de druk nog groter door Gemini 3 Deep Think beschikbaar te stellen voor betalende gebruikers. Dit is een speciale modus die complexe wiskunde-, wetenschap- en logicaproblemen aanpakt door meerdere oplossingsroutes tegelijk te verkennen. Op de zwaarste AI-tests scoort het model records die andere systemen nog niet hebben geëvenaard.

Voor jou betekent dit: als je Googles AI-abonnement hebt, kun je nu experimenteren met een van de krachtigste redeneermodellen die er zijn. Handig voor wie regelmatig worstelt met ingewikkelde analyses of berekeningen.

Waarom concurrentie goed nieuws is

Het interessantste aan deze AI-wapenwedloop is niet wie er wint, maar wat het oplevert voor gebruikers. OpenAI heeft aangekondigd dat het de focus verlegt van flashy nieuwe functies naar snelheid, betrouwbaarheid en aanpasbaarheid van ChatGPT.

Een concreet voorbeeld: OpenAI testte recent promotionele berichten in ChatGPT – suggesties voor bedrijven als Peloton en Target die verdacht veel op advertenties leken. Betalende gebruikers klaagden, en OpenAI’s onderzoeksdirecteur Mark Chen gaf toe dat het bedrijf tekortschoot. De functie is inmiddels uitgezet.

“Alles wat aanvoelt als een advertentie moet met zorg worden behandeld, en daar zijn we in tekortgeschoten,” schreef Chen. Altmans ‘code rood’-memo betekent ook dat advertentieplannen op de lange baan zijn geschoven. Eerst de basis op orde, dan pas nieuwe inkomstenbronnen.

Wat kun je verwachten?

GPT-5.2 moet volgens OpenAI’s interne tests beter presteren dan Gemini 3. Of dat klopt, zien we pas als het model daadwerkelijk beschikbaar is. Wat wel duidelijk is: de concurrentiestrijd dwingt alle partijen om scherp te blijven.

Voor jou als gebruiker betekent dit betere tools, sneller verbeteringen en bedrijven die twee keer nadenken voordat ze je ervaring verpesten met advertenties. Soms is een beetje paniek in Silicon Valley precies wat we nodig hebben.

AI bespaart je bijna een uur per dag – maar hoe zit het écht?

Twee grote onderzoeken deze week vertellen ogenschijnlijk tegenstrijdige verhalen over AI op de werkvloer. Het ene belooft tijdwinst, het andere waarschuwt voor baanverlies. Wat klopt er nu eigenlijk?

Wat is er aan de hand?

OpenAI, het bedrijf achter ChatGPT, ondervroeg 9000 werknemers bij honderd bedrijven over hun AI-gebruik. De conclusie: gemiddeld besparen mensen 40 tot 60 minuten per dag op hun werk. Driekwart zegt sneller of beter te werken dankzij AI. Vooral data-analisten, ingenieurs, communicatiemedewerkers en accountants melden flinke tijdwinst.

Tegelijkertijd publiceerde MIT een studie die stelt dat AI nu al 11,7 procent van de Amerikaanse arbeidsmarkt kan overnemen – goed voor 1,2 biljoen dollar aan loonkosten. Dat klinkt alarmerend, maar de nuance zit in de details.

De cijfers in perspectief

Die 11,7 procent gaat namelijk niet over complete banen zoals de headlines suggereren, maar over losse taken. Het MIT-onderzoek meet hoeveel van je dagelijkse werkzaamheden AI technisch gezien zou kunnen uitvoeren – niet hoeveel mensen daadwerkelijk hun baan verliezen. Of dat gebeurt, hangt af van wat bedrijven besluiten te doen, hoe werknemers zich aanpassen en welk beleid overheden voeren.

Zo bekeken vertellen beide onderzoeken eigenlijk hetzelfde verhaal: een aanzienlijk deel van kantoorwerk kan inmiddels door AI worden ondersteund, en dat vertaalt zich in meetbare tijdwinst voor wie de technologie daadwerkelijk inzet.

Wat kun je ermee?

De praktische les uit beide onderzoeken: AI werkt het beste als hulpmiddel, niet als vervanging. De grootste tijdwinst zit in:

routinematige taken zoals e-mails opstellen, vergaderingen samenvatten of data ordenen;
nieuwe vaardigheden uitproberen (interessant: niet-technische medewerkers gebruiken AI steeds vaker voor simpele programmeertaken);
eerste versies maken van presentaties, rapporten of analyses die je daarna zelf aanscherpt.

De kanttekeningen

Niet iedereen is overtuigd. Onderzoekers van Harvard en Stanford waarschuwden eerder dit jaar voor workslop: AI-gegenereerd werk dat er professioneel uitziet maar inhoudelijk weinig toevoegt. En de werkelijke impact van AI op productiviteit is lastig te meten. Veel mensen gebruiken AI-tools zonder dat officieel te melden, of nemen apps van thuis mee naar kantoor. Die ‘schaduw-AI’ maakt het voor onderzoekers moeilijk om harde conclusies te trekken.

Bovendien: het OpenAI-onderzoek is niet onafhankelijk getoetst en komt van een partij die er belang bij heeft dat AI er goed uitkomt. Dat maakt de resultaten niet per se onwaar, maar het is wel iets om in je achterhoofd te houden.

Waarom dit ertoe doet

De echte vraag is niet óf AI je werk verandert, maar hoe. De onderzoeken laten zien dat de impact sterk verschilt per functie en per taak. Voor jou betekent dit: experimenteer met AI voor de saaiere delen van je werk, maar blijf kritisch op wat eruit komt. Die 40 minuten tijdwinst per dag klinkt aantrekkelijk – zolang je ze niet kwijtraakt aan het corrigeren van AI-blunders.

Kleine start-up kraakt ‘onmogelijke’ AI-test

Een zeskoppig bedrijf genaamd Poetiq is als eerste ter wereld door de 50-procentgrens gebroken op de ARC-AGI-2 – een test die binnen de AI-wereld geldt als de ultieme lakmoesproef voor menselijk intelligentieniveau.

Waarom deze test ertoe doet

De ARC-AGI-test meet precies datgene waar AI slecht in is en mensen goed: nieuwe, onbekende problemen oplossen zonder te kunnen terugvallen op eerder geziene voorbeelden. De test bestaat uit visuele puzzeltjes waarbij je moet ontdekken welke logica achter een patroon zit – en die vervolgens moet toepassen op een nieuwe situatie. Zes maanden geleden scoorden de beste modellen nog onder de 5 procent. Mensen halen moeiteloos 60 procent.

Veel experts kijken daarom naar deze test als graadmeter voor AGI – kunstmatige intelligentie die écht op menselijk niveau kan redeneren. Als AI deze test kraakt, zo is de gedachte, zijn we een grote stap dichter bij dat moment.

Benieuwd of jouw score AI evenaart? Probeer ‘m hier.

Wat Poetiq heeft gedaan

In plaats van een eigen AI-model te bouwen, ontwikkelde Poetiq een slim systeem dat bestaande modellen orkestreert. Concreet: ze laten Googles Gemini 3 Pro een antwoord genereren, analyseren dat antwoord automatisch op fouten, en laten het model zichzelf steeds opnieuw verbeteren totdat de oplossing klopt. Een soort ingebouwde kwaliteitscontrole die het model dwingt om beter na te denken.

Het resultaat: een score van 54 procent, tegen 30 dollar per opgave. Googles eigen topvariant Deep Think bleef steken op 45 procent – en kostte meer dan het dubbele.

Waarom is dit belangrijk?

De doorbraak laat zien dat je niet per se een miljardenbegroting nodig hebt om AI vooruit te helpen. Slimme software boven op bestaande modellen kan soms meer opleveren dan brute rekenkracht. Voor jou betekent het vooral dit: de AI-tools die je dagelijks gebruikt worden waarschijnlijk sneller beter dan je denkt.

Maak je bestuur NIS2-proof

De NIS2-richtlijn stelt nieuwe eisen aan bestuur en toezicht op het gebied van cybersecurity. PwC’s Academy biedt een praktijkgerichte training speciaal voor bestuurders en commissarissen. Leer alles over governance, risicomanagement en je verplichtingen.

🛠️ AI Toolkit+

Maak je eigen AI-agent in gewonemensentaal

Je komt ’s ochtends op kantoor en je inbox bevat al een overzicht van het belangrijkste nieuws in jouw vakgebied. Je agenda-afspraken zijn automatisch voorzien van achtergrondinformatie over de mensen die je spreekt. En die wekelijkse statusupdate naar je team? Die is al verstuurd.

Deze week duiken we in een platform waarmee je dit soort AI-agents maakt door simpelweg te beschrijven wat je wilt – zonder dat je hoeft te programmeren of ingewikkelde flowcharts moet bouwen. Je beschrijft gewoon in het Nederlands wat je wilt, en AI regelt de rest. Klinkt te mooi om waar te zijn? We hebben het uitgebreid getest.

In het betaalde deel leer je vandaag hoe je:

elke ochtend automatisch een nieuwsbriefing in je inbox krijgt over jouw vakgebied;
een AI-assistent maakt die je voorbereidt op vergaderingen;
wekelijkse teamupdates laat versturen zonder er zelf aan te denken;
je inbox laat opruimen door een digitale assistent;
direct aan de slag gaat met kant-en-klare promptvoorbeelden.

Lees deze post gratis verder, aangeboden door Ernst-Jan Pfauth.

Of koop een betaald abonnement