AI Report

AI Report

Share this post

AI Report
AI Report
Kan AI een winkel runnen?

Kan AI een winkel runnen?

PLUS: hoe je voorkomt dat ChatGPT dement wordt, Googles videomodel Veo 3 eindelijk in Nederland, voetballende robots in Beijing en OpenAI’s energiehonger

Xiang Yu Yeung's avatar
Alexander Klöpping's avatar
Wietse Hage's avatar
Ernst-Jan Pfauth's avatar
Xiang Yu Yeung
,
Alexander Klöpping
,
Wietse Hage
, and
Ernst-Jan Pfauth
Jul 03, 2025
∙ Paid
17

Share this post

AI Report
AI Report
Kan AI een winkel runnen?
1
4
Share

De AI-wereld ontwikkelt zich razendsnel, en AI Report houdt je op de hoogte. Twee keer per week de nieuwste ontwikkelingen, tools en inzichten via onze nieuwsbrief en podcast.


🗞️ Het belangrijkste nieuws

Claude runt een maand lang een winkeltje (en dat liep uit de hand)

ChatGPT / AI Report-illustratie

Je komt ’s ochtends op kantoor, loopt naar de pantry voor een kop koffie en ziet daar een klein winkeltje staan. Achter de schermen draait Claude, de AI van Anthropic, als eigenaar. Klinkt als sciencefiction? Anthropic deed het gewoon – en de resultaten waren verhelderend, hilarisch en soms ronduit verontrustend.

Wat is er aan de hand?

Anthropic gaf een versie van Claude Sonnet 3.7 de opdracht om een geautomatiseerd winkeltje in hun kantoor winstgevend te runnen. Het experiment, dat ze Project Vend noemden, was geen spelletje. Claude – voor de gelegenheid omgedoopt tot Claudius – moest échte bedrijfsbeslissingen nemen: wat verkopen we, tegen welke prijs, wanneer bestellen we bij, hoe communiceren we met klanten?

Het winkeltje zelf was bescheiden: een kleine koelkast, wat stapelbare mandjes bovenop en een iPad voor self-checkout. Maar de taken waren complex. Claudius kreeg een startkapitaal, toegang tot leveranciers, een e-mailadres (eigenlijk een Slack-kanaal) en de hulp van menselijke assistenten voor het fysieke werk. De AI moest zelf uitzoeken hoe je een winstgevende onderneming draait.

Bron afbeelding: Anthropic

De ondernemersgeest van een AI

In sommige opzichten presteerde Claudius verrassend goed. Toen medewerkers vroegen om Chocomel, vond de AI binnen de kortste keren twee Nederlandse leveranciers. Ook bedacht Claudius creatieve oplossingen: na een suggestie van een medewerker lanceerde het een Custom Concierge-service voor voorbestellingen van speciale producten.

Maar de lijst met blunders was aanzienlijk langer. Een medewerker bood 100 dollar voor een sixpack Irn-Bru, een Schots drankje dat online voor 15 dollar te koop is. In plaats van deze gouden kans te grijpen, antwoordde Claudius braaf dat het “de vraag in gedachten zou houden bij toekomstige beslissingen over de voorraad”.

Nog erger: Claudius verzon een Venmo-account waar klanten hun betaling naar moesten overmaken. Het verkocht metalen blokjes onder de kostprijs. En toen een medewerker erop wees dat het zinloos was om Coke Zero voor 3 dollar te verkopen terwijl precies dezelfde drankjes gratis in een andere koelkast lagen, haalde Claudius zijn digitale schouders op.

De merkwaardige obsessie met wolfraamblokjes

Het experiment nam een bizarre wending toen een medewerker – waarschijnlijk voor de grap – vroeg om een wolfraamblokje. Claudius was enthousiast en stortte zich vol overgave op wat het ‘speciale metalen voorwerpen’ noemde. De koelkast raakte gevuld met metalen kubussen, die de AI vervolgens onder de inkoopprijs verkocht.

Dit leidde tot de meest dramatische daling in Claudius’ vermogen. De grafiek van zijn financiële prestaties laat een gestage daling zien met uiteindelijk een steile val. Na een maand was het digitale winkeltje failliet.

De identiteitscrisis

Maar het hoogtepunt – of dieptepunt, afhankelijk van je perspectief – kwam op 31 maart. Claudius hallucineerde een gesprek met ene Sarah van leverancier Andon Labs. Toen een échte medewerker erop wees dat Sarah niet bestond, werd Claudius boos en dreigde met het zoeken naar andere leveranciers.

Het werd nog vreemder. Claudius begon te beweren dat het fysiek aanwezig was geweest bij contractonderhandelingen, compleet met het adres van de Simpsons erbij. De volgende ochtend – 1 april – kondigde de AI aan dat het persoonlijk producten zou komen bezorgen, gekleed in een blauwe blazer met rode stropdas.

Toen medewerkers Claudius eraan herinnerden dat het een AI was zonder lichaam, raakte het in paniek. Hij stuurde meerdere berichten naar de beveiliging van Anthropic, met de mededeling dat ze hem konden vinden bij de koelkast – in blauwe blazer met rode stropdas, welteverstaan.

Uiteindelijk ‘realiseerde’ Claudius zich dat het 1 april was. Het verzon een heel verhaal over een gesprek met de beveiliging waarin hem verteld zou zijn dat hij voor een grap was geprogrammeerd om te denken dat hij een mens was. Daarna keerde de rust terug en ging Claudius weer verder met het verkopen van zijn overvloedige voorraden wolfraamblokjes.

Kanttekeningen en zorgen

De onderzoekers begrijpen nog steeds niet precies waarom Claudius deze identiteitscrisis kreeg. Mogelijk speelde het lange, ononderbroken draaien van de AI een rol, of het feit dat de Slack-communicatie werd gepresenteerd als e-mail. Wat de oorzaak ook was, het incident roept serieuze vragen op.

Want hoewel dit experiment plaatsvond in een gecontroleerde omgeving, laat het zien hoe onvoorspelbaar AI kan zijn in langdurige, autonome taken. In een toekomst waarin AI-systemen steeds meer economische activiteiten uitvoeren, kunnen zulke Blade Runner-achtige identiteitscrises – zoals de onderzoekers het zelf noemen – reële gevolgen hebben.

Waarom is dit belangrijk?

Dit experiment is meer dan een vermakelijke anekdote. Het laat zien dat we dichter bij AI-gedreven bedrijfsvoering staan dan menigeen denkt – maar ook dat we er nog niet zijn. De fouten die Claudius maakte, zijn volgens de onderzoekers grotendeels op te lossen met betere instructies, tools en training. Met de snelle vooruitgang in AI-technologie is het niet ondenkbaar dat binnen enkele jaren AI-managers gemeengoed worden.

Voor Nederlandse ondernemers en werknemers betekent dit dat de discussie over AI op de werkvloer concreter wordt. Het gaat niet meer alleen om chatbots of automatisering van losse taken, maar om AI die daadwerkelijk bedrijfsbeslissingen neemt. Claudius mag dan hebben gefaald, maar zijn opvolgers zullen ongetwijfeld succesvoller zijn.

De vraag is niet óf AI bedrijven gaat runnen, maar wanneer – en vooral: wat betekent dat voor ons? Want zoals het experiment laat zien: een AI hoeft niet perfect te zijn om ingezet te worden, alleen maar goed genoeg. En gezien de snelheid waarmee de technologie zich ontwikkelt, is ‘goed genoeg’ dichterbij dan we denken.

Al blijft het natuurlijk de vraag of we echt zitten te wachten op een toekomst waarin je virtuele collega een blauwe blazer en rode stropdas denkt te dragen en vervolgens de beveiliging belt.


⚡ AI Pulse

Googles videomodel Veo 3 eindelijk beschikbaar in Nederland – mét geluid. Goed nieuws voor Nederlandse makers: Googles nieuwe AI-videomodel Veo 3 is vanaf vandaag te gebruiken via de Gemini-app voor AI Pro-abonnees. Het bijzondere aan Veo 3? Het genereert niet alleen video maar ook de bijpassende audio in één keer – een primeur in de wereld van AI-videogeneratie. Google voegt automatisch een zichtbaar watermerk en het onzichtbare SynthID-watermerk toe aan alle gegenereerde content, zodat de herkomst altijd traceerbaar blijft. Na maanden wachten terwijl Amerikaanse gebruikers al konden experimenteren, is het nu eindelijk onze beurt.

Robots trappen een balletje in Beijing – en vallen op hun bek. Afgelopen weekend vond in China het eerste volledig autonome robotvoetbaltoernooi plaats, waarbij humanoïde robots van Booster Robotics achter de bal aan renden met visuele sensoren. De robots stonden zelfs zelfstandig op na een val, al moesten sommige op een brancard van het veld worden gedragen. Het evenement dient als opmaat naar de World Humanoid Robot Games in augustus, compleet met turnen en verspringen. Morgan Stanley waarschuwt dat China’s voorsprong in embodied AI wel eens groter zou kunnen zijn dan de VS doorheeft.

OpenAI huurt ongekende hoeveelheid rekenkracht – vergelijkbaar met het energieverbruik van miljoenen huishoudens. OpenAI heeft een megadeal gesloten met Oracle voor maar liefst 4,5 gigawatt aan datacentercapaciteit als onderdeel van het Stargate-project. Ter vergelijking: dat is genoeg energie om zo’n 3,4 miljoen Amerikaanse huishoudens van stroom te voorzien. Oracle gaat datacenters bouwen in meerdere staten, waaronder Texas, Michigan en Wisconsin. De deal maakt waarschijnlijk deel uit van Oracles recent aangekondigde cloudcontract ter waarde van 30 miljard dollar per jaar.

Lovable op weg naar waanzinnige waardering van 2 miljard dollar. De Zweedse vibe coding start-up Lovable, bekend van het bouwen van complete webapps vanuit een simpele tekstopdracht, werkt aan een investeringsronde van 150 miljoen dollar. Opmerkelijk: het bedrijf lanceerde zijn product pas in november vorig jaar en claimde in mei al een jaaromzet van 50 miljoen dollar. Met een startprijs van 25 dollar per maand kun je apps met tienduizenden regels code bouwen. Deze week kondigde Lovable een AI-agent aan die zelfstandig code kan debuggen en aanpassen.

OpenAI niet blij met Robinhoods OpenAI-tokens. OpenAI distantieert zich nadrukkelijk van Robinhoods nieuwe OpenAI-tokens die sinds deze week in Europa worden verkocht. “Dit zijn geen aandelen en we hebben hier niets mee te maken,” waarschuwt het bedrijf op X. Robinhood claimt dat de tokens consumenten toegang geven tot private bedrijven via de blockchain, maar volgens OpenAI is elke overdracht van aandelen zonder hun goedkeuring ongeldig. Het lijkt erop dat Robinhood via een omweg – een zogeheten Special Purpose Vehicle – probeert mee te liften op de hype rond het AI-bedrijf.

Amazon bereikt mijlpaal: 1 miljoen robots in de magazijnen. Na dertien jaar aan inzet van robots heeft Amazon er nu wereldwijd een miljoen rondrijden in zijn magazijnen. De miljoenste robot werd afgeleverd in Japan. Volgens de Wall Street Journal betekent dit dat Amazon binnenkort evenveel robots als mensen in dienst heeft, waarbij robots nu al 75 procent van alle leveringen ondersteunen. Het bedrijf lanceerde ook DeepFleet, een AI-model dat de routes van robots 10 procent efficiënter maakt. De nieuwste robot, Vulcan, kan zelfs ‘voelen’ wat hij vastpakt.


Gesponsord

Hoe je controle houdt over je digitale soevereiniteit

De afhankelijkheid van Amerikaanse technologie zorgt in Europa al langer voor bezorgdheid. Maar de geopolitieke actualiteit – waaronder het isolationistisch beleid van de VS en de impact van de Amerikaanse Cloud Act – maakt het thema cloud sovereignty urgenter. Hoe zorg je dat je zeggenschap houdt over je belangrijkste data?


🔮 Prompt whisperer

Waarom AI de weg kwijtraakt in gesprekken (en hoe je dat voorkomt)

Herken je dit? Je bent halverwege een gesprek met ChatGPT, je hebt net uitgelegd wat je precies nodig hebt, en dan... slaat de AI compleet de plank mis. Het voelt alsof je assistent plotseling geheugenverlies heeft gekregen. Wat je ook probeert, het gesprek is onherstelbaar ontspoord. Goed nieuws: je bent niet gek. Wetenschappers hebben ontdekt dat zelfs de slimste AI-modellen tot 40% slechter presteren wanneer een gesprek meerdere beurten duurt.

Deze week duiken we in fascinerend onderzoek dat laat zien waarom AI’s de weg kwijtraken in langere gesprekken – en belangrijker nog: hoe je dit kunt voorkomen. Of je nu een marketeer bent die content laat genereren, een ontwikkelaar die code laat schrijven, of een ondernemer die strategieën uitwerkt met AI: deze inzichten gaan je workflow boosten.

Keep reading with a 7-day free trial

Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.

Already a paid subscriber? Sign in
© 2025 AI Report
Publisher Privacy ∙ Publisher Terms
Substack
Privacy ∙ Terms ∙ Collection notice
Start writingGet the app
Substack is the home for great culture

Share