‘Hé, je moet je moeder nog bellen’ – ChatGPT
PLUS: bedenker van beruchte AI-test start eigen lab, en zo maak je van ChatGPT je persoonlijke assistent die het initiatief neemt
De AI-wereld ontwikkelt zich razendsnel, en wij, de makers van de podcast Poki, houden je op de hoogte. Twee keer per week de nieuwste AI-ontwikkelingen, tools, use cases en onderzoek.
🗞️ Het belangrijkste nieuws
ChatGPT wordt persoonlijk (en zeurt dat je meer water moet drinken)
Vergeet jij ook weleens genoeg water te drinken op een dag wanneer je diep verzonken zit in je werk? Niet schrikken als je straks een pingetje krijgt van ChatGPT om je eraan te herinneren genoeg te blijven drinken. Tot nu toe was ChatGPT vooral een spraakzame gesprekspartner die braaf wachtte tot jij het woord nam. Maar dat verandert: OpenAI heeft zojuist ‘Tasks’ gelanceerd, waarmee ChatGPT voor het eerst zelf het initiatief kan nemen.
Wat is er aan de hand?
OpenAI rolt momenteel een bètaversie uit van ‘Tasks’ – een nieuwe functie waarmee ChatGPT op gezette tijden taken voor je kan uitvoeren. Denk aan een dagelijkse herinnering om water te drinken, een wekelijks nieuwsoverzicht of een gepersonaliseerd trainingsschema. De functie komt beschikbaar voor Plus-, Team- en Pro-abonnees, met een maximum van tien actieve taken per gebruiker.
Onze Xiang merkte bij het testen een subtiel maar belangrijk verschil: ‘Tot nu toe waren chatbots puur reactief – jij neemt het initiatief om ermee te praten. Maar nu kreeg ik ineens een seintje op mijn telefoon dat ik moest drinken tijdens het schrijven van deze nieuwsbrief. Thanks, ChatGPT!’
Een teen in het water
Op het eerste gezicht lijkt Tasks misschien niet meer dan een slimme herinneringsapp. Maar volgens professor en auteur van ons boek Co-intelligentie Ethan Mollick is er meer aan de hand: ‘Dit voelt als een functie die is gebouwd voor de toekomst, niet voor het heden. Een ChatGPT die je elke ochtend de beurskoersen doorstuurt, is een voorproefje van een AI die straks je hele portfolio beheert en je adviseert op basis van wat het vindt. Een herinnering voor je moeders verjaardag? Dat wordt straks een AI die alvast geschikte cadeaus voorstelt.’
En dat is precies waar OpenAI naartoe werkt. Volgens Bloomberg staat er nog dit voorjaar een grotere stap op de planning: ‘Operator’, een autonome AI-agent die zelfstandig computers kan bedienen. Daarnaast ontdekte reverse engineer Tibor Blaho iets met de codenaam ‘Caterpillar’ – een systeem dat een uitbreiding op Tasks zou kunnen zijn, met het vermogen om zelf informatie te zoeken, problemen te analyseren en langs websites te navigeren.
De kunst van geduld hebben
Deze voorzichtige aanpak – eerst een teen in het water voordat we allemaal in het diepe springen – past in OpenAI’s bredere strategie van iterative deployment. Sam Altman, OpenAI’s topman, beschreef deze aanpak zeven jaar geleden al tijdens een Stanford-lezing:
‘Als je elke vier uur 2 procent beter wordt in plaats van elke vier weken, en je laat dat effect opstapelen over een paar jaar, dan kom je op een heel andere plek uit,’ legde hij uit. ‘Maak het tot een van je belangrijkste doelen om het snelst itererende bedrijf ter wereld te worden.’
Vorig jaar, in gesprek met Lex Fridman, benadrukte Altman waarom deze strategie vooral bij AI zo belangrijk is: ‘AI en verrassingen gaan niet samen. De wereld, mensen en instituten hebben tijd nodig om zich aan te passen en na te denken over deze ontwikkelingen. Dat is waarom we niet in het geheim bouwen aan GPT-5, maar openlijk praten over elke stap van GPT-1 tot en met GPT-4.’
Even dimmen
Hoewel de mogelijkheden veelbelovend klinken, zijn er ook kanttekeningen. Kyle Wiggers van The Verge waarschuwt: ‘De laatste keer dat ik een demonstratie van een OpenAI-agent zag, produceerde hij onjuiste informatie. De komende maanden moeten uitwijzen of het team deze fundamentele betrouwbaarheidsproblemen heeft opgelost.’
Dit verklaart mogelijk waarom OpenAI klein begint. Tasks draait nog steeds op GPT-4o, wat betekent dat je beter geen cruciale taken kunt toevertrouwen aan de AI. Een nieuwtje missen is één ding, maar je wilt niet dat een AI-hallucinatie je belangrijke afspraken in de war schopt.
Wat betekent dit voor de toekomst?
Tasks markeert een subtiele maar betekenisvolle verschuiving in de ontwikkeling van AI-assistenten. We gaan van AI die netjes wacht tot je wat vraagt naar AI die zelf het initiatief neemt – zij het nog met voorzichtige stapjes.
Op de korte termijn zullen we Tasks vooral gebruiken als een slimmere versie van Siri-achtige herinneringen. Maar het echte omslagpunt komt wanneer AI-assistenten kunnen integreren met andere tools, direct toegang hebben tot je agenda en zelfstandig beslissingen kunnen nemen.
De interesse is er al: kort na de lancering meldde OpenAI serverproblemen door de grote belangstelling. Het lijkt erop dat veel mensen zitten te wachten op AI die niet alleen meedenkt maar ook meedoet.
Voor trouwe AI Report-lezers zijn zelfstandige AI-agents misschien geen verrassing meer, maar voor het grote publiek zou dit net zo’n moment kunnen worden als de eerste kennismaking met ChatGPT. OpenAI’s voorzichtige aanpak met Tasks is dan ook slim: eerst het publiek laten wennen aan het idee van proactieve AI, voordat de grote sprong voorwaarts komt. Want zoals Altman al zei: AI en verrassingen gaan niet samen.
Bedenker beruchte AI-test begint eigen lab
Als François Chollet iets zegt over AI, spitsen mensen in Silicon Valley de oren. Niet zo gek: hij is de bedenker van de ARC-test, een soort intelligentietest voor AI die door velen wordt gezien als de ultieme meetlat voor AGI (AI zo slim als een mens). Nu neemt hij ontslag bij Google om samen met Zapier-medeoprichter Mike Knoop een eigen AI-laboratorium te beginnen: Ndea.
Een andere aanpak
‘We gokken op een andere route om AI te bouwen die écht kan uitvinden, aanpassen en innoveren,’ schrijft Chollet op X. Volgens hem heeft Ndea ‘een kleine maar reële kans op een doorbraak: het creëren van AI die minstens zo efficiënt kan leren als mensen, en die zich blijft verbeteren zonder tegen grenzen aan te lopen’.
Het geheime ingrediënt? Programmasynthese, een techniek die AI in staat stelt om met slechts een paar voorbeelden nieuwe problemen op te lossen. Denk aan een kind dat na het zien van drie of vier honden het concept ‘hond’ begrijpt, in plaats van dat het duizenden foto’s nodig heeft, zoals huidige AI-systemen.
Hoe werkt het?
Programmasynthese verschilt fundamenteel van de huidige AI-aanpak. De meeste AI-systemen werken met deep learning: ze worden getraind door enorme hoeveelheden data te analyseren en daar patronen in te herkennen. Denk aan een student die duizenden examens bestudeert om de antwoordpatronen te leren.
Programmasynthese werkt anders: in plaats van eindeloos data te verzamelen, probeer je exacte regels of ‘programma’s’ te vinden die verklaren wat je ziet. Het is als een student die in plaats van alle mogelijke antwoorden uit zijn hoofd te leren, de onderliggende principes begrijpt en daardoor ook nieuwe, onbekende vragen kan beantwoorden.
Het probleem? Dit kost normaal gesproken gigantisch veel rekenkracht. Ndea denkt dit op te kunnen lossen door deep learning te gebruiken om de zoektocht naar deze programma’s te sturen – een beetje zoals een ervaren docent die een student helpt de juiste denkrichting te vinden.
Niet alleen Ndea ziet het potentieel
Interessant genoeg is Ndea niet de enige die het belang van programmasynthese inziet. Chollet wijst naar het recente succes van OpenAI’s nieuwste model o3: ‘Om je aan nieuwe situaties aan te passen heb je twee dingen nodig,’ legt hij uit. ‘Ten eerste kennis – een set van herbruikbare functies waar je uit kunt putten. Dat hebben de huidige taalmodellen meer dan genoeg. Ten tweede moet je die functies kunnen combineren tot een nieuw programma als je een nieuwe taak tegenkomt. Dat is programmasynthese. Daar hadden taalmodellen lang moeite mee, maar de nieuwste modellen van OpenAI lossen dat op.’
‘Het is een techniek die elk groot AI-lab nu begint te verkennen,’ schrijft Ndea op zijn website. Het verschil? Waar de meeste labs het zien als een klein puzzelstukje in de zoektocht naar intelligentere AI, gelooft Ndea dat programmasynthese net zo belangrijk wordt als patroonherkenning.
Wat kunnen we verwachten?
Als je de puzzel van menselijke intelligentie wilt nabootsen, heb je verschillende stukjes nodig. Patroonherkenning – waar huidige AI heel goed in is – is er daar een van. Maar er mist nog iets: het vermogen om met minimale voorbeelden nieuwe kennis op te bouwen en toe te passen.
Programmasynthese zou dat missende puzzelstukje kunnen zijn. Naveen Rao, een bekende stem in de AI-wereld, kan zich niet kan inhouden van enthousiasme: ‘Het gebeurt niet elke dag dat mensen van het kaliber van Chollet en Knoop besluiten een bedrijf te beginnen! Ons vakgebied wordt gedomineerd door hype en hoop – iedereen zoekt naar dat ene simpele trucje dat alles oplost. Maar intelligentie is nog steeds een HEEL moeilijk probleem. Deze mensen gaan op zoek naar fundamentele innovaties.’
Of Ndea die innovaties kan leveren? Het trackrecord van de oprichters is in elk geval indrukwekkend. Chollet creëerde Keras, een opensourcesoftwarebibliotheek die het bouwen van AI-systemen een stuk toegankelijker maakte – een soort lego voor AI-ontwikkelaars. Niet voor niets gebruiken bedrijven als YouTube, Waymo en Spotify het dagelijks. Knoop bouwde op zijn beurt Zapier uit tot een vooraanstaand automatiseringsbedrijf. Met zo’n team is Ndea zeker een speler om in de gaten te houden.
🔮 Prompt whisperer
Maak van ChatGPT je persoonlijke assistent (die nooit slaapt)
Zojuist las je over ChatGPT Tasks, een functie die je chatbot transformeert in een 24/7 productiviteitsmachine. Maar hoe zet je deze nieuwe mogelijkheid optimaal in voor jouw werk en leven? We hebben de functie uitgebreid getest en het internet afgespeurd naar de inventiefste toepassingen. Van simpele herinneringen tot complexe automatiseringen met Canvas: hier zijn de slimste manieren om Tasks in te zetten.
Keep reading with a 7-day free trial
Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.