AI verslaat dokters? Eerst even een reality check

PLUS: OpenAI daagt Google uit met eigen browser, hoe onze Wietse slimme AI-tools bouwt, en twee krachtige projectmanagementassistenten vergeleken

, and

Nov 26, 2024

∙ Paid

De AI-wereld ontwikkelt zich razendsnel, en wij, de makers van de podcast Poki, houden je op de hoogte. Twee keer per week de nieuwste AI-ontwikkelingen, tools, use cases en onderzoek.

🗞️ Het belangrijkste nieuws

De hype rond AI die dokters verslaat: tijd voor een realitycheck

AI-influencers en zelfbenoemde experts zijn door het dolle heen: kunstmatige intelligentie zou beter zijn in het stellen van een diagnose dan artsen. Een artikel in The New York Times over een ‘baanbrekend onderzoek’ zou het bewijs zijn dat een nieuw tijdperk in de geneeskunde is aangebroken. Elon Musk ging zelfs nog een stapje verder en twitterde doodleuk hierover: ‘AI zal binnenkort artsen en advocaten met grote voorsprong verslaan, en uiteindelijk alle mensen in bijna alles.’

Maar moeten we dit met een korreltje zout nemen? Nou, zeg maar gerust een flinke schep.

De werkelijkheid achter de krantenkoppen

Het verhaal begon met een onderzoek in het gerenommeerde medische tijdschrift JAMA. Daarin stond dat ChatGPT-4 beter presteerde in ‘diagnostisch redeneren’ dan artsen, zelfs wanneer deze artsen ook AI mochten gebruiken voor hulp. Maar er zit een flinke adder onder het gras: het onderzoek was gebaseerd op slechts zes medische cases. Je leest het goed: zes.

‘Een steekproef van zes cases is statistisch gezien niet meer waard dan een gerucht,’ zegt AI- en gezondheidszorgexpert Sergei Polevikov. Hij wijst erop dat de onderzoekers maar liefst 99 van de 105 beschikbare cases buiten beschouwing lieten, zonder daar een goede verklaring voor te geven.

De gaten in het onderzoek

‘Er is een simpele reden voor waarom de wetenschappelijke gemeenschap dit onderzoek – dat vier weken geleden werd gepubliceerd – compleet negeerde, tot The New York Times er een platform aan gaf,’ zegt Polevikov. ‘Het is wetenschappelijk gezien gewoon niet valide.’

Zijn kritiek is niet mals. Naast het lachwekkende steekproefaantal zijn dit de belangrijkste problemen:

De artsen in het onderzoek hadden gemiddeld maar drie jaar ervaring, terwijl de gemiddelde Amerikaanse arts meer dan twintig jaar ervaring heeft.
Ze kregen slechts één uur om zes complexe diagnoses te stellen – in de echte wereld krijgen artsen veel meer tijd.
De artsen hadden geen training gekregen in het gebruik van AI.
De geselecteerde cases waren onnatuurlijk complex en niet representatief voor de dagelijkse praktijk.

Het grotere probleem: wetenschap als clickbait

Dit voorval legt een groter probleem bloot: wetenschap draait steeds meer om aandacht trekken dan om waarheidsvinding. ‘Wetenschappelijke tijdschriften publiceren liever sensationele resultaten dan gedegen onderzoek,’ zegt Polevikov. ‘En de media maken het nog erger door zonder kritische blik de spectaculairste conclusies over te nemen.’

Diagnose of diagnostisch redeneren?

Een ander probleem: er is een wereld van verschil tussen diagnostisch redeneren (het denkproces om tot een diagnose te komen) en het daadwerkelijk stellen van een diagnose. The New York Times gooide deze twee door elkaar, waardoor het leek alsof AI beter was in het stellen van een diagnose. In werkelijkheid ging slechts 11 procent van de score over de uiteindelijke diagnose.

Wat kunnen we hiervan leren?

Hoewel dit onderzoek vol zit met methodologische problemen, laat het wel één ding duidelijk zien: bij de adoptie van AI lopen we tegen een heel ander probleem aan dan veel mensen denken. Het gaat niet om een gebrek aan menselijke capaciteiten, maar om het feit dat veel mensen – inclusief artsen – niet de juiste training en voorbereiding hebben gehad om AI optimaal in te zetten. Daar ligt de werkelijke uitdaging.

Professor Ethan Mollick, auteur van ons boek Co-intelligentie, bevestigt dit. ‘Veel artsen behandelden de AI als een gewone zoekmachine. Ze stelden simpele vragen als: “Is leverziekte een risicofactor voor kanker?” Slechts een handjevol artsen begreep dat je de complete ziektegeschiedenis kon delen met de AI voor een uitgebreide analyse.’

De menselijke factor blijft cruciaal

Dit onderzoek laat vooral zien dat we nog veel te leren hebben over de samenwerking tussen mens en machine. Mollick adviseert om AI te behandelen als ‘een oneindig geduldige nieuwe collega die alles vergeet wat je hebt gezegd zodra het gesprek voorbij is’.

Zijn tip? ‘Gebruik AI eerst op gebieden waarop je zelf een expert bent. Dan kun je snel inschatten waar de AI goed in is en waarin niet. Wees duidelijk in wat je wilt en geef concrete voorbeelden. En vooral: zie het als een dialoog, niet als een opdracht.’

Tot slot

Het is verleidelijk om in de hype mee te gaan als grote kranten spectaculaire koppen schrijven over AI die menselijke capaciteiten overtreft. Maar dit voorval leert ons vooral dat we kritisch moeten blijven en beter moeten leren samenwerken met AI. Want uiteindelijk gaat het niet om mens tégen machine, maar om mens mét machine.

OpenAI daagt Google uit met eigen webbrowser

De concurrentiestrijd tussen OpenAI en Google bereikt een nieuw kookpunt. OpenAI werkt aan een eigen webbrowser die ChatGPT moet integreren met het wereldwijde web. Ondertussen spelen de techreuzen een merkwaardig kat-en-muisspel met hun AI-modellen.

De browser die alles moet veranderen

OpenAI heeft grootse plannen. Het bedrijf wil een nieuwe webbrowser lanceren die ChatGPT naadloos integreert in partnersites. Een directe aanval op het marktaandeel van Google Chrome.

En OpenAI meent het serieus. Ze wisten zelfs Ben Goodger, een van de oorspronkelijke ontwikkelaars van Chrome, voor het project te strikken. Daarnaast sluit het bedrijf partnerships met grote uitgevers en platforms om de toegang tot content veilig te stellen.

Ook interessant: het bedrijf ontwikkelt een zoekproduct met de naam NLWeb. Hiermee kunnen gebruikers op een natuurlijke manier ‘praten’ met websites van partners als Condé Nast en Redfin. Er lopen zelfs gesprekken met Samsung om OpenAI’s technologie in hun telefoons te integreren – een directe bedreiging voor Googles huidige AI-samenwerking met de telefoonmaker.

Deze ontwikkelingen komen kort na de lancering van ChatGPT Search, waarmee OpenAI al een eerste grote stap zette in de richting van Googles zoekmarkt.

Modellenoorlog bereikt kookpunt

Maar er speelt nog iets anders: een verhitte strijd om de beste AI-modellen. De drie grote spelers – OpenAI, Google en Anthropic – lijken in een soort schaakspel verwikkeld waarbij ze elkaars releases proberen te overtroeven.

Het wordt er allemaal wat verwarrend van. Waar nieuwe AI-modellen vroeger keurig een versienummer kregen, komen ze nu in rap tempo uit onder een datumcode. Sommige experts vermoeden zelfs strategisch gedrag.

‘Het lijkt wel alsof Google 4D-schaak speelt,’ luidt de grap op X. ‘Ze komen met een middelmatig model (Gemini Exp 1114), wetend dat OpenAI dat wil overtreffen. Als OpenAI dan haastig zijn nieuwe GPT-4o uitbrengt, komt Google met zijn écht goede model (Gemini Exp 1121).’

Wat betekent dit?

OpenAI’s browserplannen laten zien dat het bedrijf niet alleen naar AI kijkt, maar naar de hele digitale infrastructuur. Door ChatGPT te integreren in het browsen zelf, zou het bedrijf een nieuwe poort naar het internet kunnen creëren.

Tegelijkertijd toont de modellenrace hoe verhit de concurrentie is geworden. De grote AI-bedrijven lijken bereid ver te gaan om als ‘beste’ gezien te worden, zelfs als dat betekent dat ze de gebruikelijke conventies van softwareontwikkeling op de schop moeten nemen.

Voor gebruikers betekent dit spannende tijden: meer keuze in hoe we het internet gebruiken en steeds krachtiger AI-modellen. Maar het roept ook vragen op over transparantie en de gezondheid van de AI-sector. Want is snelheid belangrijker dan duidelijkheid?

🛠️ AI Toolkit+

Een kijkje in de AI-keuken van onze nieuwsbrief

Hoe onze Wietse slimme videopresentaties laat maken door AI

Deze week neemt onze Wietse je mee achter de schermen van AI Report. Want hoe houden we je twee keer per week op de hoogte van alle belangrijke AI-ontwikkelingen? Het antwoord: door zelf slimme AI-tools te bouwen die ons helpen de enorme informatiestroom behapbaar te maken.

Het ‘last mile’-probleem van AI

We kennen het allemaal: AI belooft wonderbaarlijke dingen, maar in de praktijk zit je nog steeds te knippen en te plakken tussen verschillende tools. ‘Je typt iets in in Claude, dan moet je dat weer kopiëren en plakken in een andere tool,’ beschrijft onze

Alexander Klöpping

de dagelijkse frustratie. ‘Zo zit je toch echt wel te klooien de hele tijd, omdat je nog steeds verschillende tools moet gebruiken die verschillende dingen kunnen doen, en niks gaat vanzelf.’

Dit is wat experts het ‘last mile problem’ noemen, een term geleend uit de logistiek. Net zoals een pakketje uit China probleemloos de oceaan over komt maar vervolgens twee dagen vastligt in het lokale depot, zijn AI-tools vaak indrukwekkend maar niet praktisch bruikbaar.

Van vijf uur video naar drie minuten presentatie

‘Onze nieuwsbrief zit barstensvol informatie,’ vertelt Wietse. ‘Het is niet te doen om die twee keer per week te versturen én al het nieuws eerst te lezen en bij elkaar te zoeken. Dus daar maak ik tooltjes voor, voor onze redactie.’

Een van zijn recente creaties: een Telegram-bot die lange video’s niet alleen samenvat, maar er complete videopresentaties van maakt. ‘Stuur een YouTube-link, en je krijgt een mp4 terug waarin je iemand hoort praten terwijl er automatisch door slides wordt gebladerd,’ legt hij uit.

De tool doorloopt negen zorgvuldige stappen, waarbij een statusbalk de voortgang toont – iets wat Wietse miste bij vergelijkbare tools als Googles NotebookLM. Het eindresultaat is een beknopte videopresentatie met heldere slides, bulletpoints en een gesproken toelichting.

‘We hadden laatst dat vijf uur durende Anthropic-interview bij Lex Fridman,’ legt Wietse uit. ‘Niemand gaat dat helemaal checken. Maar nu hoeft dat ook niet meer.’

Nu was dat interview zó fascinerend dat we er toch voor gingen zitten, maar het mooie is: nu weten we waar we aan beginnen. ‘Deze tool verandert ons hele cureerproces,’ voegt onze Xiang toe. ‘Vaak weet je bij een marathonpodcast niet of het de tijdsinvestering waard is. Deze tool biedt uitkomst.’

Hoe bouw je zoiets?

Het bijzondere aan Wietses aanpak: hij schrijft zelf geen letter code meer. In plaats daarvan gebruikt hij Aider, een programmeertool die verschillende AI-modellen laat samenwerken. Wietse koos voor:

OpenAI’s o1 als ‘architect’ die het grote plan bedenkt;
Claude 3.5 Sonnet als ‘engineer’ die het daadwerkelijke werk doet.

‘Na twintig minuten itereren had ik al iets,’ vertelt Wietse. De eerste versie was er al na drie minuten – de tijd die de AI nodig had om de bestandsstructuur en submodules aan te maken. ‘Ik ben eigenlijk een soort stukadoor met een stukadoor-robot,’ legt hij uit. ‘Die is aan het stuken, en op een gegeven moment zeg ik “pauze”, loop ik er even naartoe, zet ik wat dingen recht – want ik ben stiekem zelf ook een stukadoor – en dan zet ik hem weer aan.’

Dit proces werkt als een fabriek met verschillende stappen. ‘Je hebt grondstoffen die binnenkomen aan de ene kant, en er komen halffabricaten uit aan de andere kant,’ verduidelijkt Wietse. Net als bij het maken van een Mars-reep: van suikerbieten tot eindproduct, met allerlei tussenstappen.

Kan iedereen dit?

Deze nieuwe manier van werken biedt enorme mogelijkheden, maar vereist wel verschillende niveaus van expertise. ‘Dit is een mooi window of opportunity voor mensen die wel kunnen programmeren,’ zegt Wietse. ‘Als een soort superman kunnen meekijken. Als je helemaal niet kunt programmeren, dan moet je nog een hoop leren. Want ik zie gewoon de foutjes die gemaakt worden.’

Voor beginners zijn er toegankelijkere alternatieven, zoals Replit Agent of Cursor. Die bieden meer ondersteuning, maar minder controle. Aider is perfect als je al kunt programmeren, omdat je de AI dan makkelijker kunt bijsturen.

Onverwachte mogelijkheden

Om te laten zien hoe veelzijdig deze aanpak is, experimenteerde Wietse ook met het schrijven van een boek op dezelfde manier. Door zijn programmeertools te ‘misleiden’ (‘Doe maar even alsof dit een programmeerproject is’), liet hij de AI een kort sciencefictionverhaal uitbreiden tot een volledige roman. ‘In twaalf minuten had ik een compleet boek. Van matige kwaliteit, maar het laat wel zien wat er mogelijk is.’

Benieuwd naar het volledige verhaal? Luister dan hier naar de nieuwste aflevering van Poki, waarin Wietse nog veel meer vertelt over hoe je praktische AI-tools bouwt.

Ontgrendel de kracht van AI in je werk en je leven:

Upgrade naar ons betaalde abonnement en ontvang 2x per week game-changing AI-tools en tips.

Vandaag:

Ontdek hoe AI je projectplanningen automatisch optimaliseert (en risico’s voorspelt).
Transformeer eindeloze statusupdates in realtime inzichten.
Laat een AI-assistent je routinetaken overnemen, zodat jij kunt focussen op strategie.
Zo bereid je je organisatie voor op de AI-revolutie in projectmanagement.

🛠️ AI Toolkit+

Grip op je projecten: twee slimme AI-tools die je werk verlichten

Het leven van een projectmanager lijkt soms wel een circus: met deadlines jongleren, budgetten bewaken en mensen motiveren – allemaal tegelijk. En dat terwijl de tijd doorloopt en de kosten oplopen.

Wereldwijd gaat er jaarlijks ongeveer 48 biljoen dollar om in projecten, maar slechts 35 procent daarvan wordt als geslaagd beschouwd. Een van de hoofdoorzaken volgens Harvard Business Review? De verouderde programma’s waarmee we projecten aansturen. Veel organisaties werken nog steeds met spreadsheets en presentaties die de afgelopen decennia nauwelijks zijn vernieuwd.

Maar er gloort hoop. Volgens onderzoeksbureau Gartner zal tegen 2030 zo’n 80 procent van het projectmanagement worden ondersteund door kunstmatige intelligentie. Waar traditioneel projectmanagement vaak voelt als het oplossen van een ingewikkelde puzzel met ontbrekende stukjes, biedt AI een helpende hand. Niet alleen bij plannen en organiseren, maar juist bij de kern: het mogelijk maken van een goede samenwerking.

Deze week bekijken we twee tools die vooroplopen in deze vernieuwing. Of je nu een start-up runt of een bedrijfsteam leidt: met de juiste ondersteuning wordt projectmanagement weer overzichtelijk.

Keep reading with a 7-day free trial

Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.