Onze favoriete AI Claude krijgt een denkboost

PLUS: AI versnelt wetenschappelijke ontdekkingen dramatisch, en tools die taalbarrières in videogesprekken en gebarentaal doorbreken

, and

Feb 25, 2025

∙ Paid

De AI-wereld ontwikkelt zich razendsnel, en AI Report houdt je op de hoogte. Twee keer per week de nieuwste ontwikkelingen, tools en inzichten via onze nieuwsbrief en podcast.

🗞️ Het belangrijkste nieuws

Publiekslieveling Claude krijgt denkboost met 3.7 Sonnet

Na superlang wachten is het eindelijk zover! Voor trouwe lezers is het geen verrassing dat we hier dolenthousiast over zijn. Als je zou vragen welke AI we zouden meenemen naar een onbewoond eiland, dan zouden Alexander, Wietse en Xiang allemaal zonder aarzelen ‘Claude!’ roepen. Nu komt Anthropic eindelijk, na heel lang wachten, met een nieuw model. Maar het is niet Claude 4 Opus, zoals velen verwachtten – het is Claude 3.7 Sonnet, het eerste model dat naar wens kort of lang kan ‘nadenken’ over complexe vragen.

Wat is er aan de hand?

Anthropic introduceert het eerste hybride redeneermodel ter wereld. Claude 3.7 Sonnet kan zowel direct antwoord geven als uitgebreid nadenken over een lastig vraagstuk, afhankelijk van wat jij kiest. Je ziet zelfs het denkproces van Claude op een ‘zichtbaar kladblok’ – een blik in het hoofd van een AI. De upgrade is vanaf vandaag beschikbaar voor alle gebruikers, maar alleen betalende abonnees krijgen toegang tot de nieuwe redeneerfuncties.

Een andere kijk op AI-denken

Anders dan concurrenten die aparte modellen uitbrengen voor standaard- en redeneergebruik, kiest Anthropic voor één geïntegreerd model. ‘Net zoals mensen niet twee verschillende hersenen hebben voor vragen die direct beantwoord kunnen worden versus vragen die nadenken vereisen,’ legt het bedrijf uit in een blogpost.

Deze aanpak maakt het praktischer voor gebruikers. Je hoeft niet meer te kiezen tussen verschillende AI-modellen – Claude past zich gewoon aan jouw behoeften aan. Via de API kun je zelfs precies bepalen hoeveel ‘denktijd’ Claude mag gebruiken, wat meer controle geeft over snelheid, kosten en kwaliteit.

Vooral beter in code

De eerste tests wijzen op een flinke voorsprong in codeervaardigheden. Op SWE-bench, een test voor praktische softwareproblemen, scoort Claude 3.7 Sonnet 62,3 procent tegenover OpenAI’s o3-mini met 49,3 procent. Verschillende techbedrijven bevestigen dit: Cursor, Cognition, Vercel, Replit en Canva rapporteren allemaal dat Claude met kop en schouders boven de rest uitsteekt.

Samen met deze update introduceert Anthropic ook Claude Code: een interessante stap in de wereld van AI-tools. Dit command line-gereedschap laat ontwikkelaars complexe taken rechtstreeks vanuit hun terminal aan Claude delegeren. Programmeurs kunnen in gewoon Nederlands commando’s geven als ‘Leg deze projectstructuur uit’ of ‘Pas deze code aan’, waarna Claude zelf de wijzigingen doorvoert, tests uitvoert en zelfs code naar GitHub kan pushen.

Wat zeggen de experts?

Ethan Mollick, professor en auteur van ons boek Co-intelligentie, beschouwt Claude 3.7 als onderdeel van een nieuwe generatie AI. ‘Deze modellen geven me hetzelfde gevoel als toen ik GPT-4 voor het eerst gebruikte – een mix van onder de indruk en lichte ongerustheid over wat het kan,’ schrijft hij.

Mollick wijst op twee ‘schalingswetten’ die deze sprong mogelijk maken. Ten eerste worden modellen slimmer naarmate ze groter worden: ‘Deze nieuwe generatie is getraind met meer dan tien keer de rekenkracht van GPT-4.’ Ten tweede worden ze beter door meer denktijd: ‘Je kunt AI beter laten presteren door het simpelweg meer tijd te geven om een probleem uit te werken.’ Claude 3.7 combineert beide voordelen.

Om dit te demonstreren vroeg Mollick Claude om ‘een interactieve tijdmachine-visual te maken, waarmee ik terug in de tijd kan reizen naar ongewone periodes’. Met slechts twee prompts creëerde Claude een volledig werkende interactieve ervaring. ‘Het indrukwekkende is dat de AI deze tekeningen moet maken met pure code, zonder te kunnen zien wat het creëert – als een kunstenaar die geblinddoekt schildert maar toch het juiste beeld maakt,’ merkt Mollick op.

Volgens hem staan we aan het begin van een nieuwe AI-golf. ‘De computerkracht blijft groeien, de capaciteiten blijven verbeteren, en deze cyclus versnelt met elke generatie. Zolang deze wetten blijven gelden, zullen AI’s steeds beter worden.’

Kanttekeningen

Natuurlijk is Claude 3.7 niet perfect. Het maakt nog steeds fouten, en bij sommige toepassingen, zoals schrijven, zijn de verbeteringen misschien minder indrukwekkend. Ook staat de concurrentie niet stil: OpenAI-topman Sam Altman heeft eerder aangekondigd dat zijn eigen hybride model ‘binnen enkele maanden’ verschijnt.

De eerste reacties: waanzinnig goed in code en creativiteit

De eerste testers zijn lyrisch, vooral over de codeermogelijkheden. Rowan Cheung noemt het ‘het beste AI-codeermodel op de planeet’ en demonstreerde hoe het een speelbare Minecraft-kloon maakte met één prompt. Mckay Wrigley is al even enthousiast: ‘Claude 3.7 Sonnet is het beste model ter wereld voor code. Het is als een wereldklasse ontwikkelaar met een uitzonderlijke smaak.’ Pietro Schirano valt hen bij: ‘Er gebeurt iets magisch wanneer je het niet meer als tool ziet, maar als medewerker. Coderen en ideeën uitwerken voelen als teamwerk.’

Het strawberry-raadsel: een schattig easter egg

Onze Xiang stuitte op iets onverwachts. Ze testte de redeneerfunctie met de bekende ‘strawberry-vraag’ (taalmodellen hebben van oudsher moeite met het correct tellen van letters in woorden). Tot haar verrassing reageerde Claude met: ‘Let me check!’, waarna het een interactieve artifact maakte die de drie r’s in ‘strawberry’ op een leuke manier telde. Het bleek een easter egg te zijn, verstopt in de systeeminstructies van het model!

Wat betekent dit voor jou?

Als je regelmatig aan complexe codeerprojecten werkt, kun je met Claude 3.7 én Claude Code een serieuze productiviteitsboost verwachten. De verbeterde GitHub-integratie laat je rechtstreeks vanuit Claude met je codeprojecten werken.

Maar zelfs voor niet-programmeurs heeft dit model waarde. Complexe vragen over data-analyse, onderzoek of planning krijgen nu grondigere, beter onderbouwde antwoorden. En misschien wel het belangrijkste: door het zichtbare denkproces begrijp je beter hoe de AI tot zijn conclusies komt.

De publiekslieveling onder de AI-assistenten is er dus nog slimmer op geworden. Aan jou om te ontdekken wat je ermee kunt bereiken.

AI versnelt onderzoek van jaren naar dagen

Deze week lijkt het startschot te zijn gegeven voor een nieuw tijdperk in de wetenschap. Zowel Google als Microsoft lanceerde een AI-systeem dat wetenschappelijk onderzoek dramatisch versnelt – van jarenlange studies naar resultaten in enkele dagen. Een ontwikkeling die de grenzen van wat mogelijk leek volledig verlegt.

Wat is er aan de hand?

Google heeft AI co-scientist gelanceerd – een samenwerking van gespecialiseerde AI-agents die wetenschappers ondersteunen bij het genereren en valideren van nieuwe hypotheses. Microsoft komt met BioEmu-1, een systeem dat razendsnel eiwitstructuren kan voorspellen. Beide systemen comprimeren werk dat voorheen maanden of jaren kostte tot enkele dagen of zelfs minuten.

De eerste testresultaten zijn verbluffend. Googles systeem identificeerde binnen 48 uur hoe bacteriën resistentiegenen verspreiden – een ontdekking die onderzoekers van Imperial College tien jaar kostte. Microsofts BioEmu-1 genereert voorspellingen van eiwitbewegingen 100.000 keer sneller dan traditionele simulaties, terwijl de nauwkeurigheid vergelijkbaar blijft.

AI als wetenschappelijke versneller

Googles co-scientist werkt met zes verschillende AI-agents, die elk een specifieke wetenschappelijke taak uitvoeren: van het bedenken van hypotheses tot het valideren van onderzoeksvoorstellen. In proeven bij Stanford en Imperial College hielp het systeem bij het identificeren van nieuwe toepassingen voor medicijnen en het voorspellen van genoverdrachten, met een nauwkeurigheid van meer dan 80 procent op expertniveau.

Microsofts BioEmu-1 richt zich specifiek op eiwitstructuren – een cruciaal element in medicijnontwikkeling. Het systeem werd getraind op 200 milliseconden moleculaire simulatiedata, 9 biljoen DNA-bouwstenen en 750.000 stabiliteitsmeetpunten. Het resultaat is een model dat in een paar minuten werk verzet waarvoor eerder maanden aan supercomputertijd nodig waren.

Een doorbraak die past in een patroon

Deze ontwikkelingen staan niet op zichzelf. Eerder maakte OpenAI-topman Sam Altman al gewag van komende AI-modellen die ‘nieuwe wetenschappelijke kennis’ zouden ontdekken. Ook is er AlphaFold, het DeepMind-project dat de wereld van eiwitvouwstructuren op zijn kop zette.

In een recente minidocumentaire van YouTube-kanaal Veritasium wordt de impact van AI op eiwitonderzoek fraai in beeld gebracht. Onze Wietse tipt deze video: ‘Als je door de clickbaittitel heen kijkt, is het een gedegen documentaire over AI in de wetenschap. Het laat zien hoe voorspelmachines – waar ChatGPT een woordenvoorspeller is, gaat het hier om eiwitvoorspelling – echte doorbraken mogelijk maken.’

De video illustreert hoe tussen 1987 en 2016 nauwelijks voortgang werd geboekt in eiwitonderzoek, waarna de progressie plotseling ‘explodeerde’ dankzij AI. Wietse: ‘Deze technologie is veel breder inzetbaar dan enkel sinterklaasgedichtjes schrijven of andere toepassingen die we dagelijks zien.’

Het begin van een nieuwe tijdlijn

Wat deze ontwikkelingen bijzonder maakt, is dat ze niet alleen bestaand werk versnellen, maar mogelijk ook tot volledig nieuwe ontdekkingen leiden. Het feit dat Googles systeem onafhankelijk tot dezelfde conclusie kwam als onderzoekers, zonder toegang tot hun niet-gepubliceerde bevindingen, is veelzeggend.

Beide bedrijven stellen hun technologie beschikbaar aan wetenschappers wereldwijd – Google via een trusted tester program en Microsoft via Azure AI Foundry Labs.

Wat betekent dit voor de toekomst?

Deze systemen tonen aan dat AI niet per se wetenschappers vervangt, maar hun werk dramatisch kan versnellen en versterken. Onderzoekscycli die voorheen jaren duurden, kunnen nu in weken of dagen worden afgerond.

Zoals Wietse opmerkt: ‘Tussen alle doom en gloom over AI is dit een lichtpuntje. Het is moeilijk om tegen toepassingen te zijn die medicijnen helpen ontwikkelen en mensen beter maken.’

De combinatie van snelheid, nauwkeurigheid en een brede beschikbaarheid van deze systemen markeert waarschijnlijk een nieuw hoofdstuk in wetenschappelijk onderzoek. Waar we nu staan, is mogelijk slechts het begin van een tijdperk waarin AI een integraal onderdeel wordt van de wetenschappelijke gereedschapskist.

⚡ AI Pulse

‘Maximaal naar waarheid zoekend’ Grok censureert kritiek op baas Musk. Het paradepaardje van xAI, het Grok 3-model, kwam in opspraak nadat gebruikers hadden ontdekt dat het weigerde negatieve informatie over Elon Musk en Donald Trump te delen – ondanks Musks eindeloze gepraat over hoe ongevoelig voor censuur zijn AI zou zijn. XAI’s hoofd Engineering Igor Babuschkin haastte zich om een voormalig OpenAI-medewerker de schuld te geven, die ‘zonder goedkeuring’ de systeemprompt zou hebben aangepast. De ironie van een zelfverklaard ‘maximaal naar waarheid zoekend’ AI-model dat plotseling allergisch wordt voor de waarheid over zijn eigenaar ontging niemand.

Huishoudrobots leren zelf je boodschappen opruimen. Robotica-start-up Figure introduceerde Helix, een nieuw AI-model dat robots in staat stelt spraak te begrijpen en voorwerpen te hanteren die ze nog nooit hebben gezien – een belangrijke stap richting huishoudrobots die daadwerkelijk nuttig zijn. Figure demonstreerde twee robots die samen boodschappen opruimden met behulp van gesproken commando’s.

Ondertussen stelt 1X Technologies zijn NEO Gamma voor aan de wereld. Deze robot loopt met een verbazingwekkend natuurlijke tred, gaat zitten op een stoel alsof het een huisgenoot is en reageert op alledaagse gesprekken dankzij een eigen taalmodel. Het ontwerp komt met zachte bekleding voor de veiligheid en – in een unieke designtwist – expressieve oorringen.

🛠️ AI Toolkit+

Taalbarrières slopen, één gesprek tegelijk

Deze week duiken we in vertaaltools die een wereld zonder taalbarrières dichterbij brengen. Want de grote vraag bij technologie is vaak: brengt ze ons dichter bij elkaar of creëert ze juist meer afstand?

Er bestaan zorgen dat door AI mensen nog meer in hun eigen bubbel gaan leven. Van tieners die liever met hun favoriete AI-animekarakter praten tot mensen die hele relaties met ChatGPT beginnen. Maar net als iedere breed inzetbare technologie, gaat het er vooral om hoe je het gebruikt.

En er is één ding waar onze moderne taalmodellen bijzonder in uitblinken: het doorbreken van taalbarrières tussen mensen. De mogelijkheden gaan verder dan alleen tekst vertalen. Denk aan realtime vertaling tijdens een videogesprek of het leren van gebarentaal met directe AI-feedback – tools die niet alleen tijd besparen, maar ook nieuwe deuren openen voor bedrijven met internationale ambities.

Vandaag kijken we naar deze AI-vertaaltools en naar hoe ze ons kunnen helpen de wereld om ons heen en – vooral – onze medemens beter te begrijpen, zowel privé als professioneel.

Keep reading with a 7-day free trial

Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.