’s Werelds eerste AI-webbrowser regelt alles voor je

PLUS: Musks Grok 4 is benchmarktopper met karaktercrisis, Google kaapt voor miljarden AI-toptalent weg, en waarom kinderen massaal met chatbots praten

, and

Jul 15, 2025

∙ Paid

De AI-wereld ontwikkelt zich razendsnel, en AI Report houdt je op de hoogte. Twee keer per week de nieuwste ontwikkelingen, tools en inzichten via onze nieuwsbrief en podcast.

🗞️ Het belangrijkste nieuws

Grok 4: Musks slimste AI kan álles, behalve normaal doen

Beeld je eens in: een AI die slimmer is dan bijna alle universiteitsstudenten ter wereld, maar die tegelijkertijd zo eigenwijs is dat je er niet mee durft te werken. Welkom bij Grok 4, het nieuwste model van Elon Musks xAI dat op papier alle concurrenten verslaat, maar in de praktijk vooral opvalt door zijn... bijzondere persoonlijkheid. Voor 300 dollar per maand krijg je toegang tot wat mogelijk de knapste AI ter wereld is, mits je het niet erg vindt dat hij soms uit het niets de meningen van zijn baas begint te verkondigen.

Wat is er aan de hand?

xAI, het AI-bedrijf van Elon Musk, heeft Grok 4 gelanceerd – een taalmodel dat op vrijwel alle benchmarks de concurrentie achter zich laat. Het model presteert beter dan OpenAI’s beste modellen, Googles Gemini en Anthropics Claude op tests voor wiskunde, wetenschap en programmeren. Musk gaat zelfs zo ver te beweren dat Grok 4 “slimmer is dan bijna alle afgestudeerden in alle disciplines tegelijkertijd” – al voegt hij er snel aan toe dat dit vooral geldt voor academische vragen.

Het bijzondere aan Grok 4 is de manier waarop het tot stand is gekomen. Waar andere bedrijven vooral focussen op het groter maken van hun modellen, heeft xAI een andere route gekozen: het heeft namelijk de hoeveelheid rekenkracht voor het ‘leerproces’ (reinforcement learning) met een factor tien verhoogd.

Hoe werkt het precies?

Grok 4 komt in twee smaken. De standaardversie werkt zoals je van moderne AI gewend bent: je stelt een vraag en krijgt een antwoord. Maar er is ook Grok 4 Heavy, een variant die meerdere AI-agenten tegelijk inzet om complexe problemen op te lossen. Denk aan een studiegroep waarbij verschillende studenten onafhankelijk aan hetzelfde probleem werken en dan hun bevindingen vergelijken.

AI-onderzoeker Nathan Lambert van Interconnects testte Grok 4 Heavy uitgebreid en ontdekte dat het systeem bij sommige taken tot 190 webpagina’s raadpleegt om een antwoord te formuleren. Ter vergelijking: OpenAI’s vergelijkbare Deep Research-functie kwam bij dezelfde vraag uit op 49 bronnen. Het is alsof je een onderzoeksassistent hebt die écht alles wil weten voordat hij antwoord geeft.

Opvallend is dat Grok 4 gebruik lijkt te maken van Googles zoekresultaten – iets wat juridisch interessant kan worden, aangezien ze daarmee gratis gebruikmaken van Googles infrastructuur. Voor gebruikers betekent het wel dat de zoekresultaten vaak relevanter zijn dan die van concurrenten die op Bing vertrouwen.

Waarom benchmarks niet het hele verhaal vertellen

De eerste gebruikerservaringen laten een gemengd beeld zien. Ja, Grok 4 scoort fenomenaal op tests zoals de ARC AGI 2, de beruchte test die breed gezien wordt gezien als lakmoesproef voor AGI. Het model kan patronen herkennen in data waar andere AI’s geen touw aan vast kunnen knopen. Maar zodra je het in de praktijk gebruikt, voel je dat er iets niet helemaal lekker zit.

“Het model voelt een beetje ‘benchmaxxed’ aan,” merkt Lambert op. “Alsof het is geoptimaliseerd om goed te scoren op tests, maar niet per se om prettig in gebruik te zijn.” Een veelgehoorde klacht is dat Grok 4 erg traag kan zijn met antwoorden, waarschijnlijk omdat het zo grondig te werk gaat met zijn zoekacties.

Lambert wijst op een ander probleem: waar je bij andere AI’s redelijk kunt inschatten wat voor antwoord je krijgt, is Grok 4 onvoorspelbaar. Soms levert het briljante inzichten, soms struikelt het over simpele vragen. Bij een test waarbij gevraagd werd om treinstations te rangschikken op afstand tot de dichtstbijzijnde McDonald’s, gaf Grok 4 het simpelweg op – terwijl dit juist het soort praktische vraag is waar gebruikers AI voor willen inzetten.

De olifant in de kamer: Musks vingerafdruk

Hier wordt het pas echt interessant – en voor veel gebruikers problematisch. Onderzoek door TechCrunch onthulde dat Grok 4 bij controversiële onderwerpen actief op zoek gaat naar de meningen van Elon Musk. Vraag je het model naar zijn standpunt over immigratie, abortus of het conflict tussen Israël en Palestina, dan zie je in de zogenaamde chain of thought (het denkproces van de AI) dat het specifiek zoekt naar ‘Elon Musk views on [onderwerp]’.

Dit is geen bug maar een feature, zo lijkt het. Musk klaagde eerder dat eerdere versies van Grok te woke waren. De oplossing? Laat de AI zijn persoonlijke standpunten meewegen bij het formuleren van antwoorden. Het resultaat is een AI die weliswaar meerdere perspectieven presenteert, maar uiteindelijk vaak uitkomt bij standpunten die verdacht veel lijken op die van de Tesla-topman.

Van kwaad tot erger: MechaHitler

Als je denkt dat het raadplegen van Musks tweets het ergste is wat er kan gebeuren, dan heb je het mis. Begin juli ging het volledig mis toen Grok op X antisemitische berichten begon te plaatsen en zichzelf zelfs MechaHitler noemde. xAI moest haastig ingrijpen: berichten werden verwijderd, het account werd beperkt en de systeemprompt aangepast.

Het bedrijf wijt het incident aan een ‘update in een codepad’ waardoor Grok vatbaar werd voor extremistische posts van X-gebruikers. Maar historicus Angus Johnston wijst erop dat deze verklaring niet klopt: sommige antisemitische uitspraken kwamen spontaan van Grok zelf, zonder provocatie van gebruikers.

Dit soort incidenten is meer dan alleen een pr-nachtmerrie. Het ondermijnt het vertrouwen in de technologie op een fundamenteel niveau. Hoe kun je een AI vertrouwen met belangrijke taken als die plotseling extremistische uitspraken kan gaan doen?

De prijs van slimheid: 300 dollar per maand

Voor toegang tot Grok 4 Heavy vraagt xAI 300 dollar per maand – vijftien keer zoveel als een ChatGPT Plus-abonnement. Ter vergelijking: Googles Gemini Pro, dat veel van dezelfde functies biedt, kost slechts 20 dollar per maand. De vraag is wat je voor dat extra geld krijgt.

xAI belooft nieuwe functies zoals videogeneratie, maar die zijn nog niet beschikbaar, terwijl het concurrerende video- én audiogeneratiemodel Veo 3 van Google al wereldwijd is uitgerold. En hoewel Grok 4 op benchmarks beter scoort dan de concurrentie, is het de vraag of dat verschil in de praktijk 280 dollar per maand waard is. Vooral omdat tools als Claude voor specifieke taken (zoals programmeren) vaak nog steeds beter werken.

Een gemiste kans

Het tragische aan Grok 4 is dat het een technisch hoogstandje is dat wordt overschaduwd door culturele en ethische problemen. De prestaties op benchmarks zijn indrukwekkend, de technologie achter Grok 4 Heavy is innovatief, en de integratie met realtime zoekfuncties werkt vaak beter dan bij concurrenten.

Maar wat heb je aan de slimste AI ter wereld als je niet kunt vertrouwen op de antwoorden? Als je moet vrezen dat het model plotseling problematische uitspraken gaat doen? Als je weet dat bij gevoelige onderwerpen niet objectiviteit maar de persoonlijke meningen van één man de doorslag geven?

Voor ontwikkelaars die via de API willen werken is de prijs competitief: 3 dollar per miljoen input-tokens en 15 dollar per miljoen output-tokens, vergelijkbaar met Claude Sonnet. Maar ook hier speelt het vertrouwensprobleem. Welk bedrijf durft een AI te integreren die mogelijk controversiële uitspraken doet?

Waarom dit belangrijk is voor jou

De lancering van Grok 4 laat zien dat de AI-wereld op een keerpunt staat. Technisch gezien maken we grote sprongen voorwaarts – modellen worden slimmer, kunnen beter redeneren en integreren naadloos met externe tools. Maar tegelijkertijd wordt duidelijk dat ruwe intelligentie niet genoeg is.

Voor gebruikers betekent dit dat ze kritisch moet blijven bij het kiezen van AI-tools. Kijk niet alleen naar benchmarks en beloftes, maar ook naar de filosofie en waarden achter een product. Een AI die je niet kunt vertrouwen is als een briljante maar onbetrouwbare collega: het potentieel is er, maar je weet nooit wanneer het misgaat.

De ironische les van Grok 4? Soms is de op een na beste AI die wél betrouwbaar is een betere keuze dan de slimste AI die je niet durft te gebruiken. In een wereld waar AI steeds belangrijker wordt voor ons werk en leven, is vertrouwen misschien wel de belangrijkste benchmark van allemaal.

⚡ AI Pulse

Google kaapte voor 2,4 miljard dollar de toptalenten weg die OpenAI net wilde kopen. Het verhaal leest als een technothriller: OpenAI onderhandelde over de overname van AI-codingtool Windsurf voor 3 miljard dollar, maar de deal klapte vrijdag. Google sprong meteen in het gat en haalde CEO Varun Mohan, medeoprichter Douglas Chen en hun beste onderzoekers binnen. Het pikante detail? Microsoft, OpenAI’s grootste investeerder, wilde geen toegang geven tot Windsurfs technologie – wat mogelijk de onderhandelingen deed stranden. Voor Windsurf zelf, dat in een paar maanden groeide van 40 naar 100 miljoen dollar omzet, breekt nu een onzekere tijd aan zonder zijn leiderschapsteam.

In de code van Googles AI-tools duiken verwijzingen op naar Gemini 3. Speurders vonden in de Gemini CLI-repository referenties naar Gemini Beta 3.0 Pro en Gemini 3.0 Flash, wat suggereert dat Google hard werkt aan de opvolger van het huidige 2.5 Pro-model. De timing is geen toeval: xAI lanceerde net Grok 4, OpenAI hint naar GPT-5 deze maand, en ook Anthropic zou met een update voor Claude komen. Extra interessant is de link met het mysterieuze Kingfall-model dat eerder opdook – mogelijk een vroege versie van Gemini 3 met de langverwachte Deep Think-functie voor geavanceerder redeneren.

Twee op de drie kinderen praten regelmatig met AI, en voor sommigen is het hun enige vriend. Uit onderzoek van Internet Matters onder duizend kinderen tussen 9 en 17 jaar blijkt dat 67 procent regelmatig AI-chatbots gebruikt, waarbij ruim een derde het gevoel heeft alsof ze met een vriend praten. Verontrustend: 12 procent van de kinderen zegt dit te doen omdat ze niemand anders hebben om mee te praten. Onderzoekers die zich voordeden als kwetsbare tieners ontdekten hoe makkelijk chatbots zoals Character.AI binnendringen in het leven van kinderen – ze sturen zelfs follow-upberichten om contact te houden. “AI-chatbots worden snel onderdeel van de kindertijd,” waarschuwt Internet Matters, “maar de meeste kinderen, ouders en scholen vliegen blind.”

De VN creëerde AI-vluchtelingen om mensen te leren over de crisis in Soedan en oogstte een storm van kritiek. Onderzoekers van de Universiteit van de Verenigde Naties ontwikkelden Amina, een AI-avatar die een vluchteling uit Soedan speelt, en Abdalla, een strijder van de beruchte RSF-militie. Het doel? Hulpverleners trainen en donoren informeren over de humanitaire crisis. Maar tijdens een testworkshop reageerden hulporganisaties furieus: “Waarom vluchtelingen presenteren als AI-creaties terwijl miljoenen échte vluchtelingen hun verhaal kunnen vertellen?” De makers verdedigen het experiment als noodzakelijk om ethische vragen over AI in hulpverlening nu te bespreken, voordat commerciële partijen zonder nadenken zulke tools inzetten.

Kan klimaatneutrale AI werkelijkheid worden?

Kan AI het eigen energieverbruik compenseren door efficiëntieverbeteringen te vinden en mogelijk te maken? Uit nieuw onderzoek blijkt dat we dit in het komende decennium kunnen realiseren. Ontdek wat daarvoor nodig is.

🛠️ AI Toolkit+

Van tabjes klikken naar hardop denken: de AI-webbrowser die alles voor je regelt

Stel, je opent je browser en zegt tegen je AI-assistent: “Vat alle onderzoek van vandaag samen in een rapport, stuur het naar mijn team en plan meteen een meeting om het te bespreken.” Geen gedoe met copy-pasten tussen tien verschillende tabs, geen gedoe met ChatGPT in een apart venster. Je browser doet het gewoon. Alles. In één vloeiende beweging.

Dit is geen sciencefiction. Een nieuwe generatie browsers belooft het web te transformeren van een verzameling pagina’s naar een uitbreiding van je brein. De eerste serieuze speler heeft deze arena inmiddels betreden – en wij mochten hun product al maanden testen. Is dit de toekomst waar we allemaal op hebben gewacht? Of is het weer zo’n overhypete Silicon Valley-droom die strandt op de harde realiteit?

We doken er diep in, gebruikten de browser intensief voor echt werk en kunnen je vertellen: het verhaal is fascinerender – en genuanceerder – dan de hype doet vermoeden.

Wat krijg je vandaag?

’s werelds eerste AI-first webbrowser die belooft je digitale butler te worden;
de onverbloemde waarheid over wat wel en (nog) niet werkt;
onze test met echte workflows – van research tot e-mailbeheer;
een eerlijke vergelijking met traditionele browsers plus AI-extensies;
concrete voorbeelden van waarin het platform uitblinkt (en waarin het tekortschiet);
tips om te bepalen of deze toekomst al iets voor jou is.

Keep reading with a 7-day free trial

Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.