Google claimt alwéér 'het beste model ter wereld'
PLUS: waarom die claim steeds minder betekent, Anthropic's beveiligingstool veegt 15 miljard van de beurs, Tesla rijdt zelfstandig door Utrecht, en zo bouw je je eigen marktanalist met AI
De AI-wereld ontwikkelt zich razendsnel, en AI Report houdt je op de hoogte. Twee keer per week de nieuwste ontwikkelingen, tools en inzichten via onze nieuwsbrief en podcast.
🗞️ Het belangrijkste nieuws
Google lanceert Gemini 3.1 Pro: het nieuwste ‘beste model ter wereld’
Het regent nieuwe AI-modellen. In amper twee weken lanceerden de grote techbedrijven vier grote updates: Claude Opus 4.6, ChatGPT 5.3 Codex, Claude Sonnet 4.6, en nu dus Googles Gemini 3.1 Pro. Op sociale media gaat een meme rond die de situatie treffend samenvat: een kring van merken – OpenAI, Anthropic, Google, DeepSeek en Grok – die allemaal claimen ‘het krachtigste model ter wereld’ te hebben. Zodra de kring doorlopen is, begint de cyclus gewoon weer opnieuw.
Wat is er aan de hand?
Google heeft zojuist Gemini 3.1 Pro uitgebracht. Het model is nu beschikbaar in de Gemini-app, in NotebookLM (Googles onderzoeksassistent), en voor ontwikkelaars via diverse platforms. De grote belofte: complexe taken waar je normaal uren aan kwijt bent, doet dit model in minuten.
In tests bouwde Gemini 3.1 Pro onder meer:
een complete stadsplanningssimulatie à la SimCity:
Een werkende Windows 11-achtige webinterface:
Telkens vanuit één enkele opdracht. Het model kan ook je spreadsheetdata omzetten naar interactieve dashboards, of een ruwe schets transformeren naar een werkende website.
Waarom AI-onderzoekers naar fietsende pelikanen kijken
Om te meten hoe goed AI-modellen écht kunnen ‘zien’ en redeneren, bedacht vooraanstaand AI-ontwikkelaar Simon Willison een eigenaardige test: laat de AI een plaatje maken van een pelikaan op een fiets.
Klinkt simpel, maar er zit een addertje onder het gras. De AI kan het plaatje dat hij maakt namelijk niet zelf zien – hij moet het volledig in code beschrijven, zonder te kunnen controleren of het klopt. Het model moet dus puur op basis van redeneren begrijpen hoe een vogel met zo’n enorme snavel op een tweewieler zou zitten, hoe de poten bij de pedalen komen, en hoe een fietsframe in elkaar steekt.
Vorige modellen faalden jammerlijk: fietsen met drie wielen, pelikanen zonder vleugels, pedalen die in het niets hangen:
Gemini 3.1 Pro slaagt met verve:
Correcte anatomie, werkende trappers, en zelfs spaken in de wielen. Het klinkt als een grap, maar dit soort ruimtelijk inzicht is precies wat je nodig hebt als je AI vraagt om een organigram, een plattegrond of een productfoto te begrijpen.
Jiao Sun, de Google-onderzoeker die aan deze functie werkte, reageerde trots op X: “I’m extremely proud.”
Maar er zit een kanttekening aan dit succesverhaal. Google heeft blijkbaar iemand specifiek op deze SVG-generatie gezet omdat ze merkten dat de pelikaantest een populaire maatstaf aan het worden is. Het is een beetje alsof je voor je rijexamen alleen nog maar fileparkeren oefent omdat je weet dat de examinator dat altijd vraagt. Je haalt je rijbewijs, maar of je daarna ook kunt invoegen op de snelweg is een andere vraag.
Beste model ter wereld?
Op de belangrijkste AI-meetlatten scoort Gemini 3.1 Pro indrukwekkend. Op de ARC-AGI-2-test – door velen gezien als de ultieme IQ-test voor AI – haalt het 77,1 procent. Dat is ruim het dubbele van zijn voorganger en beter dan concurrenten als Claude Opus 4.6 van Anthropic, dat op 69 procent bleef steken.
Onafhankelijk onderzoeksbureau Artificial Analysis kroonde het tot “beste model op prijs-kwaliteitverhouding”. De kosten zijn ongeveer de helft van vergelijkbare modellen van Anthropic (maker van Claude) en OpenAI (maker van ChatGPT).
Maar – en dit is belangrijk – wat ‘het beste model’ is, hangt steeds meer af van wat je ermee doet. AI-onderzoeker Philip van AI Explained legt uit: “De tijd dat één model overal het beste in was, is voorbij. Labs trainen hun modellen nu specifiek op bepaalde taken. Gemini kan briljant zijn in visuele taken en tegelijk achterblijven op andere gebieden.” Op tests die meten hoe goed AI echte problemen in bedrijfssystemen kan oplossen, blijft Gemini achter bij Claude Opus 4.6.
Even dimmen
Ondanks de indrukwekkende scores zitten er nog steeds haken en ogen aan het model. Zo verzint het soms nog dingen die niet kloppen – wat in AI-jargon ‘hallucinaties’ heet. Claude Sonnet 4.6 scoort op dit vlak beter: het geeft vaker toe dat het iets niet weet, in plaats van overtuigend onzin te produceren.
Ook de toegang is beperkt. Gratis gebruikers kunnen slechts twee vragen per dag stellen aan Gemini 3.1 Pro. Voor onbeperkt gebruik heb je een Google AI Pro- of Ultra-abonnement nodig. Sommige functies waren bij lancering nog niet in alle regio’s toegankelijk.
Wat betekent dit voor jou?
De praktische winst zit hem vooral in visueel en analytisch werk. Waar je voorheen een designer of developer nodig had om van een idee naar een werkend prototype te komen, kun je nu zelf aan de slag. Gebruik je al de Gemini-app of NotebookLM? Dan krijg je automatisch toegang tot het nieuwe model.
En die eeuwige vraag welk model nu écht het beste is? Die kun je gerust negeren. Over twee weken is het antwoord toch weer anders.
Anthropics nieuwe beveiligingstool veegt 15 miljard van de beurs
Een paar weken geleden was het de juridische sector die wakker schrok toen Anthropic, de maker van Claude, plug-ins uitbracht waarmee de AI contracten kon reviewen en NDA’s beoordelen. Thomson Reuters daalde 19 procent, LegalZoom verloor 18 procent. Nu is de cyberbeveiligingsbranche aan de beurt.
Wat is er gebeurd?
Anthropic introduceerde vrijdag Claude Code Security, een tool die automatisch beveiligingslekken in software opspoort en gerichte reparaties voorstelt. Het systeem draait op Claude Opus 4.6, het nieuwste model van het bedrijf, en kan volgens Anthropic subtiele fouten vinden die traditionele beveiligingsscanners missen.
De marktreactie was niet mals. CrowdStrike, een van de grootste namen in cyber security, daalde 8 procent. Cloudflare verloor eveneens 8 procent, Okta meer dan 9 procent, en JFrog kelderde bijna 25 procent in één handelsdag. In totaal verdampte zo’n 15 miljard dollar aan beurswaarde.
Vanwaar deze paniek?
De angst onder beleggers is dat AI-tools functies overnemen waar nu hele teams beveiligingsexperts voor nodig zijn: kwetsbaarheden opsporen, beoordelen hoe ernstig ze zijn, en oplossingen voorstellen. Als één AI-tool dat allemaal kan, wat blijft er dan over van de markt voor gespecialiseerde beveiligingssoftware?
Die zorg is niet uit de lucht gegrepen. In interne tests vond Claude Code Security meer dan vijfhonderd onbekende, ernstige beveiligingslekken in veelgebruikte opensourcesoftware – fouten die jarenlang onopgemerkt waren gebleven.
Het grotere plaatje
Dit past in een patroon dat we de afgelopen maanden zien. Eerst kwam Claude Code voor ontwikkelaars. Toen Cowork, waarmee ook niet-technici Claude aan het werk konden zetten. Daarna de juridische plug-ins die Thomson Reuters de stuipen op het lijf joegen. Nu cyber security. Anthropic schuift systematisch op van ‘handige chatbot’ naar ‘geïntegreerde collega’ die hele workflows kan overnemen.
Niet iedereen is in paniek. Anthropic zelf benadrukt dat een mens altijd het laatste woord houdt: ontwikkelaars moeten voorgestelde reparaties goedkeuren voordat ze worden doorgevoerd.
Tesla’s zelfrijdende auto’s rijden door Nederland
De afgelopen dagen circuleren op sociale media video’s van Tesla’s die zelfstandig door Utrecht, Den Haag en Amsterdam rijden. Nederland is daarmee het eerste land in Europa waar je de zelfrijdende auto’s van de autofabrikant in actie kunt zien. Tesla organiseert zogeheten Ride-Alongs op tien locaties, waaronder Amsterdam, Rotterdam, Den Haag en Utrecht. Je mag vanaf de passagiersstoel ervaren hoe de auto zelfstandig door het verkeer navigeert – voor de zekerheid zit er nog wel een Tesla-medewerker achter het stuur.
Het gaat om supervised Full-Self Driving, de technologie waar Tesla-eigenaren al jaren voor betalen maar in Europa nog nooit konden gebruiken. De RDW heeft nog geen definitieve goedkeuring gegeven, maar de demo’s mogen wel.
Een kanttekening: uit Amerikaanse cijfers blijkt dat Tesla’s robotaxi’s daar vooralsnog meer ongelukken veroorzaken dan menselijke bestuurders. Fascinerend, maar misschien toch nog even niet achter het stuur.
Verwerk complexe spreadsheets voortaan makkelijker met nieuwe ‘frontier agent’
Het verwerken van grote, complexe spreadsheets is voortaan een stuk makkelijker. Als eerste heeft PwC een ‘frontier agent’ ontwikkeld waarmee het voor AI-systemen, apps of andere agents mogelijk wordt deze spreadsheets te begrijpen en erdoor te navigeren.
🔮 Prompt whisperer
Bouw je eigen strategisch adviesteam met AI (deel 2 van 3)
Vandaag: een marktanalist die je concurrenten doorlicht én trends signaleert
Vorige week bouwden we je persoonlijke klantexpert – een AI die in het hoofd van je doelgroep kruipt. Maar je klant kennen is slechts de helft van het verhaal. De andere helft? Weten wat er om je heen gebeurt.
Wie zijn je concurrenten eigenlijk? Wat doen ze goed, waar schieten ze tekort? Welke trends komen eraan die jouw markt op z’n kop kunnen zetten? Dit soort vragen beantwoorden kost normaal gesproken weken aan deskresearch, rapporten doorspitten en LinkedIn stalken. Of je huurt een bureau in dat er maanden mee bezig is.
Vandaag bouwen we je tweede expert: een marktanalist die altijd paraat staat om je concurrentie te ontleden en markttrends te signaleren. Samen met de klantexpert van vorige week heb je dan al een stevig fundament voor strategische beslissingen.
Wat leer je vandaag?
Hoe je een AI-marktanalist opzet die je concurrenten tot op het bot analyseert.
Een kant-en-klare systeemprompt die je direct kunt overnemen.
Hoe je in minuten een concurrentieanalyse maakt die normaal dagen kost.
Trends en verschuivingen in je markt vroegtijdig signaleren.
Kansen ontdekken die je concurrenten laten liggen.
Pro-tips om je marktanalist steeds scherper te maken.














