5 mei 2026 · 13:54

AI diagnoseert beter dan ER-arts: Harvard-studie in Science

Een Harvard-studie gepubliceerd in Science laat zien dat OpenAI's o1-preview in 67 procent van de gevallen de juiste diagnose stelde bij echte spoedeisende-hulp-casussen, tegenover 50 tot 55 procent voor de behandelende artsen. De onderzoekers konden zelfs niet onderscheiden welke diagnoses van de AI kwamen en welke van mensen. In deze aflevering bespreekt The State of Tech wat dit betekent voor de rol van AI in de zorg, welke randvoorwaarden er gelden, en hoe Nederlandse ziekenhuizen als Erasmus MC en Amsterdam UMC dit oppakken.

Trump AI-toezicht Harvard medische AI Meta Cisco

Beluister deze aflevering:

Spotify Apple Podcasts

Transcript

Linda: Welkom bij The State of Tech, dinsdag 5 mei 2026. Ik ben Linda Duursma.

Erik: En ik ben Erik Van Doorn. Vandaag: Trump overweegt een overheidsreview voor nieuwe AI-modellen, een Harvard-studie laat zien dat AI spoedeisende-hulp-artsen verslaat in diagnoses, Meta laat AI-agenten zelf trainingsdata bouwen met Autodata, Cisco koopt cyberbedrijf Astrix voor 400 miljoen dollar, Anthropic begint een eigen adviesbureau voor zakelijke AI, en we sluiten af met IBM-baas Arvind Krishna die vandaag Think 2026 opent met quantum en AI. We beginnen met die opvallende ommezwaai van Trump rond AI-toezicht.

Trump overweegt een formeel overheidsreview voor nieuwe AI-modellen, een opvallende ommezwaai.

Erik: Het Witte Huis bespreekt een executive order voor een AI working group, met techexecutives en overheidsfunctionarissen, om oversight-procedures uit te werken. Op tafel ligt een formeel reviewproces voor nieuwe AI-modellen. Vorige week werden topmensen van Anthropic, Google en OpenAI op het Witte Huis gebriefd. Dit meldt The New York Times, op basis van bronnen rond het Witte Huis.

Linda: En dat is een serieuze koerswijziging. Op zijn eerste dag terug in 2025 schrapte Trump juist het Biden-proces dat AI-bouwers vroeg om veiligheidsevaluaties. Vice-president JD Vance zei vorig jaar in Parijs nog dat overregulering een transformatieve industrie kan doden. Nu ligt er een denkrichting waarbij de overheid eerste toegang krijgt tot nieuwe modellen, al mag ze de release niet blokkeren. Lijkt op de Britse aanpak.

Erik: De directe trigger is Anthropic's nieuwe model, Claude Mythos Preview. Volgens Anthropic zelf is dat zo goed in het vinden van software-kwetsbaarheden dat het tot een cybersecurity reckoning kan leiden. Anthropic besloot het niet publiek vrij te geven. De NSA gebruikt Mythos al om kwetsbaarheden in Amerikaanse overheidssoftware te beoordelen.

Linda: Dat is precies het dual-use-dilemma. Dezelfde capability die het Pentagon waardevol vindt, is wat aanvallers willen. Het Witte Huis wil voorkomen dat er politieke schade komt na een verwoestende AI-aangedreven cyberaanval, maar onderzoekt parallel of die modellen juist nuttige cyber-capaciteiten kunnen leveren aan defensie en inlichtingendiensten.

Erik: Politieke context is rommelig. AI-czar David Sacks vertrok in maart. Stafchef Susie Wiles en minister van Financiën Scott Bessent willen een grotere rol in het AI-beleid. En er loopt een bittere ruzie tussen Pentagon en Anthropic over een contract van 200 miljoen dollar, met een rechtszaak. Tegelijk wordt Anthropic-tech wel via Maven ingezet voor doelwitselectie in de oorlog in Iran.

Linda: Een Witte-Huis-functionaris noemt elke discussie over een executive order speculation, een aankondiging zou van Trump zelf moeten komen. Mogelijke toezichthouders: NSA, het White House Office of the National Cyber Director, en de Director of National Intelligence. Ook het Center for AI Standards and Innovation, dat onder Trump opzij was gezet, kan terugkeren.

Erik: Voor frontier labs als Anthropic, OpenAI en Google betekent dit dat er mogelijk een Amerikaanse evenknie van het Britse AI Safety Institute komt. Niet een blokkade, maar een verplichte tweede blik voor release. Dat verandert het tempo waarin nieuwe modellen op de markt komen.

Linda: En het verstevigt de Europese onderhandelingspositie. Als Washington zelf gaat toetsen, wordt het lastiger om de AI Act als handelsbarrière weg te zetten. Maar nogmaals: de EO is niet getekend, en wat Mythos exact wel of niet kan, weten we niet.

Harvard-studie in Science: OpenAI's o1-preview verslaat ER-artsen in diagnose-accuratesse.

Erik: Onderzoekers van Harvard publiceerden in Science een studie waarbij OpenAI's o1-preview-model losgelaten werd op 76 echte spoedeisende-hulp-casussen. Het model stelde in 67,1 procent van de gevallen de juiste initiële diagnose. De twee dienstdoende artsen zaten op 55,3 en 50,0 procent. Twee onafhankelijke beoordelaars konden niet onderscheiden welke diagnoses van de AI kwamen en welke van de mensen.

Linda: En één casus springt eruit. De AI signaleerde een zeldzame vleesetende infectie bij een transplantatiepatiënt, twaalf tot vierentwintig uur voordat de behandelende arts dezelfde diagnose stelde. Bij dat soort beelden tellen uren letterlijk. Belangrijk detail: het model kreeg alleen ruwe tekst uit het elektronisch patiëntendossier, geen beelden, geen labwaarden buiten de tekst.

Erik: De nuance is groot. 76 casussen is geen klinische trial. Dit is een signaal, geen eindoordeel. En het gebruikte model, o1-preview, is uitgebracht in 2024. Dat is in AI-tijd meerdere generaties oud. De vraag is dus wat huidige frontier-modellen kunnen in een echte zorgomgeving.

Linda: Het potentieel zit in zeldzame, levensbedreigende beelden die een drukke ER-arts kan missen. De randvoorwaarden zijn validatie, aansprakelijkheid, en integratie in het werkproces. Wie tekent als de AI iets ziet wat de arts mist, of andersom?

Erik: Het Erasmus MC, het Amsterdam UMC en het Radboudumc hebben pilots lopen rond beeldherkenning en risicoscores. Maar een AI die meedraait in de triage en zelfstandig differentiaaldiagnoses voorstelt, dat ligt nog ver weg. Dit Harvard-onderzoek zal die discussie versnellen.

Linda: En het roept een ongemakkelijke vraag op. Als een model in 67 procent van de gevallen raak zit en een arts in 50 procent, op welk moment wordt het dán ethisch verdedigbaar om zonder AI-second-opinion te werken? Daar gaat de medische wereld de komende jaren over nadenken.

Linda: Even een kleine onderbreking. Luister je vaker naar The State of Tech? Druk dan op de likeknop en abonneer je, zodat je nooit een aflevering mist. Oké, verder.

Meta laat AI-agenten zelfstandig trainingsdata ontwerpen met een methode genaamd Autodata.

Erik: Meta heeft Autodata onthuld, een systeem waarbij AI-agenten fungeren als autonome datawetenschappers. Ze bouwen, controleren en verbeteren trainingsdata voor nieuwe AI-modellen. In een eerste studie, Agentic Self-Instruct, lieten ze AI-agenten complexe wetenschappelijke vraagstukken oplossen door trainingsopdrachten te formuleren die een sterke AI wel, en een zwakke AI niet kan oplossen.

Linda: Het idee is dat Meta rekenkracht direct kan omzetten in datakwaliteit, in plaats van afhankelijk te zijn van menselijke annotatoren. Dat is een grote belofte, want hoogwaardige trainingsdata is een van de grootste bottlenecks in de huidige AI-ontwikkeling. Internet is grotendeels uitgekamd, en gespecialiseerde data is duur.

Erik: De keerzijde is bekend uit eerder onderzoek. Modellen die getraind worden op door AI gegenereerde data lopen het risico op model collapse: een terugloop in diversiteit en kwaliteit. Meta claimt dat hun agentische aanpak juist het tegenovergestelde doet, omdat de agents actief op zoek gaan naar gaten in de capaciteiten van zwakkere modellen.

Linda: En dit raakt direct de concurrentiepositie. Wie het slimste synthetische-data-recept heeft, kan sneller en goedkoper modellen trainen. Voor Meta past het in hun open-source Llama-strategie: elk procentpunt extra prestatie tegen lagere kosten houdt ze in de race tegen OpenAI en Anthropic.

Erik: Menselijke annotatoren, vaak in lagelonenlanden, zijn jarenlang het stille fundament geweest onder de AI-revolutie. Als Autodata en vergelijkbare systemen werken, wordt die rol kleiner. Tegelijk verschuift de menselijke rol naar review en kwaliteitscontrole op een hoger niveau.

Linda: En dat is precies waar het Europese AI-debat over gaat. Soevereiniteit op modelniveau is mooi, maar als de trainingsdata-pipeline volledig in Silicon Valley wordt geoptimaliseerd, is de afstand alleen maar groter geworden.

Cisco neemt Israëlische cybersecurity-startup Astrix Security over voor 400 miljoen dollar.

Erik: Netwerkgigant Cisco heeft Astrix Security overgenomen, gespecialiseerd in de beveiliging van niet-menselijke identiteiten en autonome AI-agenten binnen bedrijfsnetwerken. Bedrag: ongeveer 400 miljoen dollar. Astrix richt zich op het bewaken van wat AI-agents doen, welke API-keys ze gebruiken, en met welke systemen ze praten.

Linda: Dat is een onderbelicht beveiligingsprobleem. In een doorsnee bedrijf zijn er inmiddels meer machine-identiteiten dan menselijke gebruikers. Een AI-agent die toegang heeft tot CRM, mail en de cloud, is een aantrekkelijk doelwit. Eén gestolen token, en de aanvaller kan onder de radar van klassieke security-tools doorlopen.

Erik: Cisco is hiermee niet de eerste. Eerder dit jaar deden Palo Alto Networks en Wiz vergelijkbare overnames. De markt voor agent security wordt door analisten geschat op tientallen miljarden binnen vijf jaar. Cisco probeert hier een achterstand op cloud-natives goed te maken via inkoop.

Linda: En de discussie binnen security-teams gaat over wie verantwoordelijk is als een agent iets doet wat niet de bedoeling was. De vendor van het model? De integrator? Het bedrijf zelf? Astrix levert in elk geval het stuk monitoring en logging dat nodig is om die vraag überhaupt te kunnen beantwoorden.

Erik: De Nederlandse Cyber Security Raad waarschuwde vorig jaar al dat de governance rond agentische AI achterloopt. Een overname als deze laat zien dat de markt vooruitloopt op de regelgeving. Wat in Brussel als use case wordt besproken, is in San Jose en Tel Aviv al een productlijn.

Anthropic lanceert een eigen adviesbureau voor zakelijke AI-adoptie.

Linda: Anthropic, het bedrijf achter Claude, zet een adviesbureau op om bedrijven te helpen bij de implementatie van geavanceerde AI. In samenwerking met nog nader te bepalen partners. Dit volgt op eerdere financieringsrondes en sluit aan bij een trend: AI-labs willen niet alleen het model verkopen, maar ook de transformatie eromheen begeleiden.

Erik: En dat is een interessante keuze. Het traditionele consultancy-territorium van Accenture, Deloitte en McKinsey wordt hiermee betreden door de partij die de technologie zelf bouwt. Anthropic kan claimen dat ze dieper begrip hebben van wat Claude wel en niet kan, dan een externe partner ooit kan opbouwen.

Linda: Tegelijk creëert dat een spanning. Een AI-vendor die ook adviseert hoe je AI inzet, zit dicht tegen een belangenconflict aan. Klanten zullen vragen of het advies neutraal is, of dat het altijd uitkomt op meer Claude-tokens.

Erik: De financiële logica is helder. De brutomarge op consultancy-uren is hoger dan op API-gebruik. En het bindt klanten langer. Voor Anthropic, dat enorme rekenrekeningen heeft staan, is elk diepgaander klantcontract waardevol.

Linda: De ABN AMRO's en Rabobanken van deze wereld kiezen straks tussen een traditionele integrator met meerdere modellen, of een directe lijn naar de modelmaker. Voor compliance-gevoelige sectoren is dat geen kleine afweging.

IBM-CEO Arvind Krishna opent vandaag Think 2026 met focus op AI en quantum in de onderneming.

Erik: Tot slot iets opwekkenders. Vandaag opent IBM-CEO Arvind Krishna de jaarlijkse Think-conferentie in Boston. Het thema: AI als bepalende kracht binnen bedrijven, en quantum computing als de volgende grens. Krishna zal naar verwachting zijn meest uitgebreide reeks bedrijfs-AI-aankondigingen tot nu toe presenteren.

Linda: De boodschap is herkenbaar: hoe haal je AI uit de pilotfase en krijg je het écht in productie? Veel bedrijven zitten al twee jaar in proof-of-concept-modus, met indrukwekkende demo's en nul euro besparing. IBM mikt op de fase waarin het echt loont.

Erik: En dan quantum. IBM zegt dichtbij quantum advantage te zitten, het punt waarop een quantumcomputer iets nuttigs sneller doet dan een klassieke computer. Niet voor TikTok-feeds, maar voor moleculaire simulaties, materiaalonderzoek en optimalisatie. IBM heeft al een 1.121-qubit-processor, Condor, en werkt aan opvolgers.

Linda: Mooi detail: in de marketing van IBM gaat het over economy of AI at scale. Klinkt als een buzzwordbingo, maar de onderliggende vraag is concreet. Wanneer kost een AI-agent minder dan de mens die hetzelfde werk deed? En als dat moment er is, wat doe je dan met die mens?

Erik: Voor liefhebbers van pakken-en-podia: Krishna staat bekend om zijn rustige, technisch dichte keynotes. Geen Apple-achtige drama, wel concrete roadmaps. De aankondigingen worden vandaag live gestreamd vanaf de Think-conferentie.

Linda: De troef van IBM is enterprise-vertrouwen, gebouwd over decennia. Banken, verzekeraars en overheden draaien nog dagelijks op IBM-infrastructuur. Als ergens AI én quantum samenkomen op een manier die voor de gewone Fortune 500 herkenbaar is, dan gebeurt dat in Armonk.

Erik: De Belastingdienst, ING en KPN hebben jarenlange IBM-relaties. Wat vandaag in Boston wordt aangekondigd, sijpelt over een paar maanden door naar Nederlandse boardrooms. En quantum is fascinerend genoeg om mee af te sluiten: het idee dat ergens in een gekoelde kamer in New York een chip rekent op een manier die de natuurkunde van vijftig jaar geleden onmogelijk noemde.

Linda: Vandaag hadden we het over: Trump die mogelijk AI-modellen wil laten reviewen, een Harvard-studie waarin AI ER-artsen verslaat, Meta's Autodata, Cisco die Astrix koopt voor 400 miljoen, Anthropic met een eigen consultancy-tak, en IBM Think 2026 met Arvind Krishna over AI en quantum.

Erik: Meer weten of reageren? Ga naar thestateoftech.nl of mail ons op info@doorzetters.net.

Erik: State of Tech, de techwereld in 15 minuten.