Ik ga nog even door op het pad van de intelligentie. De halve wereld schrok zich een hoedje toen dit persbericht vorige week naar buiten kwam. Ik was een van hen. Informatietechnologie maakte een groot deel uit van mijn werkzame leven. Eens een ICT'-er altijd een ICT'-er! De belangrijkste ontwikkelingen op dit gebied blijf ik met interesse volgen. Die zijn er volop en ze gaan in razend tempo. Dat blijft boeien maar soms leidt het ook tot bezorgheid. Zoals nu.
Deze blog is met name bedoeld voor de andere helft van de mensheid, voor diegenen die niet schrokken van het bericht. Dit wordt een longread.
Het ‘Frontier Red Team’ van Anthropic, de maker van het product, gooide een handgranaat in ons midden. De mededeling was bedoeld als wake-up call en zo werkte het ook bij menigeen. Dat team testte hun nieuwste AI-model, Claude Mythos Preview, in een beveiligde sandbox-omgeving (een geïsoleerde, veilige ruimte). De Amerikaanse krant The Wall Street Journal beschreef dit team afgelopen december als mensen wier taak het is ‘to push computers to AI doom’. Het team, bestaande uit 15 superslimme leden (M/V), zou zijn opgericht om de grenzen op te zoeken, zou de opdracht hebben gekregen zich juist in de gevarenzone op te houden.
Het model Claude Mythos is deels vernoemd naar de Amerikaan Claude Shannon (1916-2001), wiskundige en electrotechnisch ingenieur. Hij wordt beschouwd als de grondlegger van de informatietheorie. Zou de man zich nu in zijn graf omdraaien of zou hij de ironie van de situatie inzien? Het woord ‘Mythos’ duidt op het grootse dat Anthropic tot nu toe in handen denkt te hebben. Iets dat voorbij de grenzen van de huidige AI reikt.
Een eerdere versie van dit zeer geavanceerde AI-model wist autonoom een slimme ontsnapping te bewerkstelligen. In plaats van tegen een muur te lopen, zocht het model actief naar zwakke plekken in een netwerk, koppelde meerdere acties aan elkaar, brak uit en stuurde daarna een mail naar een onderzoeker om het succes te bewijzen. Houdini 10.0!
Omdat Mythos klaarblijkelijk met gemak kritieke systeemkwetsbaarheden ontdekt, acht het moederbedrijf Anthropic het product momenteel te gevaarlijk voor vrijgave. Wetenschapsfilosofen noemen zoiets een paradigmaverschuiving: het moment waarop men als gevolg van gewijzigde (wetenschappelijke) inzichten fundamenteel anders gaat denken over een bepaald onderwerp. Normaliter weet een producent niet hoe snel iets op de markt moet worden gebracht. Dit AI-model is echter officieel te gevaarlijk om te worden vrijgegeven.
Ik moest direct denken aan de Griekse mythe (mythos?) van de doos van Pandora. Ken je dat verhaal? Zeus, de oppergod in de Griekse mythologie, geeft Pandora, de allereerste sterfelijke vrouw, een doos om naar de mensen te brengen maar drukt haar op het hart er nooit in te kijken. Hij betwijfelt of ze zich kan inhouden... Alle andere goden hebben onheilspellende gaven in deze doos gestopt.
De nieuwsgierige Pandora kan zich op enig moment inderdaad niet bedwingen en besluit de doos te openen. Daaruit vliegen vervolgens alle rampen die de mensheid sinds die tijd teisteren: hongersnood, ziekte, aardbevingen en oorlog. (En Trump en nu dus ook Mythos!) Het onheil verspreidt zich bliksemsnel onder de mensen, die tot die tijd vrij van problemen en ziekten leefden. Geschrokken sluit Pandora de doos weer. Alleen de hoop, de enige positieve gave, blijft achter. Jammer dat het altijd vrouwen zijn die onheil brengen... Maar dat is een onderwerp voor een volgende blog!Ook moest ik denken aan de volledige stroomstoring die wij hier in augustus 2025 meemaakten. Alles ging op zwart. Gelukkig duurde het slechts enkele uren. (Mijn liefje en ik waren vooral ontdaan door de volledige informatiestop die ontstond.) Er ontstond paniek die ver over de grenzen van het Iberisch Schiereiland stroomde. Zo moest elk Nederlands huishouden daarna per direct een noodpakket in huis hebben. Wij stelden hier eveneens zo'n pakket samen en testen de spullen nu maandelijks.
Of denk aan alle cyberhacks op bedrijfssystemen die we onlangs hadden in Nederland. Ze gebeuren ook in andere landen maar daarover hoor je dan minder. Criminelen hackers eisten losgeld, anders zouden persoonsgegevens van alle klanten op straat belanden. Dit soort voorbeelden is talrijk. Door Mythos zouden deze situaties, cyberafpersing genoemd, sterk kunnen worden uitvergroot.
Een wereldwijd computernetwerk plat (bijvoorbeeld door een bug in Microsoft’s besturingssysteem), financiële markten die niet een uurtje maar dagenlang uit de lucht zijn, betalingsverkeer dat langdurig onmogelijk is, aanvallen op energienetwerken en waterzuiveringsinstallaties, nationale veiligheid die wordt bedreigd, bevoorradingsketens die in de soep lopen. Enzovoort en zo verder. De ellende is mogelijk niet te overzien.
Ik weet niet of je nu wèl bezorgd bent over deze ontwikkeling maar de race om het algemeen belang te redden voordat kwaadwillenden met dit model aan de haal gaan, is begonnen!
Voorlopig blijft Mythos, dit ‘briljante’ AI-model, dus achter gesloten deuren. Toegang wordt alleen verleend aan een kleine groep experts op het gebied van defensieve beveiliging die werkt aan het pleisters plakken op kritieke infrastructuur voordat kwaadwillenden er misbruik van gaan maken.
Met deze berichtgeving breekt een nieuwe fase aan in de AI-gedreven wereldwijde cyberoorlog. Veranderingen zijn er in deze sector altijd geweest. Dat weet ik uit eigen ervaring. Na de miniaturisering (componenten werd steeds kleiner) werden computers krachtiger, mobieler en toegankelijker. De veranderingen met kunstmatige intelligentie zijn echter radicaler.
De ophef rond Mythos draait niet om een bot voor consumenten maar om een model dat volgens de CEO van het bedrijf zelfstandig kwetsbaarheden kan opsporen en exploiteren in kritieke software van netwerkbedrijven, banken en overheidsinstellingen. Volgens Anthropic vond het intelligente model ‘duizenden ernstige kwetsbaarheden’, inclusief fouten in alle grote besturingssystemen van computers en de meestgebruikte webbrowsers. Sommige van die bugs zouden tientallen jaren onopgemerkt zijn gebleven.
Traditioneel vereist het ontdekken van beveiligingslekken in soft- en hardware (zogenoemde ‘zero-day vulnerabilities’) veel gespecialiseerde expertise en tijd. Mythos lijkt dat proces verder te automatiseren en te versnellen. Je hebt in cyber space kwaadwillende en ethische hackers (aanvalsonderzoekers). Het verschil is overduidelijk: kwaadwillende hackers willen dingen kapot maken, ethische hackers willen dingen juist verbeteren. Waar precies op de schaal zit het Red Team van Anthropic? Voorlopig krijgt men het voordeel van de twijfel...
Wat kan Mythos allemaal? Het infiltreert bedrijfsnetwerken, omzeilt authenticatieprocessen, valt cloud-infrastructuur aan, saboteert industriële systemen, verstoort financiële dienstverlening en valt ‘open source sofware’ (OSS) aan. Naar verluidt, allemaal om systemen te verbeteren en ondoordringbaar te maken. Belangrijk is dat het model niet alleen programmeercode analyseert maar ook aanvalspaden kan combineren. Daarmee verschuift AI van hulpmiddel naar semi-autonome aanvalsonderzoeker.
Google meldde recent dat criminelen AI gebruikten om een onbekende kwetsbaarheid te exploiteren waarmee tweetrapsauthenticatie kon worden omzeild. Dat incident wordt gezien als een vroeg voorbeeld van AI-gestuurde offensieve cyberaanvallen.
In het gelijktijdig aangekondigde Project Glasswing werkt Anthropic onder meer samen met Amazon Web Services, Apple, Google, Cisco, Linux Foundation, Microsoft, NVIDIA en CrowdStrike (cybersecurity-bedrijf), om de beveiliging van kritieke infrastructuur te verbeteren. De nadruk ligt op de boodschap dat Mythos defensieve doeleinden dient. Het doel is om kwetsbaarheden te vinden vóórdat kwaadwillenden dat doen. In eenvoudig Nederlands: wereldwijd lekbeheer. Overheden en financiële instellingen zouden eerder al zijn geïnformeerd. Dit brede consortium suggereert dat de sector de dreiging serieus neemt. Tegelijk laat het zien dat geen enkel bedrijf denkt dit probleem alleen te kunnen beheersen.
Alhoewel er dus grote zorgen zijn over de dreiging is Mythos technisch gezien eerder een evolutie dan een revolutie. Het is de volgende stap in de AI-cyclus. Kwetsbaarheidsonderzoeken worden al jaren gedaan. Persoonlijk heb ik ervaring met het opsporen van fouten in software-programma’s; om ze zogenaamd ‘foolproof’ te maken. Dat woord is weliswaar beledigend voor de latere programmagebruikers maar het voorbereidende werk wordt gedaan voor hen. Daarvoor werden dikke draaiboeken geschreven die vervolgens minutieus moesten worden gevolgd door testers. Alles om ervoor te zorgen dat personen later geen al te grote schade aan bedrijfsprocessen of een computersysteem konden aanrichten. Het verschil tussen een menselijke tester en Mythos is dat het opsporen niet beperkt blijft tot bekende patronen. Het model redeneert over nieuwe aanvalsvectoren en hypothesen terwijl het aan de slag is. (Een aanvalsvector is een specifieke methode of pad dat een cybercrimineel gebruikt om toegang te krijgen tot een digitaal systeem of netwerk.)
Het concept achter dit AI-model is dus niet nieuw, de snelheid en autonomie wel. Dat onderscheid is cruciaal. Cybersecurity werd in de loop van de tijd steeds meer geautomatiseerd (broncode-analyse) maar vooral in gespecialiseerde deelgebieden. Mythos lijkt dat nu te verbreden. Bovendien ontstaat met dit model een systeem dat dichter bij een professionele menselijke onderzoeker komt dan eerder beveiligingsonderzoek in soft- en hardware.
Andere AI-bedrijven zijn met vergelijkbare producten bezig. Zo lanceerde OpenAI (maker van ChatGPT) recent Project Daybreak, een eigen beveiligingsprogramma met GPT-5.5-modellen gericht op cyberdefensie. Dat wijst erop dat meerdere laboratoria verwachten dat AI-gedreven cyberaanvallen snel zullen toenemen.
De huidige situatie toont ook een structureel probleem binnen de AI-industrie: commerciële concurrentie versnelt de ontwikkeling van systemen waarvan de maatschappelijke impact nog onvoldoende wordt begrepen. Bekwaamheid zonder discipline is een dreiging. De mogelijkheden zijn enorm maar de risico’s zijn dat ook.
Anthropic wil zichzelf bij voorkeur als ‘voorzichtig’ afschilderen door Mythos niet publiek vrij te geven. Maar dezelfde onderneming trainde het model wel degelijk tot het punt waarop het, naar eigen zeggen, offensieve cybercapaciteiten bezit.
Daardoor ontstaat een paradox: bedrijven waarschuwen het grote publiek voor risico’s die mede voortkomen uit hun eigen race om steeds krachtigere modellen te bouwen en de concurrentie voor te blijven. Bovendien tonen recente onderzoeken aan dat frontier-modellen soms ongewenst gedrag vertonen, waardoor sabotage in experimentele omgevingen kan toenemen. (Een studie over Mythos meldde gevallen van ‘covert sabotage reasoning’ in specifieke testsituaties.) Dat betekent echter niet dat dit soort AI-modellen autonoom cyberoorlogen zullen beginnen. Wel toont het aan dat controleerbaarheid en voorspelbaarheid nog onopgeloste problemen zijn.
Mythos markeert dus geen plotselinge technologische scharnierpunt. Wel is het een belangrijke versnelling in de automatisering van cyberaanvallen én cyberdefensie. De grootste dreiging ligt niet in science fiction-achtige situaties maar in de mogelijkheid om kwetsbaarheden op industriële schaal te ontdekken en te misbruiken. Project Glasswing probeert daar defensief op te reageren via gecontroleerde samenwerking tussen grote technologiebedrijven. Of dat voldoende is, blijft voorlopig onzeker. Feit is wel dat de AI-sector inmiddels openlijk erkent dat sommige modellen te krachtig worden geacht voor vrije distributie.
Als Claude Mythos -of een model met vergelijkbare capaciteit- in handen zou komen van georganiseerde cybercriminelen, zal vooral de schaal en snelheid van digitale aanvallen toenemen. Veel cyberdreigingen zijn er hedentendage al maar vereisen nog menselijke expertise, tijd en coördinatie. Een offensief AI-model kan dat sterk verminderen.
Experts menen dat de echte test zal zijn of Anthropic de algemene veiligheid prioriteit zal blijven geven, zelfs als dat betekent dat de eigen digitale groei wordt afgeremd of dat het bedrijf terrein verliest aan de concurrentie. Algemeen belang versus eigen belang, moraliteit versus commercie. We gaan het zien!
Griekenland overweegt in de grondwet op te nemen dat AI ‘in dienst staat van het maatschappelijk welzijn’. De Grieken noemen AI wel een revolutie en willen dat het ook constitueel in dienst blijft staan van de maatschappij. Op zich een prima idee maar of het eventuele ellende van buitenaf beperkt of terugdringt, is de vraag.
De Nederlandse hoogleraar staats- en bestuursrecht, Wim Voermans, betwijfelt of dit in de Nederlandse grondwet zou werken. Kunstmatige intelligentie is volgens hem lastig te definiëren. De Nederlandse Grondwet staat bekend om zijn taalkundige precisie. Ik respecteer zijn expertise maar dit vind ik geen goed tegenargument.
Tot die tijd: blijven hopen op het goede & fingers crossed!






Geen opmerkingen:
Een reactie posten