Terrorisme voorspellen met big data: handlezen voor gevorderden

Als je veel data slim gebruikt, kun je tegenwoordig voorspellen wie wat gaat doen en wat waar gebeuren gaat. Terrorismebestrijders kunnen daar hun voordeel mee doen. Maar er schuilen ook gevaren: het is program, or be programmed.

Donderdagmorgen 11 maart 2004 parkeert een gestolen witte Renault Kangoo in de Calle Infantado in Alcalá de Henares. De straat ligt langs het metrostation dat het stadje verbindt met Madrid. Aan de andere kant van een witte blinde muur liggen de rails. Jonge mannen springen uit het busje. Uit de bagageruimte trekken ze rugzakken en sporttassen. De tassen en rugzakken zijn zwaar. Ze staan bol van spijkers, schroeven en 10 kg Goma 2 ECO – een vloeibaar explosief dat mijnbouwers gebruiken. Koperdraad koppelt de industriële ontstekers aan mobiele telefoons. De mannen laten dertien rugzakken en tassen achter in verschillende treinstellen van vier verschillende treinen. Tussen 7.37 en 7.40 uur, als de treinen richting station Atocha in Madrid rijden, brengen de terroristen de bommen tot ontploffing. Tien van de dertien gaan af. Het resultaat: 191 doden en 1.824 gewonden.

Meteen begon een klopjacht op de daders. De sleutel is een blauwe sporttas die is gevonden in het Azorínpark, met naast de explosieven een intacte mobiele telefoon, een Mitsubishi Trium T-110. Via het simkaartje in die telefoon weet de politie verschillende terroristen op te sporen. Uiteindelijk eindigt de achtervolging op 3 april 2004 bij een appartement in het zuiden van Madrid. Tussen half zes en half zeven arriveert een zwaar bewapende speciale eenheid. De politie sluit het gebied af en speciale eenheden richten een veldhospitaal in. Vanaf de eerste verdieping klinken Arabische gezangen. De speciale eenheden bestormen het pand en schieten rookbommen naar binnen. De terroristen bellen hun geliefden en gaan in een kring op de grond zitten. Drie minuten over negen blazen ze zichzelf en het pand op. Ook een lid van de speciale eenheid komt daarbij om.

Iedere terroristische aanslag is te vertellen als een verhaal.

Diep morele zielen

Iedere terroristische aanslag is te vertellen als een verhaal. Vanuit een neutraal perspectief is het een donkere tragedie. Maar vanuit het perspectief van een terrorist een heroïsch verhaal. ‘De ogen van de terrorist zijn niet leeg,’ schrijft de antropoloog Scott Atran in zijn boek Talking to the Enemy, waarvoor hij tientallen extremisten uit Afghanistan, Indonesië en Marokko interviewde. ‘Hun voldoening ligt niet in de rustige anticipatie van maagden in de hemel. Het is lichamelijk als bloed en verscheurd vlees. Terroristen zijn geen nihilisten, wreed of onzeker, maar vaak diep morele zielen met een gruwelijk misplaatst gevoel van rechtvaardigheid.’

Een terrorist is in zijn eigen ogen een klassieke held die zijn leven op het spel zet om een monster te overwinnen. Het is het verhaal dat in iedere cultuur opduikt. David tegen Goliath. De strijd van de rebellen tegen de Galactic Empire. Een onmogelijke opdracht, maar de held heeft een geheim wapen, en de ster des doods heeft een achilleshiel.
Het is geen toeval dat het een filmmaker was die zich realiseerde dat dit een vruchtbaar perspectief is om een terroristische aanslag uit te analyseren. Peter de Kock (48) maakte in 2006 de veel geprezen documentaire De handen van Che Guevara. Een zoektocht naar de handen van Che Guevara, die van zijn lijk waren afgehakt en opdoken in een pot met water en formaldehyde. In 2008 maakte de filmmaker de overstap naar de politie. Een overstap die kleiner is dan die lijkt. De Kock zag de overeenkomst tussen het plannen van filmopnamen, het opdelen van een verhaal in elementaire bouwblokjes en het voorbereiden van een liquidatie of terroristische aanslag. Net als een terrorist maak je als filmmaker een scenario van iets wat nog moet gaan gebeuren.

Zeven lagen diep

De Kock begon in Tilburg aan een promotieonderzoek. Met behulp van databases die vrij op internet staan, zoals de Global Terrorism Database en WikiLeaks wist De Kock 35.000 terroristische aanslagen bij elkaar te schrapen. Hij bedacht een methode om iedere aanslag als een patholoog anatoom uit elkaar te snijden en de organen naast elkaar op de snijtafel te leggen: een held, een vijand, een symbolisch doelwit, een wapen en een valse aanwijzing: ‘the red herring’.

Toen De Kock vlak na de aanslag op de marathon van Boston zijn database raadpleegde, rolde eruit dat de verdachten waarschijnlijk uit Tsjetsjenië kwamen. Daar waren al eerder aanslagen met snelkookpannen gepleegd. Hij realiseerde zich dat hij wat goeds had bedacht en vroeg een patent aan op zijn idee. 10 september 2014 promoveerde De Kock. Nog in rokkostuum zat hij aan tafel bij De Wereld Draait Door. ‘En in de weken na mijn promotie belden veiligheidsdiensten, overheidsinstanties en softwarebedrijven me helemaal suf. En dan moest ik zeggen, ja, ik heb alleen maar een schets gemaakt. Maar er belden ook bedrijven die zeiden: wij kunnen van jouw idee werkelijkheid maken. We kunnen de software in no time voor je bouwen. In de afgelopen maanden is alles bij elkaar gekomen. Het is nu niet meer alleen maar Peter die een plannetje heeft.’ In Elst, Gelderland hangt nu op een bedrijventerrein, tussen verfgroothandels en smederijen een bordje met ‘Pandora Intelligence’.

‘Introducing the human dimension in big data’, staat als ondertitel op de website. De Kock: ‘We hebben inmiddels een enorme dataset van meer dan 500.000 terroristische incidenten die zijn opgebouwd uit twaalf verhaalcomponenten met onderliggende subcomponenten. Een verhaalcomponent is “het middel”. Een middel kan een schoen zijn. Als de Amerikaanse president een persconferentie geeft en iemand gooit een schoen naar zijn hoofd, dan kun je dat zien als een terroristische aanslag. Een middel kan natuurlijk ook een vuurwapen zijn. Dat kun je weer een laag dieper onderverdelen in een vuistvuurwapen of automatisch vuurwapen. En vuistvuurwapen kun je weer een niveau lager onderverdelen in revolver of pistool. Zo heb je een hele taxonomie, een verdere vertakking die onder die twaalf basiscomponenten ligt. De tweede laag heeft 198 componenten, de derde laag meer dan zestienhonderd. Het model is zeven lagen diep. We hebben waanzinnig veel subcomponenten en al die subcomponenten zijn onderling met elkaar verbonden. Dat kun je visualiseren als een soort koolstofatoom: allemaal grote en kleine bolletjes die op verschillende afstanden van elkaar liggen. Een driedimensionale puntenwolk; het dna van een aanslag. Op deze manier hebben we van die 500.000 incidenten automatisch dna-structuren gemaakt.’

‘Creativiteit’ in het model

De Kock heeft nu een verzameling van honderdduizenden enorme puntenwolken die allemaal een terroristische aanslag representeren. ‘Zo kun je bijvoorbeeld ontdekken dat er gelijkenis is in de molecuulstructuur van de aanslagen op Anna Lindh en de aanslagen in Dubai.’

En De Kock ging verder. Hij voegde ook romans en computerspellen aan zijn database toe. Het idee hierachter is dat aanslagen soms eerder beschreven zijn in fictie. De ‘Oklahoma-bomber’ Timothy McVeigh haalde het idee voor zijn aanslag uit de roman The Turner Diaries van William Luther Pierce. Tom Clancy beschreef in de jaren negentig al een gekaapt vliegtuig dat het Capitool in vloog. De acties van Anders Breivik zijn exact na te spelen op het computerspel GTA. ‘Elk spel van Modern Warfare en GTA dat gespeeld wordt, kun je zien als een terroristische aanslag. En de scenario’s uit de Anarchist Cookbook staan natuurlijk ook in de database. Elke aanslag is uniek, maar je ziet ook dat er overeenkomsten zijn. Bovendien wordt hiermee “creativiteit” in het model geïntroduceerd. Gegevens uit aanslagen die eerder bedacht zijn maar nog niet uitgevoerd, worden in het model gekoppeld aan daadwerkelijk gebeurde aanslagen.’

De Kock legt uit wat je hier in de praktijk aan hebt: ‘Neem bijvoorbeeld de schietpartij in de Thalys. Het Franse persbureau AFP maakte die schietpartij als eerste bekend, ook voor de veiligheidsdiensten: “Schietpartij Thalys”. Ons model gaat dan vanzelf lopen, want dat triggert op woorden als ‘schietpartij’. Het model zet zichzelf aan en begint te analyseren: “schietpartij betekent een vuurwapen”, en “de Thalys is een strategisch object dat rijdt”. Dus op dat moment zegt het model: denk aan de aanslagen in Madrid, of: denk aan de aanslagen op het openbaar vervoer van 2007 in Londen. Maar daar heb je nog weinig aan. Op het moment dat er sprake is van een kalasjnikov – die informatie kwam als eerste via Twitter binnen – wordt het aantal scenario’s weer kleiner. Dat duidt erop dat er een criminele organisatie bezig is of dat er sprake is van terrorisme.’

Op de wc

Het model van De Kock voorspelt op basis van een paar feiten die via de persbureaus of social media binnenkomen hoe de hele wolk aan punten er naar verwachting uit gaat zien. Terwijl de rechercheurs nog op weg zijn, geeft het model zo verschillende scenario’s waar de politie rekening mee kan houden. Als een schaakprogramma dat voorspelt wat de volgende zet van een schaker zou kunnen zijn, op basis van honderdduizenden schaakpartijen die eerder zijn gespeeld.

De Kock: ‘Dit is wat we de adapt-fase noemen. Het aanpassen aan een situatie die zich ontwikkelt.’

Toen een jongen zich opsloot op de wc van een Thalys in Rotterdam Centraal, moest iedereen meteen aan de schietpartij in de Thalys denken, maar het model van De Kock zag meteen dat het een heel ander verhaal was. Iemand die zich opsloot in een wc om daar een uur te blijven zitten, dat was nooit eerder gebeurd bij een terroristische aanslag.

Een ander doel waar analisten het programma voor kunnen gebruiken, is anticipatie. De Kock: ‘Op een dag als Prinsjesdag weten we veel. We weten waar en wanneer politici aanwezig zijn en we weten ook uit welke hoek die politici bedreigd worden. Zo kan het model berekeningen maken van scenario’s waar we op Prinsjesdag mogelijk rekening moeten houden. Hier kunnen we de beveiliging van politici of leden van het koningshuis op afstemmen.’

Een andere voorzichtige conclusie is dat veel hedendaagse terroristen veel gamen, oefenen met computerspellen.

Het model werkt beter dan iedereen verwachtte. ‘De eerste voorzichtige conclusie die we nu trekken is dat terroristen vaker de kunst volgen dan we dachten. Het lijkt erop dat terroristen zich veel meer door fictie, computerspellen en andere aanslagen laten inspireren dan tot nu toe werd verondersteld.’ Een andere voorzichtige conclusie is dat veel hedendaagse terroristen veel gamen, of net als Anders Breivik, oefenen met computerspellen.

Interessant is dat dergelijke conclusies moeilijk te bewijzen zijn. Het model van De Kock werkt niet op basis van analytische logica, maar met machine learning of deep learning. Dit lijkt misschien een onbelangrijk detail, maar is kenmerkend voor een stormachtige ontwikkeling in de wereld van ‘big data’. Het model van Peter de Kock vergelijkt niet analytisch de verschillende datawolkjes met elkaar om er razendsnel verbanden tussen te vinden. De computer simuleert een machine die zijn eigen bedradingen en schakelingen steeds opnieuw verandert, net zoals een brein dat doet. Als een voorspelling uitkomt, dan is de machine tevreden en zal hij zichzelf maar weinig aanpassen, heeft hij het fout gedaan, dan verandert hij meer aan zichzelf, net zolang tot de gesimuleerde machine bij een bepaalde input een output geeft die dicht bij de werkelijkheid ligt. Het resultaat is een voor mensen ondoorgrondelijke algoritme dat soms verrassend goed presteert.

Verboden gebied

Het principe is al oud en gebaseerd op een idee van computerwetenschapper Arthur Samuel. Al in 1956 leerde hij een computer schaken door het partijen tegen zichzelf te laten spelen. Hij programmeerde welke zetten de stukken mochten zetten en definieerde een gewenste uitkomst (winst) en een ongewenste uitkomst (verlies). Het programma speelde steeds weer andere partijen tegen zichzelf. Achter de zet van de computer zat geen gedachte en leek geen logica schuil te gaan, maar de computer leerde de zetten die niet tot winst leidden te vermijden. Het resultaat was dat de computer beter leerde schaken dan Arthur Samuel. Het was de eerste weerlegging van het argument dat computers nooit slimmer zullen worden dan mensen omdat mensen de computers programmeren.

Het idee van Samuel is in de loop van de jaren verfijnd. En de laatste jaren zijn computers zo krachtig dat de principes van deep learning zijn toe te passen op enorme databases. Op dit moment speelt zich daarom een revolutie af in de wereld van beeldherkenning en automatische vertaalprogramma’s.

‘Het is niet meer zo dat als je in de programmatuur kijkt, dat er dan iets logisch te zien is,’ zegt Selmar Smit van TNO, ‘het is niet “als dit dan dat”. Een uitkomst “is” er gewoon.’

Telefoontjes moeten in een deurtjeskluis buiten de sluisdeur. Voor de deur pakt een man in duur pak een slick James Bond-achtig reiskoffertje in.

De computerwetenschapper zit in een soort klein schoollokaaltje samen met collega Arnout de Vries achter een tafel. Dertigers in overhemd. De onderzoekers werken in ‘verboden gebied’ in een kantoorgebouw aan de rand van het natuurgebied Meijendel aan digitale opsporingstechnieken voor de politie. Telefoontjes moeten in een deurtjeskluis buiten de sluisdeur. Voor de deur pakt een man in duur pak een slick James Bond-achtig reiskoffertje in. Ook in de wereld van de veiligheidsdiensten lijkt werkelijkheid beïnvloed door fictie.

TNO onderzoekt de big data mogelijkheden voor de AIVD, de MIVD en werkt samen met bedrijven als AGT, het internationale beveiligingsbedrijf waarvan prins Pieter-Christiaan in Nederland de baas is.

Smit: ‘Op een gegeven moment heeft het model verzonnen dat bepaalde input ertoe doet, en dat leidt tot een output met een onbegrijpelijke complexe formule. Als je die zou uitschrijven, zou je kilometers papier nodig hebben. Het is net als bij onze hersenen. Als je ze opensnijdt, kun je zien dat er iets gebeurt, maar je weet niet wat. Tot vijf jaar geleden kon je weinig data slim gebruiken of heel veel data dom gebruiken. Dat is nu anders. Nu kun je heel veel data heel slim gebruiken. Ik werk nu zelf ook met zo’n predictive policing algoritme waarbij ik zelf niet meer begrijp waarop de voorspelling gebaseerd is. Het is een model dat brandhaarden voorspelt. Ik stop er data in en het model voorspelt vrij accuraat wat potentiële brandhaarden zijn. Maar het model is zo complex dat ik het zelf niet kan lezen of begrijpen.’

Bij het voorspellen van brandhaarden is dit niet zo’n probleem. Bij het voorspellen van aanslagen wordt het al iets dubieuzer. ‘Met het model van De Kock kun je voorkomen dat er een delict gepleegd wordt en daar zijn we allemaal heel blij mee,’ zegt strafjurist Ybo Buruma, ‘juridisch gezien kun je iemand niet in de gevangenis stoppen op basis van zo’n programma. Maar de inlichtingendienst en de politie kunnen verstoren. Dat wil zeggen dat ze een aanslag kunnen voorkomen, terwijl de terrorist vrijuit zal gaan omdat die nog niks heeft gedaan. Die afweging is, denk ik, in het verleden ook wel gemaakt door de AIVD. Sindsdien zijn er nieuwe anti-terrorismewetten gekomen die ook het voorbereiden van aanslagen strafbaar maken. Omdat die wetten heel ruim zijn, moeten we wel oppassen dat we niet in de verleiding komen de programma’s van De Kock te gebruiken om mensen te veroordelen voordat ze iets gedaan hebben – dat zou net zoiets zijn als dat Amazon me alvast boeken stuurt omdat ik die vast heel mooi zal gaan vinden, maar dan erger.’

Fout positieven

Helemaal griezelig wordt het als dergelijke algoritmes gebruikt worden om te voorspellen of iemand een aanslag gaat plegen. Zoals iedere aanslag een verhaal is, zo is het leven van iedere terrorist te beschrijven als biografie. Het is niet ondenkbaar dat een model dat gevoed wordt met levensverhalen zoals mensen zelf via Facebook en Instagram schrijven, goede voorspellingen kan doen. Om nog maar te zwijgen over de data die scholen bijhouden. Misschien dat zo’n model redelijk kan voorspellen of iemand radicaliseert of het criminele pad op gaat. Net als dat Amazon nu al redelijk kan voorspellen welk boek je leuk gaat vinden. Dit gaat op de film Minority Report lijken. Wat moet je met een deep learning algoritme dat het opmerkelijk goed doet, en dat als output geeft dat een jongen met 90 procent zekerheid iets gevaarlijks gaat doen? Zonder dat iemand begrijpt waarom.

Buruma: ‘Je kunt het het gevaar van ‘digitale vooroordelen’ noemen. Het menselijk brein heeft ook vooroordelen – “Noord-Afrikaan met lange baard zal wel fundamentalist zijn en dus terrorist” – waar de computer misschien juist niet intrapt. Maar door foute input of verouderde gegevens kunnen ook verkeerde verbanden worden gelegd. Ik heb bij Amazon gezocht naar een titel van Plato en daarbij heel veel verschillende zoektermen ingetikt: nu denkt die computer van Amazon dat ik geweldig geïnteresseerd ben in klassieke filosofie. Ik ben blij dat ze mij niet alvast de nieuwste wetenschappelijke teksten over Plato toesturen. Een winkel wil mij niet boos maken, maar als ik door de politie “fout-positief” als terrorist wordt aangewezen, nemen ze denk ik al gauw het zekere voor het onzekere. Waar ik bezorgd over ben, is dat we ons over een jaar of vijf realiseren dat die neurale netwerken heel erg veel hebben opgeleverd, maar dat we te weinig de nadelen ervan hebben gezien. Ik denk dat we dankzij programma’s als die van Peter de Kock steeds beter de groep “fout negatieven” – mensen van wie we nu nog ten onrechte niet zien dat het terroristen of boeven zijn – kleiner kunnen maken. Het gevaar is dat de techniek ook een grotere groep “fout positieven” oplevert – mensen van wie ten onrechte wordt gedacht dat het terroristen of boeven zijn. Dat zijn onschuldige mensen die er niks mee te maken hebben, maar bij wie wel het arrestatieteam binnenstormt.’

Veiligheidsbutler

Arnout de Vries van TNO is het helemaal met Buruma eens. Maar hij ziet ook dat bedrijven minder terughoudend zijn. De overheid kan en mag volgens De Vries niet achterblijven bij deze bedrijven. En dat is wel wat er nu gebeurt. Om de eenvoudige reden dat ‘alle big sisters’ zoals Google en Facebook meer mogen dan de overheid en veel grotere innovatiebudgetten hebben. Google kocht begin 2014 het vijftig man tellende bedrijf Deep Mind voor vierhonderd miljoen dollar en haalde daarmee een groot deel van de beste deep learning wetenschappers binnen.

De Vries: ‘Verschillende bedrijven willen het KNMI van de terrorismevoorspelling worden. Juist omdat de data die je buiten de politie om kunt krijgen, steeds rijker worden. Waar ik me echt zorgen over maak, is dat de overheid buitenspel komt te staan. Dat de bedrijven de burgers en de criminelen het allemaal wel zelf kunnen. Dan leven we echt in het wilde westen. Ik ben zeker geen voorstander van een grote overheid, maar er moet wel een bepaalde balans zijn.’

Op dit moment rijdt in Silicon Valley al de Knightscope rond, een R2D2-achtige robot. De Vries: ‘Hij heeft 360-graden camera’s, kan in het donker kijken en heeft ook voorspellende software, scant social media, is volledig geautomatiseerd. Dat ding kost nu nog een paar duizend dollar. Maar straks zit dat in de grasmaaier in je voortuin, als een veiligheidsbutler. De straat is dan veilig en het kost niks. Maar als we zo’n ding zelflerend maken en toestaan om iemand te taseren, dan kom je in een wereld waar sciencefiction schrijvers over schrijven. Is het erg als het werkt en iedereen zich daardoor juist veiliger voelt? En is het dan erg als er een bedrijf als Google achter zit?’
Werken wij mee aan de nieuwe atoombom? Tja. Het is program, or be programmed.

Het zijn vragen waar nu over nagedacht moet worden. De snelheid waarmee deep learning de laatste paar jaar beter wordt, lijkt de mensen die weten wat nu in de onderzoekslaboratoria ontwikkeld wordt, angst aan te jagen. Elon Musk en Bill Gates hebben onafhankelijk van elkaar hun grote zorg uitgesproken over de snelle ontwikkelingen. Musk investeerde 10 miljoen dollar in onderzoek naar de veiligheid en juridische consequenties van kunstmatig intelligente systemen.

De intelligente computer HAL uit 2001: A Space Odyssey begint langzaam maar zeker realiteit te worden. Denk aan een zelflerende schoonmaakrobot die je de opdracht geeft om het huis zo efficiënt mogelijk schoon te houden, een robot die in contact staat met de cloud en andere schoonmaakrobots. Zo’n robot leert misschien dat het huis het beste schoon blijft als hij mensen buiten de deur houdt.

‘Wij proberen nu uit te vinden hoe de techniek goed gebruikt kan worden. Maar kun je specificeren wat goed is?’ zegt De Vries van TNO. ‘Werken wij mee aan de nieuwe atoombom? Tja. Als je er niet door overvallen wilt worden, moet je zelf achter het stuur gaan zitten. Het is program, or be programmed. Als wij niks doen, weten we zeker dat het voor het slechte gebruikt gaat worden.’

Terrorisme voorspellen met big data: handlezen voor gevorderden

Diep morele zielen

Zeven lagen diep

‘Creativiteit’ in het model

Op de wc

Verboden gebied

Fout positieven

Veiligheidsbutler

Reactie annuleren

Hugo de Jonge bewijst het: schijnbaar onhaalbare doelen stellen heeft wel zin

Parasiteren op het paradijs?

Wat nu als we de complexiteit niet meer aankunnen?

Literaire kroniek: Lucianus, een tijdloze satiricus

Ali B. komt wel weer aan de bak

Ook vrouwtjesdieren willen seks