Zonder onze data is het algoritme machteloos

Een medewerker van Google in een datacentrum van de zoekmachine in het Amerikaanse Oregon. Wetenschap
Een medewerker van Google in een datacentrum van de zoekmachine in het Amerikaanse Oregon. | beeld epa
Bekijk dit artikel in de Digitale Editie
Het algoritme kan alles. Inbraken voorspellen, muziek schrijven, je favoriete YouTube-filmpjes selecteren en ga zo maar door. Ondertussen is veel onduidelijk. Een ding is zeker: zonder data kan een algoritme niets.

Amersfoort

Wat is een algoritme?

Je kunt een algoritme omschrijven als een set van regels die conclusies trekt uit gegevens. Zonder die gegevens (data) kan het algoritme niets en vormt het een leeg stappenplan. De Israëlische historicus Yuval Noah Harari beschrijft een algoritme in zijn boek Homo Deus daarom als ‘de methode die gevolgd wordt bij het maken van een berekening’. Die methode bestaat altijd uit minimaal twee stappen.

De ene stap kan hierbij zwaarder wegen dan de andere. Een algoritme is niet nieuw, wiskundigen maken hier al eeuwenlang gebruik van. De Perziër al-Chwarizmi, die leefde rond 800, staat bekend als de eerste gebruiker van het algoritme.

Hoe werkt een algoritme?

Je kunt een algoritme vergelijken met een recept in de keuken. Stel, je wilt een pizza maken. Dat vraagt bepaalde stappen, die je in de goede volgorde uit moet voeren wil je tot een smaakvol resultaat komen. Die stappen zijn niet altijd dezelfde, want je hebt verschillende soorten pizza’s. Je kunt hetzelfde recept zo tientallen keren toepassen, waarbij je bepaalde stappen af en toe wijzigt door bijvoorbeeld in plaats van salami voor ham te kiezen. Een recept, hoe goed ook, is bij de uitvoering van de stappen daarom afhankelijk van iemand anders. Dat is bij een algoritme niet anders. Het algoritme kan dus nog zo goed zijn, als de computer die de stappen uitvoert niet deugt, volgt een verkeerde uitkomst. Een algoritme zou je daarom kunnen zien als de oplossing van een probleem, een computerprogramma als de uitvoerder hiervan.

Doordat computers steeds sneller en beter worden, is het mogelijk steeds meer stappen door een computer te laten uitvoeren. Dit zorgt voor steeds complexere algoritmes. Een algoritme kan zelflerend gemaakt worden. Zo’n algoritme is in staat zelf te leren van goede en foute stappen. Een dergelijk algoritme maakt gebruik van kunstmatige intelligentie. Het onderzoeksveld dat zich met zelflerende algoritmen bezighoudt heet machine-learning of deep-learning.

Wie maakt gebruik van algoritmen?

De bekendste toepassers van het algoritme zijn Google, Twitter, YouTube en Facebook. Zoek je iets op Google, dan zorgt een algoritme ervoor dat de goede resultaten boven komen drijven. De uitkomst verschilt echter nogal eens. Typ ‘Ajax’ in de zoekbalk en Google zorgt ervoor dat een bekende Amsterdamse voetbalclub bovenaan staat in de resultaten, als je tenminste vaker op voetbalwebsites kijkt. Neus je echter geregeld rond op websites over Griekse mythologie of schoonmaakmiddelen, dan komt er iets anders bovenaan te staan. Dit lijkt automatisch te gebeuren, maar Google dankt dit aan jouw zoekgeschiedenis. Facebook werkt op dezelfde manier. Een algoritme zorgt ervoor dat boven aan je tijdlijn iets komt te staan dat je hoogstwaarschijnlijk interesseert, doordat je hier al eerder blijk van gaf. Deze data zijn voor de genoemde bedrijven onmisbaar. Want dankzij jouw gegevens is het voor de vier giganten mogelijk een razendsnelle selectie te maken uit de verzameling data waarover ze beschikken. Dit heet datamining.

Dit proces wordt veel vaker toegepast. Je kunt met een hoeveelheid data die groot genoeg is (vaak aangeduid als big data) ook voorspellingen doen. De politie in Amsterdam maakt hiervan gebruik en probeert zo inbraken te voorspellen. Een heel andere toepassing is het algoritme dat muzikant en computerwetenschapper Pierre Barreau ontwierp. Zelflerend algoritme Aiva componeert muziek. Dit doet ze met behulp van de vijftienduizend partituren waarmee Barreau haar voerde.

Dankzij deze data is Aiva in staat patronen en ritme te ontdekken en dit om te zetten in wiskundige formules. Je kunt de computer waarop het algoritme draait een opdracht geven, zoals ‘ik wil een nummer dat twee minuten duurt met een climax rond de anderhalve minuut’ en Aiva gaat aan de slag.

Waar is een algoritme goed voor?

Een algoritme kan in een grote hoeveelheid data patronen ontdekken die geen mens ooit zou zien, schrijft wetenschapper Jaap-Henk Hoepman in een column in het Financieele Dagblad.

Een algoritme dat door een computer wordt uitgevoerd en zelf leert, bespaart ook een hoop tijd, schreef de directeur van Amnesty International Nederland, Eduard Nazarski, deze week in een opiniebijdrage in het Nederlands Dagblad. Ondanks deze voordelen tonen beide heren zich kritisch over het gebruik van algoritmen.

Kleven er ook nadelen aan algoritmen?

‘Algoritmen lijken objectief. Mensen hebben vooroordelen, maar technologie niet, is de gedachte. Helaas is het niet zo eenvoudig. Software (het algoritme, red.) is afhankelijk van de gegevens (de data, red.) die mensen erin stoppen. En die gegevens zijn zo gekleurd als wat.’ Nazarski was er deze week duidelijk over in deze krant: denk niet dat het toepassen van algoritmen neutraal is. Hij haalt hierbij een onderzoek van Kristian Lum en William Isaac aan, waaruit blijkt de Amerikaanse politie aan de hand van algoritmen vooral misdrijven verwacht in buurten waar dit eerder voorkwam. Niet verwonderlijk, want uit deze buurten zijn de meeste data afkomstig. Een blinde vlek, als het aan Nazarski ligt. Hoepman wijst in het Financieele Dagblad op een ander nadeel: niemand kan controleren hoe een algoritme te werk gaat. De computer geeft een bepaalde uitkomst, maar hoe weet je zeker dat de computer er niet naast zit? Hij pleit daarom voor algoritmen die kunnen beargumenteren waarom ze tot een bepaalde beslissing komen.

Bijkomend probleem is volgens Hoepman dat zelflerende algoritmes hun makers soms voor raadsels zetten door stappen te nemen die de ingenieurs zelf niet begrijpen. Dit was het geval toen twee algoritmen van Facebook in augustus 2017 samen begonnen te communiceren in een taal die niemand begreep.

Wiskundige Cathy O’Neil beschrijft in haar boek Weapons of Math Destruction nog drie nadelen. Een algoritme baseert zich op data die uit cijfers bestaan. Ze geeft hierbij het voorbeeld van Caroline Wysocski, een docente uit Washington. Zij werd ontslagen doordat ze slecht scoorde bij de jaarlijkse evaluatie van de gemeente, die daarvoor een algoritme gebruikte. Toetsscores golden hier als data. Het voorval zorgde bij docenten voor een perverse prikkel door foute antwoorden goed te rekenen, want goede cijfers voedden het algoritme met data die niet bedreigend zijn voor hun baan. Een ander nadeel is volgens O’Neil het menu dat de algoritmen van sociale media ons voorschotelen. Dat is nogal veel van hetzelfde. Keer op keer word je bevestigd in je oordeel, doordat Facebook op basis van eerder verkregen data artikelen voor je selecteert waarmee je het hoogstwaarschijnlijk eens bent.

De laatste bedreiging die O’Neil signaleert heeft te maken met de data die een algoritme nodig heeft. Want data zijn macht. Google weet na elke zoekopdracht meer van je en speelt hierop in. Heb je last van financiële zorgen en heb je daar op internet weleens iets over opgezocht? Daar is Google: het algoritme selecteert reclames van dubieuze leningen voor je. Dit werkt volgens O’Neil ongelijkheid in de hand. Zit je in de problemen, dan verleidt het algoritme van Google je tot het vergroten hiervan. <

PDF Print Stuur door

Elke dag onze nieuwsbrief?