In data we trust

Halverwege de zero’s was het vak Quantitative Methods (statistiek en wiskunde) de beul van de opleiding International Business. Het was de eindbaas die verslagen moest worden voordat je aan jaar twee mocht beginnen. Wie faalde moest opnieuw starten, of iets anders gaan doen. Alsof ze toen al door hadden welke cruciale rol het begrijpen van cijfers 15 jaar later zou gaan spelen. Ik herinner me de nachten doorhalen met een studiegenoot, een pot filterkoffie en dartboard voor de pauzes, om samen te blokken voor de laatste herkansing. Een wiskundeknobbel ontbrak bij ons beiden. Ik had ongetwijfeld niet veel hoger dan een 5.5, maar kon wel door. Mijn vriend haalde een 5.4 en vervolgde zijn studie in Amsterdam. Ik ben nu adviseur bij Rijnconsult, hij heeft nu een vooraanstaand bedrijf met 70 medewerkers in Data Sciences. Laatst ging ik eens bij hem langs om te vragen: “Hoeveel moet je nou van data weten, om er ook mee te kunnen werken?”.

Business Intelligence, Data Sciences, Machine Learning, Artificial Intelligence. Je hebt de termen ongetwijfeld wel een keer langs horen komen. Maar hoe ze zich tot elkaar verhouden en hoe ze ons werk en leven gaan beïnvloeden? Geen idee waarschijnlijk. Toch kun je met beperkte kennis al een geanimeerd lunchtafelgesprek voeren over de toekomst. Laten we dat eens proberen.

Het onderzoeksveld dat zich met data bezighoudt (Data Science) bestaat uit grofweg twee onderdelen: een deel dat beschrijft wat er is gebeurd aan de hand van verzamelde data, dit heet Business Intelligence (BI). En een deel dat aan de hand van data probeert te voorspellen wat er gaat gebeuren: Machine Learning (ML). Binnen die disciplines zijn er dan weer twee typen analyses te onderscheiden. BI kan beschrijven wat er is gebeurd (beschrijvend), maar in een stap verder ook uitleggen waarom het is gebeurd (diagnostisch). ML kan aan de ene kant voorspellen wat er zou kunnen gebeuren (voorspellend), maar ook een actie aanbevelen op basis van een voorspelling (voorschrijvend). Door de ontwikkeling van computerkracht hebben de mogelijkheden van ML de laatste jaren een reuzensprong gemaakt. Hield mijn iTunes in 2005 alleen nog bij hoe vaak ik een nummer had afgespeeld, inmiddels kan Spotify op basis van mijn luistergedrag liedjes voorstellen van artiesten waar ik nog nooit van heb gehoord. Om als gemeente met data aan de slag te gaan hoef je niet meteen de voorspellende algoritmes van Spotify te kunnen bouwen. Maar als je weet wat BI en ML zijn, dan kun je al snel zien waar er een gemist kans ligt én wat over grofweg 10 jaar een grote uitdaging wordt.

Kans

Gemeenten zitten op een enorme berg met ruwe data. Vaak nog ongewassen en te onoverzichtelijk om direct iets van te kunnen leren. Maar een goede data scientist kan zonder heel veel moeite hier een interessant dashboard van maken, waardoor we betere, goed geïnformeerde besluiten kunnen nemen.

Uitdaging

Zolang we zelf enigszins snappen waar de inzichten uit de data vandaan komen, is het makkelijk om ze te volgen. We koppelen dit aan onze eigen intuïtie en jarenlange ervaring en varen er blind op. Maar wat als dataprogramma’s zo ingewikkeld worden dat ze niet alleen uitkomsten voorspellen die wij niet voorzien hebben, maar dat we ook niet meer begrijpen waarop ze gebaseerd zijn? Als we dus de stap maken van Business Intelligence naar Machine Learning? Aspirant studenten worden dan niet toegelaten op een studie omdat hun profiel minder kans van slagen heeft. Een gezin krijgt een sociale huurwoning niet toegewezen omdat dit een negatief effect op de wijk heeft. Ga dat als gemeentemedewerker maar eens uitleggen. Little Britain’s “Computer says no”-sketch zou dan wel eens dagelijkse realiteit kunnen worden. Nu al wordt er bij het schrijven van de algoritme vaak rekening gehouden met de uitlegbaarheid van de uitkomst. Zelfs als dat betekent dat er op functionaliteit wordt ingeleverd.

We kunnen dus al veel meer dan dat we gebruiken. Misschien is het dan ook niet de vraag ‘hoeveel we van data moeten weten om ermee te kunnen werken’, maar meer hoe comfortabel we zijn in het ‘niet weten’. Durven we als medewerker, manager en inwoner erop te vertrouwen dat de waarheid in het algoritme ligt, en niet bij onze kennis en ervaring? Dan wordt het managen van vertrouwen de échte uitdaging.

 

Auteur: Dio Simmelink