1 00:00:04,268 --> 00:00:09,633 Goedemiddag, welkom bij dit webinar over datagedreven werken voor beleid. 2 00:00:09,733 --> 00:00:13,468 Mijn naam is Ruben Dood. Ik werk bij het Centraal Bureau voor de Statistiek. 3 00:00:13,568 --> 00:00:16,200 Ik ben directeur beleidsstatistiek en dataservices. 4 00:00:16,300 --> 00:00:20,333 Ik hou me dagelijks veel bezig met het ondersteunen 5 00:00:20,433 --> 00:00:24,868 van met name overheden op het gebied van data voor beleid. 6 00:00:24,968 --> 00:00:27,368 Ik vind het leuk om vandaag iets te vertellen 7 00:00:27,468 --> 00:00:32,068 over het werken met data voor het maken van beleid. 8 00:00:32,168 --> 00:00:35,268 Ik heb een paar onderwerpen waar ik het graag over wil hebben. 9 00:00:35,368 --> 00:00:37,900 Eerst een stukje over het CBS. 10 00:00:38,000 --> 00:00:41,068 Het is belangrijk om een beetje te weten wat het CBS is, 11 00:00:41,168 --> 00:00:44,068 welke data wij in huis hebben en wat je er wel en niet mee kan doen, 12 00:00:44,168 --> 00:00:47,368 om ook te weten hoe het datalandschap in Nederland in elkaar zit. 13 00:00:47,468 --> 00:00:49,868 Daarna kijk ik aan de hand van een voorbeeld 14 00:00:49,968 --> 00:00:53,968 hoe je datagedreven werken in beleidspraktijk kunt toepassen. 15 00:00:54,068 --> 00:00:56,300 Daarna aandacht voor wat je nodig hebt 16 00:00:56,400 --> 00:00:59,868 om in je eigen organisatie datagedreven te kunnen werken, 17 00:00:59,968 --> 00:01:04,700 en uiteraard is data gedreven werken niet altijd fantastisch. Er zijn ook valkuilen. 18 00:01:04,800 --> 00:01:06,733 Daar wil ik ook aandacht aan besteden. 19 00:01:06,833 --> 00:01:10,133 En op het eind zal ik aangeven waar je hulp kunt krijgen 20 00:01:10,233 --> 00:01:12,933 als je zelf wil beginnen met datagedreven werken. 21 00:01:14,168 --> 00:01:18,933 Eerst het stukje over het CBS en datagedreven werken. 22 00:01:19,033 --> 00:01:20,968 Dit is de missie van het CBS: 23 00:01:21,068 --> 00:01:25,268 het publiceren van betrouwbare samenhangende statistische informatie 24 00:01:25,368 --> 00:01:29,068 die inspeelt op de behoefte van de samenleving. 25 00:01:29,168 --> 00:01:31,468 'Betrouwbaar' is het sleutelwoord. 26 00:01:31,568 --> 00:01:34,268 Dat betekent niet alleen dat je het moet geloven, 27 00:01:34,368 --> 00:01:38,568 maar ook dat het van hoge kwaliteit moet zijn en altijd onafhankelijk. 28 00:01:38,668 --> 00:01:42,933 De cijfers van het CBS worden niet gekleurd door enige politieke stroming 29 00:01:43,033 --> 00:01:46,433 of beïnvloeding vanuit bestuurlijke of politieke lagen. 30 00:01:46,533 --> 00:01:49,300 Het gaat om wat er feitelijk gebeurt 31 00:01:49,400 --> 00:01:53,333 en als je niet weet wat er gebeurt in de samenleving en economie, 32 00:01:53,433 --> 00:01:55,700 kan je ook niet sturen op de realiteit. 33 00:01:55,800 --> 00:01:59,533 Daarom is een rol van het CBS in de samenleving 34 00:01:59,633 --> 00:02:02,868 en voor politiek en beleid belangrijk. 35 00:02:04,668 --> 00:02:08,268 De kerntaak van het CBS laat zich omschrijven in de plaatjes. 36 00:02:08,368 --> 00:02:11,333 Je ziet hier twee afbeeldingen van de realiteit. 37 00:02:11,433 --> 00:02:15,968 Boven een zwembad met bezoekers, daaronder iets te eten. 38 00:02:16,068 --> 00:02:19,500 Dit zijn beelden zoals je die in de praktijk kan tegenkomen. 39 00:02:19,600 --> 00:02:21,733 Wat het CBS daarvan maakt, is dit: 40 00:02:21,833 --> 00:02:28,800 nette, gestroomlijnde, overzichtelijke plaatjes, grafieken, tabellen 41 00:02:28,900 --> 00:02:32,268 waarin je kan tellen wat er in deze situatie gebeurt. 42 00:02:32,368 --> 00:02:35,033 Je ziet om hoeveel frietjes het gaat, hoeveel ketchup, 43 00:02:35,133 --> 00:02:37,968 hoeveel parasols, zelfs met een kleurverdeling. 44 00:02:38,068 --> 00:02:40,900 Je ziet hoeveel mensen er bij het zwembad zijn geweest. 45 00:02:41,000 --> 00:02:42,768 Dit is wat wij doen als CBS. 46 00:02:42,868 --> 00:02:48,268 We pakken uiterst privacygevoelige informatie uit de dagelijkse praktijk 47 00:02:48,368 --> 00:02:52,268 en maken daar statistieken van die inzicht geven in die praktijk, 48 00:02:52,368 --> 00:02:56,300 maar wel in de vorm van veilige informatie. 49 00:02:56,400 --> 00:02:59,200 Ik wil gelijk beginnen met de eerste pollvraag, 50 00:02:59,300 --> 00:03:02,500 want ik leg zo meteen uit wat gaan wat we met al die data doen. 51 00:03:02,600 --> 00:03:06,368 Maar ik ben benieuwd hoe u het CBS ervaart. 52 00:03:06,468 --> 00:03:09,000 Wat weet u van het CBS? 53 00:03:09,100 --> 00:03:11,668 Als het goed is, heeft u nu de pollvraag in beeld 54 00:03:11,768 --> 00:03:14,500 en kunt u daar antwoord op geven. 55 00:03:14,600 --> 00:03:17,933 Ik zie een aantal antwoorden binnenkomen. 56 00:03:22,100 --> 00:03:24,833 Ik zie... Nu wordt het... 57 00:03:24,933 --> 00:03:28,468 Ik zie een duidelijk patroon ontstaan, dus hartelijk dank daarvoor. 58 00:03:28,568 --> 00:03:33,933 Ik zal het nu weer stopzetten en de resultaten laten zien. 59 00:03:34,033 --> 00:03:36,400 Als goed is, heeft u nu de resultaten in beeld. 60 00:03:36,500 --> 00:03:39,400 U kent ons als dataleverancier, cijferfabriek, 61 00:03:39,500 --> 00:03:42,500 dataknooppunt en niets anders. Dat is ook wel logisch, 62 00:03:42,600 --> 00:03:46,768 want de kerntaken van het CBS zijn ook ongeveer die drie. 63 00:03:47,833 --> 00:03:50,500 De manier waarop het CBS werkt: 64 00:03:50,600 --> 00:03:53,533 Om een beeld te maken van de samenleving en de economie 65 00:03:53,633 --> 00:03:57,900 verzamelen wij heel veel data, enorm veel data. 66 00:03:58,000 --> 00:04:03,433 Bijna alle bestanden, administraties en registraties die bij de overheid bestaan 67 00:04:03,533 --> 00:04:06,433 zijn ook beschikbaar voor het CBS. 68 00:04:06,533 --> 00:04:10,068 Ik heb daar een plaatje van. Waarschijnlijk niet leesbaar, 69 00:04:10,168 --> 00:04:15,633 dus ik zal een klein stukje in het rode vierkant uitlichten wat wel leesbaar is. 70 00:04:15,733 --> 00:04:19,833 Om even een beeld te geven van het type informatie dat wij in huis hebben. 71 00:04:19,933 --> 00:04:23,200 Registraties en administraties betekent ook 72 00:04:23,300 --> 00:04:25,600 een 100 procent dekking van alle Nederlanders, 73 00:04:25,700 --> 00:04:30,533 alle Nederlandse huishoudens, alle Nederlandse adressen, alle bedrijven. 74 00:04:30,633 --> 00:04:33,568 Dit betekent dat het CBS veel minder hoeft te enquêteren. 75 00:04:33,668 --> 00:04:35,068 In de landen om ons heen 76 00:04:35,168 --> 00:04:37,833 wordt informatie voornamelijk verzameld via enquêtes. 77 00:04:37,933 --> 00:04:40,533 Dan krijg je een beeld van een klein deel van de bevolking. 78 00:04:40,633 --> 00:04:43,233 Op basis daarvan kan je het totaal schatten. 79 00:04:43,333 --> 00:04:47,468 We hebben gewoon direct inzicht in de totale bevolking. 80 00:04:47,568 --> 00:04:49,668 Dat is niet alleen efficiënter en goedkoper 81 00:04:49,768 --> 00:04:53,900 en zorgt ook voor veel minder overlast voor burgers en bedrijfsleven, 82 00:04:54,000 --> 00:04:56,668 maar het betekent ook dat je veel meer met die data kan doen, 83 00:04:56,768 --> 00:04:59,800 omdat je een completer beeld kan schetsen. 84 00:04:59,900 --> 00:05:04,900 Even een voorbeeld hoe wij met die data omgaan als die bij ons binnenkomt. 85 00:05:05,000 --> 00:05:06,933 Dat is uiterst privacygevoelige data. 86 00:05:07,033 --> 00:05:10,868 Er staat bijvoorbeeld een BSN in, een naam, adres, geboortedatum. 87 00:05:10,968 --> 00:05:13,468 Daarmee kun je onmiddellijk iemand herkennen. 88 00:05:13,568 --> 00:05:18,433 Als die informatie bij ons binnenkomt, wordt die direct identificerende data, 89 00:05:18,533 --> 00:05:22,068 de direct identificerende variabele, eraf gehaald 90 00:05:22,168 --> 00:05:26,968 en vervangen door wat we een 'record identification number' noemen, een RIN. 91 00:05:27,068 --> 00:05:30,768 Dat kan een persoon zijn, maar bijvoorbeeld ook een adres, 92 00:05:30,868 --> 00:05:35,933 een huishouden, een KvK-nummer, een leerlingnummer, et cetera. 93 00:05:36,033 --> 00:05:39,933 Die RIN is de kern van de dataverzameling 94 00:05:40,033 --> 00:05:43,800 en daaraan koppelen wij als het ware een soort bloemblaadjes. 95 00:05:43,900 --> 00:05:46,933 Telkens verschillende onderwerpen van data. 96 00:05:47,033 --> 00:05:49,700 Het kan over allerlei onderwerpen gaan. 97 00:05:49,800 --> 00:05:53,568 Om daar een indruk van te geven: stel dat we beginnen met een persoon, 98 00:05:53,668 --> 00:05:57,368 hier in het midden afgebeeld, als we informatie over een persoon hebben: 99 00:05:57,468 --> 00:06:00,268 dat is dan dus meneer X, want we weten niet wie het is. 100 00:06:00,368 --> 00:06:03,700 Het is alleen maar bekend met een RIN. 101 00:06:05,800 --> 00:06:08,000 We weten niet precies wie die persoon is. 102 00:06:08,100 --> 00:06:10,868 Maar we weten wel in welk huishouden hij woont 103 00:06:10,968 --> 00:06:14,400 en daarmee ook welke andere personen, die wij ook niet bij naam kennen, 104 00:06:14,500 --> 00:06:16,500 nog meer in dat huishouden wonen. 105 00:06:16,600 --> 00:06:19,300 Van die persoon weten we ook het adres. 106 00:06:19,400 --> 00:06:23,400 Als je eenmaal het adres weet, weet je ook wat voor gebouw er staat, 107 00:06:23,500 --> 00:06:28,168 wat het energiegebruik is van het gebouw en in welke wijk dat gebouw staat. 108 00:06:28,268 --> 00:06:31,033 En daarmee ook weer veel informatie over die wijk. 109 00:06:31,133 --> 00:06:35,233 Wat zijn bijvoorbeeld de leefbaarheids- cijfers, criminaliteitscijfers? 110 00:06:35,333 --> 00:06:39,733 Het gemiddelde van de totale bewoners in die wijk op bepaalde vlakken. 111 00:06:39,833 --> 00:06:44,068 Als je een persoon in beeld hebt, kun je ook de ouders en de kinderen bepalen. 112 00:06:44,168 --> 00:06:46,733 Daarmee kan je ook familieverbanden bepalen, 113 00:06:46,833 --> 00:06:49,700 wat ook handig is voor allerlei statistieken. 114 00:06:49,800 --> 00:06:52,700 Maar denk ook aan: is iemand hoog- of laagopgeleid? 115 00:06:52,800 --> 00:06:54,800 Wat voor opleiding heeft hij of zij gehad? 116 00:06:54,900 --> 00:06:57,433 En zo kun je verder gaan met tal van onderwerpen 117 00:06:57,533 --> 00:07:00,368 die allemaal aan die ene persoon te koppelen zijn. 118 00:07:00,468 --> 00:07:04,868 Onderaan heb ik het dienstverband gezet, de persoon zou ergens kunnen werken. 119 00:07:04,968 --> 00:07:09,700 Bij een bedrijf of overheidsorganisatie, maar laten we zeggen, een bedrijf. 120 00:07:09,800 --> 00:07:12,468 Daarvan weten we ook weer wat het produceert 121 00:07:12,568 --> 00:07:17,533 of het importeert en exporteert, welke belasting wordt betaald, et cetera. 122 00:07:17,633 --> 00:07:20,068 Zo is een vrij compleet plaatje te schetsen 123 00:07:20,168 --> 00:07:23,100 en er zijn dus nog tientallen andere verbanden mogelijk 124 00:07:23,200 --> 00:07:26,700 in de vele duizenden administraties en registraties. 125 00:07:29,168 --> 00:07:31,568 Het is bovendien handig dat we niet alleen de data 126 00:07:31,668 --> 00:07:34,933 over bijvoorbeeld 2019 hebben, het afgelopen jaar, 127 00:07:35,033 --> 00:07:41,800 maar ook de data over 2018, 2017, 2016 en uiteraard nog langer terug. 128 00:07:41,900 --> 00:07:44,768 Het is niet alleen mogelijk om een beeld van nu te schetsen, 129 00:07:44,868 --> 00:07:46,733 maar ook terug te kijken in de tijd 130 00:07:46,833 --> 00:07:50,533 en op die manier trends en dergelijke ook te kunnen herkennen. 131 00:07:51,968 --> 00:07:54,600 Met behulp van die data maken wij dus statistieken. 132 00:07:54,700 --> 00:07:58,868 Die statistieken publiceren wij, openbaar beschikbaar voor iedereen. 133 00:07:58,968 --> 00:08:03,033 Die kun je raadplegen op Statline in de vorm van tabellen. 134 00:08:03,133 --> 00:08:05,768 Zo'n tabel is een view, 135 00:08:05,868 --> 00:08:09,668 zoals wij denken dat mensen graag naar de data kijken. 136 00:08:09,768 --> 00:08:13,100 Je kunt ook zelf selecteren welke jaartallen je wil zien. 137 00:08:13,200 --> 00:08:16,100 Of welke onderwerpen. Welke regio. 138 00:08:16,200 --> 00:08:19,968 En zo zijn duizenden tabellen te raadplegen. 139 00:08:20,068 --> 00:08:22,933 Een tabel kan je ook weergeven in de vorm van een grafiek 140 00:08:23,033 --> 00:08:25,400 om daarmee zelf trends te bekijken. 141 00:08:25,500 --> 00:08:28,733 Maar eigenlijk blijven dit een soort customized views 142 00:08:28,833 --> 00:08:32,268 op een veel grotere open dataset die erachter ligt. 143 00:08:32,368 --> 00:08:37,468 Die open dataset is ook beschikbaar via het kanaal Open Data van het CBS. 144 00:08:37,568 --> 00:08:40,733 Daar zijn al die achterliggende statistische tabellen, 145 00:08:40,833 --> 00:08:44,500 met veilige informatie die iedereen kan worden gebruikt, beschikbaar. 146 00:08:44,600 --> 00:08:47,268 Die informatie is ook geautomatiseerd te gebruiken. 147 00:08:47,368 --> 00:08:51,400 Je zou hier met eigen apps via een application programming interface 148 00:08:51,500 --> 00:08:55,800 overzichten kunnen maken die op jouw manier specifiek naar de data kijkt, 149 00:08:55,900 --> 00:08:57,233 zoals het voor jou nodig is 150 00:08:57,333 --> 00:09:01,433 en het automatisch laten updaten zodra een nieuwe informatie binnen is. 151 00:09:07,068 --> 00:09:11,400 Wij zijn het officiële statistiekenkanaal van de Nederlandse overheid. 152 00:09:11,500 --> 00:09:13,633 We maken een zo compleet mogelijk beeld 153 00:09:13,733 --> 00:09:15,768 van de samenleving en de economie. 154 00:09:15,868 --> 00:09:20,800 Het grootste gedeelte is vastgesteld in een Europees programma. 155 00:09:20,900 --> 00:09:26,568 Denk aan werkloosheidscijfers, het BNP. 156 00:09:26,668 --> 00:09:29,000 Dit totale pakket van Europese statistieken 157 00:09:29,100 --> 00:09:31,433 is in elk Europees land hetzelfde. 158 00:09:31,533 --> 00:09:36,000 Dat is vanzelfsprekend omdat je wil dat Frankrijk vergelijkbaar is met Duitsland 159 00:09:36,100 --> 00:09:39,268 en Nederland vergelijkbaar is met België, et cetera. 160 00:09:39,368 --> 00:09:43,300 Dus je hebt een vaste manier waarop die statistieken worden gemaakt. 161 00:09:43,400 --> 00:09:47,268 Maar met die enorme schat aan data die we bij ons binnen hebben, 162 00:09:47,368 --> 00:09:52,168 is nog veel meer mogelijk dan alleen het pakket van vastgestelde statistieken. 163 00:09:52,268 --> 00:09:55,700 Dat noemen we aanvullende statistische dienstverleningen. 164 00:09:57,433 --> 00:10:01,000 Het CBS is namelijk hét statistiekbureau van de Nederlandse overheid. 165 00:10:01,100 --> 00:10:04,900 Dit betekent dat alle overheden een beroep op het CBS moeten kunnen doen 166 00:10:05,000 --> 00:10:08,368 voor aanvullende statistische dienstverlening. 167 00:10:08,468 --> 00:10:12,100 We leveren maatwerk statistieken over een specifiek onderwerp, 168 00:10:12,200 --> 00:10:15,400 bijvoorbeeld voor een ministerie of een gemeente, 169 00:10:15,500 --> 00:10:19,700 voor het beleidsdoel waar ze op dat moment mee bezig zijn, van belang is. 170 00:10:21,033 --> 00:10:23,400 Daar gelden wel bepaalde regels voor. 171 00:10:23,500 --> 00:10:27,133 Zo gaan we er zelden toe over om nieuwe databronnen te verzamelen, 172 00:10:27,233 --> 00:10:31,768 het moet additioneel zijn. We moeten de data al min of meer in huis hebben 173 00:10:31,868 --> 00:10:35,168 om een nieuwe matrixstatistiek te kunnen maken. 174 00:10:35,268 --> 00:10:38,833 Het niet wordt betaald uit het vaste pro- gramma, maar moet wel betaald worden. 175 00:10:38,933 --> 00:10:43,200 De extra uren die wij hierin stoppen, moeten we vergoed krijgen. 176 00:10:43,300 --> 00:10:47,200 Dus het is wel betaald, maar er is geen winstoogmerk. 177 00:10:47,300 --> 00:10:50,500 Daarnaast heeft CBS een aantal beperkingen in wat we mogen doen. 178 00:10:50,600 --> 00:10:54,600 We doen geen prognose of voorspelling, behalve op het gebied van bevolking, 179 00:10:54,700 --> 00:10:57,133 en ook geen inhoudelijke beleidsuitspraken. 180 00:10:57,233 --> 00:11:00,833 We zullen niet snel zeggen: 'Dit beleid heeft gewerkt, want' 181 00:11:00,933 --> 00:11:04,233 en we zullen ook niet zeggen: 'Als je hiernaartoe wil, 182 00:11:04,333 --> 00:11:07,168 is dit het type beleid dat je zou moeten maken.' 183 00:11:07,268 --> 00:11:11,100 Daarnaast is het belangrijk dat we alle resultaten van de matrixstatistieken 184 00:11:11,200 --> 00:11:14,568 publiceren op het moment dat we het ook aanleveren 185 00:11:14,668 --> 00:11:18,400 aan de partij, bijvoorbeeld een ministerie of provincie. 186 00:11:18,500 --> 00:11:21,433 Als we het aanleveren komt ook op de website van het CBS 187 00:11:21,533 --> 00:11:24,133 en is het voor iedereen gelijktijdig beschikbaar. 188 00:11:24,233 --> 00:11:27,200 Daarnaast geldt ook dat er exact dezelfde normen gelden 189 00:11:27,300 --> 00:11:29,400 als voor onze normale statistieken. 190 00:11:29,500 --> 00:11:34,268 Onafhankelijkheid, betrouwbaarheid en een zeer hoge kwaliteit. 191 00:11:34,368 --> 00:11:37,200 Het is ook een officiële Nederlandse statistiek, 192 00:11:37,300 --> 00:11:40,100 zij het dat die niet in opdracht is gemaakt van de EU, 193 00:11:40,200 --> 00:11:44,933 maar van een ministerie of een provincie of een gemeente in het eigen land. 194 00:11:53,000 --> 00:11:56,800 We zien een aantal trends in het gebruik van data. 195 00:11:56,900 --> 00:12:00,468 Er is op dit moment meer data beschikbaar dan ooit tevoren. 196 00:12:00,568 --> 00:12:03,600 Die is bovendien van een enorm hoge kwaliteit. 197 00:12:03,700 --> 00:12:07,533 Door de 100 procent dekking hebben we ook meer mogelijkheden dan ooit 198 00:12:07,633 --> 00:12:09,368 om die data te gebruiken. 199 00:12:09,468 --> 00:12:13,200 Toch zien we dat die data nog niet optimaal wordt gebruikt. 200 00:12:13,300 --> 00:12:16,533 We zien wel veel toepassingen van datagedreven werken. 201 00:12:16,633 --> 00:12:20,868 Ook vaak zo vanzelfsprekend dat het mensen niet meer opvalt. 202 00:12:20,968 --> 00:12:23,168 Denk aan iemand die bij de gemeente komt 203 00:12:23,268 --> 00:12:27,400 en moet worden geholpen om al dan niet gebruik te maken van een regeling. 204 00:12:27,500 --> 00:12:31,068 Op dit moment is er veel data beschikbaar over die persoon 205 00:12:31,168 --> 00:12:35,133 die de gemeente helpt om de dienstverlening te optimaliseren. 206 00:12:35,233 --> 00:12:39,868 Denk ook aan een belastingformulier dat bijna volledig ingevuld op de mat valt. 207 00:12:39,968 --> 00:12:42,568 Dat is data die de Belastingdienst ter beschikking heeft 208 00:12:42,668 --> 00:12:46,500 om het de burger makkelijk te maken zo'n formulier goed in te vullen. 209 00:12:46,600 --> 00:12:48,700 Schoolvoorbeeld van datagedreven werken. 210 00:12:48,800 --> 00:12:53,368 Of het aansturen van dynamische route- informatiepanelen boven de weg 211 00:12:53,468 --> 00:12:54,933 vanuit verkeerscentrales. 212 00:12:55,033 --> 00:12:58,533 Of het al dan niet sluiten van de Oosterscheldekering, 213 00:12:58,633 --> 00:13:04,768 waar heel veel informatie in gaat over het weer, golfhoogte, windrichting. 214 00:13:04,868 --> 00:13:07,468 Maar ook de volkstelling die we Nederland doen. 215 00:13:07,568 --> 00:13:11,300 In de landen om ons heen waar statistiek- bureaus nog veel met enquêtes werken, 216 00:13:11,400 --> 00:13:15,200 wordt elke tien jaar een volkstelling gedaan door een leger mensen 217 00:13:15,300 --> 00:13:19,900 van deur naar deur te sturen en vragen te laten stellen aan bewoners. 218 00:13:20,000 --> 00:13:23,168 In Nederland kunnen we die volkstelling helemaal digitaal doen. 219 00:13:23,268 --> 00:13:26,233 Ontzettend veel sneller, duizenden malen goedkoper. 220 00:13:26,333 --> 00:13:30,933 Heel efficiënt en het zorgt voor veel minder overlast voor burgers en bedrijven. 221 00:13:31,033 --> 00:13:33,468 Allemaal voorbeelden van datagedreven werken 222 00:13:33,568 --> 00:13:37,433 die we misschien zo vanzelfsprekend vinden dat we ze niet eens meer zien. 223 00:13:37,533 --> 00:13:39,768 Tegelijkertijd is het zo dat we merken 224 00:13:39,868 --> 00:13:45,000 dat bij het maken van beleid data nog vaak een ondergeschikte rol speelt. 225 00:13:45,100 --> 00:13:48,000 Daar is er nog een wereld te winnen. 226 00:13:48,100 --> 00:13:51,968 Een reden waarom die optimalisatie nog niet is bereikt: 227 00:13:52,068 --> 00:13:55,033 beleidsmakers zijn zich niet altijd bewust van de mogelijkheden 228 00:13:55,133 --> 00:13:57,668 of van de data die daadwerkelijk aanwezig is. 229 00:13:57,768 --> 00:14:01,200 Uiteraard kost datagedreven werken tijd en daarmee ook geld. 230 00:14:01,300 --> 00:14:04,900 Je moet wel tijd en geld investeren in het doen van het onderzoek 231 00:14:05,000 --> 00:14:07,933 en het presenteren van de resultaten. 232 00:14:08,033 --> 00:14:09,900 Daarnaast geldt bij veel beleid 233 00:14:10,000 --> 00:14:13,468 dat de monitoring en de uitvoering vaak onvoldoende prioriteit hebben, 234 00:14:13,568 --> 00:14:16,300 terwijl monitoring belangrijk is om te kijken 235 00:14:16,400 --> 00:14:19,033 of het beleid ook de gewenste effecten heeft. 236 00:14:21,100 --> 00:14:24,268 We zien dat de afgelopen tijd, sinds de AVG in werking is, 237 00:14:24,368 --> 00:14:27,233 ook een soort AVG-angst is opgetreden. 238 00:14:27,333 --> 00:14:29,168 Ik noem het maar even zo. 239 00:14:29,268 --> 00:14:32,433 Die werkt nogal verlammend op overheidsorganisaties. 240 00:14:32,533 --> 00:14:36,133 In realiteit is er weinig reden om bang te zijn voor de AVG. 241 00:14:36,233 --> 00:14:39,900 Die verschilt niet veel van de Wet bescherming persoonsgegevens 242 00:14:40,000 --> 00:14:42,633 die we daarvoor hadden. Er is één groot verschil, 243 00:14:42,733 --> 00:14:47,368 namelijk op het moment dat je de wet overtreedt, is er sprake van een boete. 244 00:14:47,468 --> 00:14:52,768 Er is nog nooit een boete uitgedeeld, dus die kans is ook niet zo groot. 245 00:14:52,868 --> 00:14:57,500 En als je je gezond verstand gebruikt, komt het echt wel goed met die AVG. 246 00:14:57,600 --> 00:15:00,533 Daarnaast kan het dat de antwoorden die je zoekt 247 00:15:00,633 --> 00:15:03,500 niet zijn wat op een of andere manier politiek gewenst is. 248 00:15:03,600 --> 00:15:06,268 Dat zou potentieel kunnen leiden tot conflicten. 249 00:15:06,368 --> 00:15:10,100 Dat is ook één van de redenen waarom het werken met data in beleid 250 00:15:10,200 --> 00:15:13,100 nog niet helemaal tot volle wasdom komt. 251 00:15:14,733 --> 00:15:18,533 Daarnaast zien we wel dat de belangstel- ling voor datagedreven werken toeneemt. 252 00:15:18,633 --> 00:15:21,268 Bijna alle organisaties waarmee wij contact hebben, 253 00:15:21,368 --> 00:15:24,133 zijn er op een of andere manier actief mee bezig. 254 00:15:24,233 --> 00:15:26,900 Omdat we als CBS graag de maatschappelijke meerwaarde 255 00:15:27,000 --> 00:15:31,200 van de schat aan data willen maximaliseren en optimaliseren, 256 00:15:31,300 --> 00:15:35,700 werken we actief mee en ondersteunen wij meer datagedreven werken, 257 00:15:35,800 --> 00:15:39,568 zeker voor beleid in alle overheidsgeledingen. 258 00:15:39,668 --> 00:15:43,133 Tot zover het stukje over het CBS. 259 00:15:43,233 --> 00:15:46,033 Dan nu: datagedreven werken in de beleidspraktijk. 260 00:15:46,133 --> 00:15:48,233 Ik zal proberen aan de hand van een voorbeeld 261 00:15:48,333 --> 00:15:51,668 daar wat aandacht aan te besteden. 262 00:15:51,768 --> 00:15:55,433 Ik heb eerst een pollvraag en terwijl jullie die invullen, 263 00:15:55,533 --> 00:16:00,400 kijk ik of ik antwoord kan geven op een vraag die ik op mijn scherm zien staan. 264 00:16:00,500 --> 00:16:03,333 Ik zie een vraag van Elaine: 'Hoe kom ik snel te weten 265 00:16:03,433 --> 00:16:06,800 of er relevante data op mijn beleidsterrein bestaat?' 266 00:16:06,900 --> 00:16:10,000 Je zou bijvoorbeeld kunnen kijken op de site van het CBS 267 00:16:10,100 --> 00:16:15,200 en dan zoeken op het thema waar jouw beleid over gaat 268 00:16:15,300 --> 00:16:18,968 en kijken of er al open data en statistieken zijn op die data. 269 00:16:19,068 --> 00:16:22,168 Als er nog geen statistieken of open data zijn, 270 00:16:22,268 --> 00:16:26,133 kun je ervan uitgaan dat er weinig informatie op dat terrein beschikbaar is. 271 00:16:26,233 --> 00:16:30,568 Er zijn nog steeds, ook voor het CBS, witte vlekken helaas. 272 00:16:30,668 --> 00:16:33,700 Een andere vraag van Agnes: 273 00:16:33,800 --> 00:16:36,068 'Wat doen jullie om de inzichten uit onderzoek 274 00:16:36,168 --> 00:16:39,933 meer onder de aandacht te brengen van organisaties en potentiële doelgroepen? 275 00:16:40,033 --> 00:16:44,468 Ik zal daar zo meteen een paar voorbeelden voor geven, 276 00:16:44,568 --> 00:16:47,768 maar één van de dingen is een zo laagdrempelig mogelijke communicatie 277 00:16:47,868 --> 00:16:49,368 van de gegevens, op zo'n manier 278 00:16:49,468 --> 00:16:52,000 dat het voor iedereen begrijpelijk is wat we hebben 279 00:16:52,100 --> 00:16:55,633 en wat de resultaten van de statistieken zijn. 280 00:16:55,733 --> 00:17:00,500 Ik zie dat de poll inmiddels bijna volledig is ingevuld. 281 00:17:00,600 --> 00:17:03,668 Hoe datagedreven is je organisatie momenteel? 282 00:17:03,768 --> 00:17:07,668 Als het goed is, zijn de resultaten nu te zien in het scherm. 283 00:17:07,768 --> 00:17:10,533 Een ruime meerderheid voor 'beginfase en ontwikkelend' 284 00:17:10,633 --> 00:17:13,633 en tien procent zegt dat datagedreven al volwassen is 285 00:17:13,733 --> 00:17:17,100 in de beleidspraktijk van de eigen organisatie. 286 00:17:17,200 --> 00:17:19,700 Dat is hoopgevend. Het is goed om te zien 287 00:17:19,800 --> 00:17:22,368 dat al veel organisaties ermee bezig zijn 288 00:17:22,468 --> 00:17:26,500 of in de afgelopen tijd mee bezig zijn geweest. 289 00:17:26,600 --> 00:17:31,633 Waarom zou je eigenlijk willen gaan werken met data in de beleidspraktijk? 290 00:17:31,733 --> 00:17:35,033 Eén van de redenen waarom je zeker met data moet gaan werken 291 00:17:35,133 --> 00:17:37,268 in de ogen van het CBS, in mijn ogen, 292 00:17:37,368 --> 00:17:41,900 is omdat je altijd een soort tegenstelling krijgt tussen onderbuik en feiten. 293 00:17:42,000 --> 00:17:44,968 De onderbuik geeft aan dat er een probleem is 294 00:17:45,068 --> 00:17:49,368 waar een oplossing voor moet komen. De feiten geven aan wat het probleem is. 295 00:17:49,468 --> 00:17:52,433 Het is een combinatie van allebei. Het is niet een of-of, 296 00:17:52,533 --> 00:17:56,033 maar je moet beiden verenigen. Je moet zowel voelen dat er een probleem is 297 00:17:56,133 --> 00:17:59,233 als bepalen wat het probleem precies is. 298 00:17:59,333 --> 00:18:02,200 Daarnaast is het belangrijk dat je de juiste besluiten neemt. 299 00:18:02,300 --> 00:18:06,468 Als je niet op basis van de realiteit een beleid formuleert, 300 00:18:06,568 --> 00:18:09,133 neem je waarschijnlijk onjuiste besluiten. 301 00:18:09,233 --> 00:18:13,233 Dan zul je ook zien dat het beleid niet werkt en dat leidt tot desinvesteringen. 302 00:18:13,333 --> 00:18:17,768 Met datagedreven beleid kun je in principe ook betere besluiten maken. 303 00:18:17,868 --> 00:18:20,568 Daarnaast zien we dat de maatschappelijke opgave... 304 00:18:20,668 --> 00:18:24,733 complexer en veelzijdiger wordt en er ook steeds meer disciplines betrokken zijn. 305 00:18:24,833 --> 00:18:27,868 Dat betekent dat je steeds meer het gevaar krijgt 306 00:18:27,968 --> 00:18:30,533 dat mensen een beetje langs elkaar heen praten. 307 00:18:30,633 --> 00:18:34,868 Als je vanuit verschillende disciplines kijkt, is het moeilijk om zeker te weten 308 00:18:34,968 --> 00:18:37,833 dat je allebei het juiste en gelijkluidende beeld hebt. 309 00:18:37,933 --> 00:18:41,700 Ook hier kan het helpen om te werken met een solide basis van feiten 310 00:18:41,800 --> 00:18:46,433 waar je het allemaal over eens bent en die een basis is voor de discussie. 311 00:18:46,533 --> 00:18:49,968 We zien we ook meer dat besluitvorming moet worden verantwoord. 312 00:18:50,068 --> 00:18:52,400 Je moet uitleggen aan het publiek en de media 313 00:18:52,500 --> 00:18:54,533 waarom een bepaald besluit is genomen 314 00:18:54,633 --> 00:18:58,233 en waarom dit in een gegeven geval het juiste besluit was. 315 00:18:58,333 --> 00:19:01,668 Ook daarbij kan het helpen als je op basis van de feitelijke situatie 316 00:19:01,768 --> 00:19:05,100 kunt uitleggen waarom je je besluit hebt genomen. 317 00:19:05,200 --> 00:19:08,968 Daarnaast is het bij de uitvoering belangrijk om te kijken: 318 00:19:09,068 --> 00:19:10,533 werkt het beleid ook? 319 00:19:10,633 --> 00:19:14,633 Zien we nou in de uitvoering, via het monitoringsprogramma, 320 00:19:14,733 --> 00:19:18,900 dat het probleem zich oplost of we een ontwikkeling in de juiste richting zien? 321 00:19:19,000 --> 00:19:21,800 Daarbij is ook belangrijk dat je moeten benchmarken. 322 00:19:21,900 --> 00:19:25,400 Zien we bij een controlegroep, die niet wordt geraakt door het beleid, 323 00:19:25,500 --> 00:19:28,500 een zelfde ontwikkeling, werkt het beleid misschien niet. 324 00:19:28,600 --> 00:19:32,768 Maar zie je een andere ontwikkeling dan in de groep waarop het van toepassing is, 325 00:19:32,868 --> 00:19:37,468 kun je daadwerkelijk constateren dat het beleid kennelijk werkt. 326 00:19:37,568 --> 00:19:41,100 Dan: hoe ga je aan de slag als je datagedreven gaat werken? 327 00:19:41,200 --> 00:19:45,633 Ik zal proberen een voorbeeld te pakken. Dat valt niet mee, 328 00:19:45,733 --> 00:19:49,368 want er zijn veel soorten voorbeelden waarnaar je zou kunnen kijken. 329 00:19:49,468 --> 00:19:53,833 Ik pak een willekeurig voorbeeld. Stel je voor dat we ontdekken 330 00:19:53,933 --> 00:19:57,000 dat er steeds meer gezinnen in de problemen lijken te komen 331 00:19:57,100 --> 00:19:59,933 op financieel gebied, en dat er een soort patroon is 332 00:20:00,033 --> 00:20:06,968 dat die gezinnen in de afgelopen jaren van 150 naar 130, 110 procent 333 00:20:07,068 --> 00:20:10,168 van een bepaald minimum afglijden en op een gegeven moment 334 00:20:10,268 --> 00:20:12,633 in de problemen komen en hulp zoeken. 335 00:20:12,733 --> 00:20:15,468 Op het moment dat we dat vroeg detecteren, 336 00:20:15,568 --> 00:20:19,468 kunnen we proberen te voorkomen dat die gezinnen in de problemen komen 337 00:20:19,568 --> 00:20:22,668 en op die manier waarschijnlijk meer in de preventie kunnen werken 338 00:20:22,768 --> 00:20:24,968 en daarmee bij een nieuwe economische crisis 339 00:20:25,068 --> 00:20:28,368 beter voorbereid kunnen zijn op wat er op ons afkomt aan hulpvragen. 340 00:20:28,468 --> 00:20:31,133 Stel dat dit het probleem is met ongeveer de vraag. 341 00:20:31,233 --> 00:20:34,700 Dat is een brede, vage vraag. 342 00:20:34,800 --> 00:20:39,500 Eén van de eerste dingen die je doet, is een soort definitie bepalen. 343 00:20:39,600 --> 00:20:41,433 'Waar hebben we het dan over?' 344 00:20:41,533 --> 00:20:45,933 Het gaat kennelijk over huishoudens in een negatieve spiraal van inkomen 345 00:20:46,033 --> 00:20:49,233 tot een bepaald minimum. Wat is dat minimum? 346 00:20:49,333 --> 00:20:53,733 Wat is die 100 procent? Hoe definiëren we waar mensen afglijden? 347 00:20:53,833 --> 00:20:57,268 Is dat hetzelfde voor meerpersoons- of eenpersoonshuishoudens? 348 00:20:57,368 --> 00:20:59,668 Is dat hetzelfde in alle delen van het land? 349 00:20:59,768 --> 00:21:02,800 In Amsterdam zijn huur- en koopwoningen aanzienlijk duurder 350 00:21:02,900 --> 00:21:05,933 dan in bijvoorbeeld een regio met bevolkingskrimp. 351 00:21:06,033 --> 00:21:09,233 Moet je overal hetzelfde minimum hanteren? 352 00:21:09,333 --> 00:21:12,833 Stel dat je kijkt naar de afgelopen vijf jaar, 353 00:21:12,933 --> 00:21:16,333 van 150 naar 100 procent, je hebt een mooi minimum bepaald. 354 00:21:16,433 --> 00:21:19,068 Dan ga je kijken: om hoeveel huishoudens gaat het nu? 355 00:21:19,168 --> 00:21:24,433 Het is een enorm verschil of het gaat over 5, 50 of 50.000 huishoudens. 356 00:21:24,533 --> 00:21:28,868 Het type beleid en oplossingen dat je daarvoor genereert is volkomen anders 357 00:21:28,968 --> 00:21:32,900 als de doelgroep een grotere, andere omvang heeft. 358 00:21:33,000 --> 00:21:36,700 Een volgende stap: wie zit er precies in die doelgroep? 359 00:21:36,800 --> 00:21:39,568 Om wat voor soort huishoudens gaat het hier? 360 00:21:39,668 --> 00:21:43,700 Is het merendeel meerpersoonshuis- houdens? En hoeveel personen dan? 361 00:21:43,800 --> 00:21:46,500 Of juist voor het merendeel eenpersoonshuishoudens? 362 00:21:46,600 --> 00:21:49,100 Wat is het gemiddelde inkomen in dat huishouden 363 00:21:49,200 --> 00:21:54,533 en waar komt dat inkomen vandaan? Is dat uit een sociale ondersteuning? 364 00:21:54,633 --> 00:21:57,333 Is dat uit een baan of meerdere banen? 365 00:21:57,433 --> 00:22:01,700 Is het onduidelijk waar het inkomen vandaan komt? 366 00:22:01,800 --> 00:22:04,233 Je kan ook kijken naar de opleiding in het huishouden. 367 00:22:04,333 --> 00:22:07,733 Zijn het meer hoog- of laagopgeleiden of zeer laag opgeleiden 368 00:22:07,833 --> 00:22:10,200 of mensen waarvan de opleiding niet bekend is. 369 00:22:10,300 --> 00:22:13,533 Je kan kijken naar de verdeling van dit type huishoudens over het land. 370 00:22:13,633 --> 00:22:16,800 Zitten ze meer in de steden of meer in het landelijk gebied? 371 00:22:16,900 --> 00:22:18,400 In bepaalde provincies? 372 00:22:18,500 --> 00:22:22,700 Je kan binnen steden gaan kijken in welke wijken ze met name voorkomen. 373 00:22:22,800 --> 00:22:26,433 Een patroon kan belangrijk zijn om je beleid effectief in te richten 374 00:22:26,533 --> 00:22:29,868 en de juiste doelgroep op tijd en snel te bereiken. 375 00:22:29,968 --> 00:22:32,468 Je kunt kijken naar de invloed van lokale factoren. 376 00:22:32,568 --> 00:22:35,033 Ik noemde bijvoorbeeld al huizenprijzen, 377 00:22:35,133 --> 00:22:37,733 maar je hebt ook regionaal en lokaal beleid 378 00:22:37,833 --> 00:22:40,268 op het gebied van bijvoorbeeld regionale economie. 379 00:22:40,368 --> 00:22:45,933 Je kunt kijken of er sprake is van een migratieachtergrond in de huishoudens. 380 00:22:46,033 --> 00:22:50,000 Is die westers of niet-westers? Dat kan een belangrijke factor zijn. 381 00:22:50,100 --> 00:22:53,333 Kortom, je gaat allerlei informatie verzamelen over die huishoudens 382 00:22:53,433 --> 00:22:57,933 die je uiteindelijk wil gaan helpen, om te zorgen dat je ze ook beter kán helpen. 383 00:22:59,300 --> 00:23:03,733 Als je daarmee klaar bent, is er nog een tweede aspect: veranderingen in de tijd. 384 00:23:03,833 --> 00:23:06,300 Is het probleem even groot als een jaar geleden, 385 00:23:06,400 --> 00:23:08,700 twee jaar geleden of vijf jaar geleden? 386 00:23:08,800 --> 00:23:11,033 Als een probleem zichzelf kleiner wordt, 387 00:23:11,133 --> 00:23:13,533 is het misschien niet nodig om nog bij te sturen. 388 00:23:13,633 --> 00:23:15,968 Als je ziet dat het probleem groter wordt, 389 00:23:16,068 --> 00:23:19,068 is het misschien juist veel harder nodig om bij te sturen. 390 00:23:19,168 --> 00:23:22,968 Ook hier kunnen weer allerlei regionale patronen in zitten. 391 00:23:23,068 --> 00:23:26,133 Een andere invalshoek is: hoe komt het nou dat mensen 392 00:23:26,233 --> 00:23:28,068 in een negatieve spiraal terechtkomen? 393 00:23:28,168 --> 00:23:33,000 Zien we een bepaald patroon in huishoudens die in onze doelgroep zitten? 394 00:23:33,100 --> 00:23:37,068 Je kan kijken naar life events. Doordat we al die informatie beschikbaar hebben, 395 00:23:37,168 --> 00:23:43,833 kun je kijken in welke huishoudens er de afgelopen tijd een scheiding is geweest. 396 00:23:43,933 --> 00:23:48,433 Baanverlies van een van de partners of misschien wel van de kinderen? 397 00:23:48,533 --> 00:23:52,000 Trouwen of het krijgen van kinderen. Het overlijden van een van de partners. 398 00:23:52,100 --> 00:23:55,268 Misschien zijn mensen wel met pensioen gegaan 399 00:23:55,368 --> 00:23:59,033 en hebben ze een inkomensval onder- gaan, maar wordt het daarna stabiel. 400 00:23:59,133 --> 00:24:01,300 Wil je die mensen dan nog in je doelgroep houden? 401 00:24:01,400 --> 00:24:04,633 Of iemand in het huishouden is in de gevangenis beland, 402 00:24:04,733 --> 00:24:08,900 waardoor de totale inkomenspotentie van het huishouden aanzienlijk minder wordt. 403 00:24:09,000 --> 00:24:11,233 Al deze zaken zijn van belang om te weten: 404 00:24:11,333 --> 00:24:14,468 hoe komt het nou dat mensen in je doelgroep terechtkomen? 405 00:24:14,568 --> 00:24:19,233 Als je dat goed weet, kan je op basis daarvan ook een beter advies maken. 406 00:24:19,333 --> 00:24:22,200 Welk advies dat is, daar ga ik helaas niet over. 407 00:24:22,300 --> 00:24:24,368 Ik ga alleen over het leveren van de data, 408 00:24:24,468 --> 00:24:28,268 van de informatie die nodig is om inzicht te krijgen in het probleem. 409 00:24:29,768 --> 00:24:34,233 Zeker als je te maken met beleid waar- voor meerdere disciplines belangrijk zijn 410 00:24:34,333 --> 00:24:37,700 of waarvoor nog uitleg nodig is aan bepaalde doelgroepen, 411 00:24:37,800 --> 00:24:41,300 is het belangrijk dat je ook laagdrempelig kan communiceren 412 00:24:41,400 --> 00:24:45,500 over de resultaten van je beleidsonderzoek. 413 00:24:45,600 --> 00:24:49,068 Een manier om dat te doen is bijvoorbeeld een tabel. 414 00:24:49,168 --> 00:24:51,168 Een tabel bevat veel informatie, 415 00:24:51,268 --> 00:24:54,268 is vooral bedoeld voor communicatie onder experts. 416 00:24:54,368 --> 00:24:57,568 Je bent het eens over de begrippen, je weet waarover je het wil hebben 417 00:24:57,668 --> 00:25:00,633 en zo kun je snel veel informatie met elkaar delen. 418 00:25:00,733 --> 00:25:04,433 Maar een tabel is niet makkelijk te doorgronden. 419 00:25:04,533 --> 00:25:07,800 Je kan ook werken met vele soorten grafieken 420 00:25:07,900 --> 00:25:09,768 en die zijn speciaal bedoeld om data 421 00:25:09,868 --> 00:25:12,900 snel en in samenhang in één oogopslag te laten zien. 422 00:25:13,000 --> 00:25:15,400 Je ziet in de grafiek aan de meest linkerkant 423 00:25:15,500 --> 00:25:18,800 een patroon waarbij het geboortegewicht staat 424 00:25:18,900 --> 00:25:22,500 van baby's met een gewicht van 5000 gram of meer. 425 00:25:22,600 --> 00:25:27,500 Je ziet blauw, lichtgroen en donkergroen. 426 00:25:27,600 --> 00:25:32,100 Dat is het patroon van Nederland, Lim- burg, Zuid-Limburg, in dit geval Heerlen. 427 00:25:32,200 --> 00:25:34,868 Een dergelijk patroon is in een grafiek goed te zien. 428 00:25:34,968 --> 00:25:37,133 Rechts zien we een taartdiagram. 429 00:25:37,233 --> 00:25:42,000 Die zijn goed om aan te geven wat de verdeling is in een bepaalde doelgroep. 430 00:25:43,168 --> 00:25:47,100 Hoe je met een grafiek trends in kaart kan brengen, zien we hier. 431 00:25:47,200 --> 00:25:49,833 Aan de linkerkant zien we een zogenaamd Sankey-diagram. 432 00:25:49,933 --> 00:25:53,700 Wat we hier zien is de informatie die we verzameld hebben bij een traject 433 00:25:53,800 --> 00:25:57,033 waarin een overheid geprobeerd heeft mensen aan een baan 434 00:25:57,133 --> 00:25:58,568 of beter werk te helpen. 435 00:25:58,668 --> 00:26:01,668 Links zien we de situatie bij de start van het traject. 436 00:26:01,768 --> 00:26:04,300 Bovenaan donkergroen, mensen die een baan hebben, 437 00:26:04,400 --> 00:26:07,768 dan blauw, mensen die geen baan heb- ben en onderaan een groepje onbekend. 438 00:26:07,868 --> 00:26:10,568 In het midden zie je de situatie aan het eind van het traject, 439 00:26:10,668 --> 00:26:14,068 waarbij heel donkergroen bovenin werk of beter werk heeft. 440 00:26:14,168 --> 00:26:17,000 Groen heeft weer werk en het blauwe stuk is kleiner geworden. 441 00:26:17,100 --> 00:26:19,033 Daarna zie je die situatie na een jaar 442 00:26:19,133 --> 00:26:23,268 en je ziet de stromen tussen de verschillende soorten groepen. 443 00:26:23,368 --> 00:26:26,900 Dit maakt het mogelijk om trends in beeld te brengen. 444 00:26:27,000 --> 00:26:29,433 Een andere manier is met diagrammen in de tijd. 445 00:26:29,533 --> 00:26:32,068 Ik heb aan de rechterkant twee voorbeelden gegeven. 446 00:26:32,168 --> 00:26:37,300 De bovenste gaat over inkomens als gevolg van belastingheffingen. 447 00:26:37,400 --> 00:26:39,568 En je ziet dat dat een stijgende lijn is. 448 00:26:39,668 --> 00:26:41,468 Daaronder zie je dezelfde data, 449 00:26:41,568 --> 00:26:45,400 maar je ziet het nu als percentage ten opzichte van de totale belastingen 450 00:26:45,500 --> 00:26:48,233 en daar zie je een dalende lijn. 451 00:26:48,333 --> 00:26:50,933 Dit is gelijk een kleine waarschuwing 452 00:26:51,033 --> 00:26:53,668 voor hoe je met grafieken om moet gaan in de praktijk 453 00:26:53,768 --> 00:26:56,668 en ook hoe je grafieken moet lezen als je ze krijgt. 454 00:26:56,768 --> 00:26:58,168 Denk altijd even goed na: 455 00:26:58,268 --> 00:27:01,833 wat wil je laten zien en hoe laat je dat op de juiste manier zien? 456 00:27:01,933 --> 00:27:05,033 Boven zie je een stijgende lijn, onder een dalende lijn, 457 00:27:05,133 --> 00:27:07,100 terwijl het gaat over hetzelfde type data. 458 00:27:07,200 --> 00:27:09,633 Je kan hier verschillende conclusies aan verbinden, 459 00:27:09,733 --> 00:27:12,133 dus het is belangrijk om een goed beeld te vormen 460 00:27:12,233 --> 00:27:15,133 door beide grafieken naast elkaar te hebben. 461 00:27:17,033 --> 00:27:20,533 Nog een manier om laagdrempelige informatie te laten zien, zijn kaarten. 462 00:27:20,633 --> 00:27:24,800 Hier kun je ruimtelijke patronen in beeld brengen. Ik heb een kaartje gemaakt 463 00:27:24,900 --> 00:27:29,433 van speelgoedwinkels die zich binnen tien kilometer van een woonadres bevinden. 464 00:27:29,533 --> 00:27:31,800 Je ziet wat je verwacht. 465 00:27:31,900 --> 00:27:34,333 Naarmate er een hogere bevolkingsdichtheid is, 466 00:27:34,433 --> 00:27:37,000 zijn er meer winkels binnen tien kilometer, 467 00:27:37,100 --> 00:27:42,068 dus dat is precies wat je verwacht. Wat dat betreft geen nieuws in dit plaatje. 468 00:27:42,168 --> 00:27:43,533 Ik heb nog een tweede plaatje. 469 00:27:43,633 --> 00:27:47,400 Ik kan helaas geen bewegende beelden laten zien in deze webinar. 470 00:27:47,500 --> 00:27:51,400 Hier kan je laten zien hoe je niet alleen ruimtelijke patronen, 471 00:27:51,500 --> 00:27:54,068 maar ook patronen in de tijd in beeld kan brengen. 472 00:27:54,168 --> 00:27:58,300 Op basis van telefoniedata die al wat ouder is, uit 2013, 473 00:27:58,400 --> 00:28:02,200 heb ik hier een kaartje waarbij je de verdeling van de bevolking 474 00:28:02,300 --> 00:28:04,168 over het land ziet op het tijdstip nul. 475 00:28:04,268 --> 00:28:07,600 Dat is ook het tijdstip dat gebruikt wordt als ijkmoment 476 00:28:07,700 --> 00:28:10,633 voor verdeling van geld uit het gemeentefonds. 477 00:28:10,733 --> 00:28:13,168 Als ik de tijdbalk in het plaatje zou laten lopen, 478 00:28:13,268 --> 00:28:17,200 zou je zien dat bepaalde binnensteden in de loop van de dag rood kleuren, 479 00:28:17,300 --> 00:28:19,600 omdat de bevolkingsdichtheid daar hoger is 480 00:28:19,700 --> 00:28:23,500 en die kleuren 's avonds weer gewoon geel, naar het gemiddelde toe. 481 00:28:23,600 --> 00:28:26,900 Om die reden kun je zeggen: 482 00:28:27,000 --> 00:28:30,600 de totale bevolking die in 24 uur aanwezig is in een bepaald gebied, 483 00:28:30,700 --> 00:28:32,768 is veel hoger dan de bevolking die er woont. 484 00:28:32,868 --> 00:28:36,168 Dus dat zou een bijstelling van bepaalde fondsen kunnen betekenen. 485 00:28:36,268 --> 00:28:39,368 Ik kan helaas geen bewegende plaatjes laten zien in dit webinar, 486 00:28:39,468 --> 00:28:41,068 dus ik moet u dat onthouden. 487 00:28:41,168 --> 00:28:44,968 Maar op de website van het CBS is deze animatie wel te zien. 488 00:28:46,100 --> 00:28:48,768 Nog een manier van laagdrempelige communicatie, 489 00:28:48,868 --> 00:28:51,468 met name met grote groepen, bijvoorbeeld met burgers 490 00:28:51,568 --> 00:28:54,333 of met mensen die buiten de beleidspraktijk staan, 491 00:28:54,433 --> 00:28:56,568 is met behulp van factsheets. 492 00:28:56,668 --> 00:29:00,268 Die geven in een oogopslag veel samenhangende informatie. 493 00:29:00,368 --> 00:29:02,868 Dit gaat over internationaal onderwijs in Nederland 494 00:29:02,968 --> 00:29:04,700 en je ziet heel nadrukkelijk 495 00:29:04,800 --> 00:29:07,368 dat de grootste clustering van internationale scholen 496 00:29:07,468 --> 00:29:09,233 in de buurt van Den Haag is. 497 00:29:09,333 --> 00:29:13,000 Logisch, gezien alle internationale organisaties in Den Haag 498 00:29:13,100 --> 00:29:15,568 en bijvoorbeeld ook een aantal ambassades. 499 00:29:17,300 --> 00:29:20,033 Een ingewikkelder vorm van communicatie is een dashboard. 500 00:29:20,133 --> 00:29:22,033 Dat is een interactief medium 501 00:29:22,133 --> 00:29:24,333 waarbij je als gebruiker zelf in staat bent 502 00:29:24,433 --> 00:29:26,833 om informatie samen te stellen 503 00:29:26,933 --> 00:29:29,700 die past bij het type vraag dat jij in gedachten hebt. 504 00:29:29,800 --> 00:29:34,600 Een beetje als StatLine, maar dan grafisch, interactief en laagdrempeliger. 505 00:29:34,700 --> 00:29:37,068 Ik heb hier een dashboard uit Den Haag, 506 00:29:37,168 --> 00:29:40,000 waarbij we veel informatie over wijken hebben verzameld. 507 00:29:40,100 --> 00:29:43,033 Je kunt op het kaartje meteen zien waar een wijk staat 508 00:29:43,133 --> 00:29:44,633 ten opzichte van andere wijken. 509 00:29:44,733 --> 00:29:48,033 Op deze manier kun je een vergelijking maken met andere wijken, 510 00:29:48,133 --> 00:29:50,868 de informatie samenstellen die je zelf nodig hebt. 511 00:29:50,968 --> 00:29:55,368 Een factsheet is statisch, goed geschikt voor informatie met een breed publiek. 512 00:29:55,468 --> 00:29:59,133 Een dashboard is niet statisch, maar ook niet zo geschikt voor een breed publiek, 513 00:29:59,233 --> 00:30:03,168 maar bijvoorbeeld meer voor mensen die al wat meer datagedreven zijn 514 00:30:03,268 --> 00:30:06,633 of onderzoeksjournalistiek willen bedrijven of iets dergelijks. 515 00:30:06,733 --> 00:30:10,168 Overigens ook goed te gebruiken bij uitvoering van praktijk. 516 00:30:12,000 --> 00:30:13,633 Samenvattend: 517 00:30:13,733 --> 00:30:15,933 waarom zou je datagedreven willen werken? 518 00:30:16,033 --> 00:30:19,768 Op de eerste plaats onderbuik versus feiten, onderbuik en feiten. 519 00:30:19,868 --> 00:30:24,933 Het voorkomen van desinvesteringen door de juiste besluiten te nemen. 520 00:30:25,033 --> 00:30:29,333 Maatschappelijke opgaven en communi- catie over de juiste zaken is complexer 521 00:30:29,433 --> 00:30:33,068 en daarmee is het belangrijk dat je het over de juiste dingen hebt 522 00:30:33,168 --> 00:30:36,133 en het over eens bent dat je het over de juiste dingen hebt. 523 00:30:36,233 --> 00:30:41,800 Verantwoording van besluitvorming, benchmarking, monitoring en bijsturing. 524 00:30:41,900 --> 00:30:44,768 Dan: wat is de keten waarmee je te maken krijgt 525 00:30:44,868 --> 00:30:48,968 op het moment dat je met datagedreven beleidspraktijk gaat werken? 526 00:30:49,068 --> 00:30:52,100 Zoals ik net liet zien, begin je met de vragenarticulatie. 527 00:30:52,200 --> 00:30:55,800 Wat is eigenlijk de vraag: waar hebben we het precies over? 528 00:30:55,900 --> 00:30:59,733 Het verzamelen van de data die erbij hoort, het doen van de analyse, 529 00:30:59,833 --> 00:31:02,768 disseminatie en communicatie met een brede doelgroep. 530 00:31:02,868 --> 00:31:05,233 Breng zo goed mogelijk de feiten onder de aandacht 531 00:31:05,333 --> 00:31:09,433 van iedereen die te maken heeft met het nemen van de juiste besluiten. 532 00:31:09,533 --> 00:31:12,068 Schrijf op basis daarvan een advies, neem het besluit 533 00:31:12,168 --> 00:31:14,868 en vervolgens: doe een monitoringprogramma. 534 00:31:14,968 --> 00:31:17,700 Heel belangrijk: definieer het probleem scherp. 535 00:31:17,800 --> 00:31:20,633 Weet waar je het over hebt, baken de doelgroep goed af 536 00:31:20,733 --> 00:31:24,033 en breng de omvang in beeld. Inventariseer de aanvullende data, 537 00:31:24,133 --> 00:31:27,433 voor zover die van belang is voor je beleidspraktijk 538 00:31:27,533 --> 00:31:30,900 en breng daarmee de doelgroep zo goed en uitgebreid mogelijk in kaart. 539 00:31:31,000 --> 00:31:35,033 Communiceer laagdrempelig en bepaal meetbare indicatoren voor het beleid, 540 00:31:35,133 --> 00:31:37,933 zodat je weet waarop je moet letten bij de uitvoering 541 00:31:38,033 --> 00:31:40,668 en hoe je meet of het beleid het gewenste effect heeft 542 00:31:40,768 --> 00:31:43,633 en ontwerp daarvoor ook een monitoringsprogramma. 543 00:31:45,768 --> 00:31:50,233 Het volgende onderwerp is datagedreven werken in de eigen organisatie. 544 00:31:50,333 --> 00:31:54,968 Ook hier heb ik weer een pollvraag en die luidt: 545 00:31:55,068 --> 00:31:58,368 Wat is jullie voornaamste uitdaging om zelf te komen 546 00:31:58,468 --> 00:32:01,268 of om verder te komen met datagedreven werken? 547 00:32:01,368 --> 00:32:03,700 Als het goed is, zien jullie de vraag nu in beeld 548 00:32:03,800 --> 00:32:06,168 en kun je daar ook antwoord op geven. 549 00:32:06,268 --> 00:32:09,368 Ik zie een aantal antwoorden binnenkomen. 550 00:32:10,733 --> 00:32:14,700 Ik zie capaciteit, draagvlak, techniek. 551 00:32:14,800 --> 00:32:20,033 Ik ben blij dat er niemand aangeeft dat er een probleem is met budget. 552 00:32:20,133 --> 00:32:23,200 O, nu toch. Da's nou jammer. 553 00:32:25,800 --> 00:32:29,268 Ik zie de scores bijna niet meer veranderen. 554 00:32:30,500 --> 00:32:36,233 Ik ga de poll nu stopzetten, dan krijgt u straks de resultaten in beeld. 555 00:32:38,900 --> 00:32:41,800 Vier procent geeft aan dat er een probleem is met budget. 556 00:32:41,900 --> 00:32:47,600 Goed om te weten, want budget is een van de moeilijkste dingen om te regelen. 557 00:32:47,700 --> 00:32:50,000 Iedereen die bij de overheid werkt, zal dat weten. 558 00:32:50,100 --> 00:32:54,800 Capaciteit, maar daar is altijd aan te komen. Scoort als hoogste. 559 00:32:54,900 --> 00:32:59,500 Draagvlak scoort met blauw ook best hoog en dat verbaast mij een beetje, 560 00:32:59,600 --> 00:33:02,300 want datagedreven werk is iets waar veel overheden, 561 00:33:02,400 --> 00:33:05,433 van politiek tot beleid tot uitvoering, mee bezig zijn 562 00:33:05,533 --> 00:33:08,300 en waar iedereen wel achter staat. Maar ik kan me indenken 563 00:33:08,400 --> 00:33:11,133 dat de aspecten die erbij komen kijken, 564 00:33:11,233 --> 00:33:15,900 zoals tijd, geld en capaciteit, het draagvlak niet altijd even groot maken. 565 00:33:16,000 --> 00:33:20,233 Techniek scoort ook 22 procent en de ander scoort 24 procent. 566 00:33:21,733 --> 00:33:24,833 Ik zal proberen te zeggen waarmee je te maken krijgt 567 00:33:24,933 --> 00:33:27,668 als je datagedreven gaat werken in je eigen organisatie. 568 00:33:27,768 --> 00:33:31,833 Ik zet de sheet met de punten waarover ik het over ga hebben in beeld, 569 00:33:31,933 --> 00:33:34,268 zodat je makkelijker mee kan lezen. 570 00:33:34,368 --> 00:33:38,868 Op de eerste plaats: inventariseer de da- tabronnen die je tot je beschikking hebt. 571 00:33:38,968 --> 00:33:42,833 In de eigen organisatie verzamel je waarschijnlijk al veel databronnen. 572 00:33:42,933 --> 00:33:45,500 Die zijn voor jouw organisatie van belang, 573 00:33:45,600 --> 00:33:49,200 maar zijn waarschijnlijk ook goed bruikbaar voor het maken van beleid. 574 00:33:49,300 --> 00:33:52,833 Je data is waardevol. Krijg zicht op je databronnen 575 00:33:52,933 --> 00:33:56,100 en zorg ervoor dat in jouw organisatie die data wordt verzameld 576 00:33:56,200 --> 00:34:00,968 en wordt voorzien van metadata. Dat is data die de data beschrijft, 577 00:34:01,068 --> 00:34:04,068 het zegt iets over de data die je hebt opgeslagen. 578 00:34:04,168 --> 00:34:07,000 Bijvoorbeeld, wanneer is het verzameld? 579 00:34:07,100 --> 00:34:11,400 Is er sprake van 100 procent dekking? Waarvoor is het verzameld en door wie? 580 00:34:11,500 --> 00:34:14,368 Wat zit er precies in? Gaat het over mensen of bedrijven? 581 00:34:14,468 --> 00:34:17,433 En wat hebben we dan over die mensen of bedrijven? 582 00:34:17,533 --> 00:34:20,068 Zonder metadata weet je niet wat je in huis hebt 583 00:34:20,168 --> 00:34:23,368 er zonder metadata kan je niet zoeken in je eigen databronnen. 584 00:34:23,468 --> 00:34:26,168 Daarmee is een belangrijk deel van de basis die je nodig hebt 585 00:34:26,268 --> 00:34:29,168 om datagedreven werken niet meer beschikbaar. 586 00:34:30,568 --> 00:34:34,068 Een tweede aspect is: pseudonimiseer waar mogelijk. 587 00:34:34,168 --> 00:34:35,800 Dat is, wat ik al uitlegde: 588 00:34:35,900 --> 00:34:39,633 zorg dat de direct identificerende variabelen er zo snel mogelijk af gaan. 589 00:34:39,733 --> 00:34:42,833 BSN, naam, adres, dat soort zaken 590 00:34:42,933 --> 00:34:46,500 en zorg dat daar een soort betekenisloze code voor in de plaats komt. 591 00:34:46,600 --> 00:34:51,200 Het blijven wel persoonsgegevens. Het valt nog steeds onder de AVG, 592 00:34:51,300 --> 00:34:55,968 maar het is wel belangrijke eerste stap om te zorgen voor goede beveiliging. 593 00:34:57,200 --> 00:34:58,900 Als je gaat pseudonimiseren, 594 00:34:59,000 --> 00:35:01,900 zorg dan dat je de koppelmogelijkheden van de data behoudt. 595 00:35:02,000 --> 00:35:05,433 Zorg dus dat een pseudonieme sleutel waarmee je een persoon aanduidt 596 00:35:05,533 --> 00:35:07,633 in alle bestanden terugkomt, 597 00:35:07,733 --> 00:35:10,768 zodat je ze door de bestanden heen aan elkaar kan koppelen. 598 00:35:10,868 --> 00:35:15,268 Hetzelfde geldt voor bedrijven, adressen en huishoudens. 599 00:35:17,000 --> 00:35:20,668 Zorg ook dat je de toegang tot die data goed organiseert. 600 00:35:20,768 --> 00:35:25,300 Belangrijk is met de aspecten rekening te houden die de AVG voorschrijft. 601 00:35:25,400 --> 00:35:27,133 Het belangrijkst is doelbinding. 602 00:35:27,233 --> 00:35:30,133 Zorg dat als je een bepaald beleidsdoel nastreeft, 603 00:35:30,233 --> 00:35:34,500 dat er een regeling komt waarbij je toe- gang krijgt tot de data die je nodig hebt 604 00:35:34,600 --> 00:35:38,333 voor het onderzoek dat je wil doen, en niet zomaar tot alle data. 605 00:35:38,433 --> 00:35:41,468 Zorg ook dat je die data niet gaat misbruiken voor zaken 606 00:35:41,568 --> 00:35:43,633 waar het niet voor is verzameld. 607 00:35:43,733 --> 00:35:47,133 Zo is voor de AVG belangrijk dat je je data niet gaat gebruiken 608 00:35:47,233 --> 00:35:50,800 om individuele beslissingen te kunnen nemen voor één burger 609 00:35:50,900 --> 00:35:53,800 of bijvoorbeeld opsporing te doen, of fraudedetectie. 610 00:35:53,900 --> 00:35:57,300 Daar is de data niet voor verzameld en mag ie niet voor worden gebruikt. 611 00:35:57,400 --> 00:35:59,033 Voor algemene beleidsdoeleinden, 612 00:35:59,133 --> 00:36:03,433 waarbij je geen uitspraken doet over één persoon, maar alleen over groepen, 613 00:36:03,533 --> 00:36:06,800 kun je veel doen, ook binnen het kader van de AVG. 614 00:36:08,500 --> 00:36:11,233 Het doen van onderzoek met data is een eigen expertise 615 00:36:11,333 --> 00:36:14,633 en vergt specialistische hulpmiddelen. 616 00:36:14,733 --> 00:36:17,000 Ik kom nog weleens tegen dat mensen denken: 617 00:36:17,100 --> 00:36:20,468 'Ik kan wel een draaitabel maken in Excel. Ik ben best handig. 618 00:36:20,568 --> 00:36:23,200 Kom maar op, daar gaan we wel even mee werken.' 619 00:36:23,300 --> 00:36:26,933 Vergis je niet dat het doen van onderzoek met grote hoeveelheden data 620 00:36:27,033 --> 00:36:31,333 zoals het CBS die beschikt behoorlijk wat eigen expertise met zich meebrengt. 621 00:36:31,433 --> 00:36:35,633 Als je 17 miljoen Nederlanders met banen, inkomens, opleidingen 622 00:36:35,733 --> 00:36:38,800 aan elkaar relateert om familieverbanden in kaart te brengen, 623 00:36:38,900 --> 00:36:40,733 praat je over een explosie aan data, 624 00:36:40,833 --> 00:36:43,368 waarbij je met stevige machines aan de gang moet 625 00:36:43,468 --> 00:36:49,033 en met specialistische pakketten om daar iets van te kunnen maken. 626 00:36:49,133 --> 00:36:51,568 Statistische pakketten waar veel mee wordt gewerkt 627 00:36:51,668 --> 00:36:56,700 zijn bijvoorbeeld SPSS, SAS, STATA, R of Python. 628 00:36:56,800 --> 00:37:00,133 Als je meer wil weten, kun je op internet veel resources vinden 629 00:37:00,233 --> 00:37:02,668 die uitleggen wat je met deze pakketten kan doen 630 00:37:02,768 --> 00:37:05,200 en wat hun voor- en nadelen zijn. 631 00:37:06,933 --> 00:37:11,333 Investeer in laagdrempelige communicatie van de uitkomsten. 632 00:37:11,433 --> 00:37:13,733 Ook dit vergt behoorlijk wat eigen expertise. 633 00:37:13,833 --> 00:37:16,633 Het maken van goede kaarten is niet iedereen gegeven. 634 00:37:16,733 --> 00:37:20,068 Het laten zien van patronen in een kaart zodat ze ook helder zijn, 635 00:37:20,168 --> 00:37:24,033 maar niet suggereert dat er patronen zijn waar ze er in werkelijkheid niet zijn, 636 00:37:24,133 --> 00:37:28,133 is cartografie, en is een eigen expertise. 637 00:37:28,233 --> 00:37:31,233 Ook het goed communiceren met tabellen en grafieken 638 00:37:31,333 --> 00:37:33,300 is behoorlijk eigen expertise, 639 00:37:33,400 --> 00:37:36,333 om te zorgen dat je mensen niet op het verkeerde been zet, 640 00:37:36,433 --> 00:37:41,033 zodat ze verkeerde uitkomsten trekken uit de grafieken die ze onder ogen krijgen. 641 00:37:42,768 --> 00:37:45,968 Daarnaast is belangrijk: weet wanneer je hulp in moet schakelen. 642 00:37:46,068 --> 00:37:48,768 In veel organisaties kunnen mensen veel dingen zelf, 643 00:37:48,868 --> 00:37:51,200 maar bijna niemand kan echt alles zelf. 644 00:37:51,300 --> 00:37:54,668 Er is vaak hulp aanwezig, bijvoorbeeld bij het CBS, 645 00:37:54,768 --> 00:37:57,600 maar ook bij partijen in het bedrijfsleven. 646 00:37:57,700 --> 00:38:01,600 Denk bijvoorbeeld ook aan opleidingen, 647 00:38:01,700 --> 00:38:05,968 denk aan trainingen voor verschillende soorten onderdelen van je organisatie, 648 00:38:06,068 --> 00:38:08,833 maar ook het doen van onderzoek of het verzamelen van data, 649 00:38:08,933 --> 00:38:11,833 beschikbaar maken van data of handelen van data 650 00:38:11,933 --> 00:38:14,900 op zo'n manier dat het beschikbaar komt voor je onderzoek. 651 00:38:16,400 --> 00:38:20,133 Ik zie hier een vraag van Ilene, als ik het goed uitspreek. 652 00:38:20,233 --> 00:38:24,800 'Mag je iets doen met bijvangst van data als die wel relevant blijkt?' 653 00:38:24,900 --> 00:38:28,400 Dit is een vraag die onder andere teruggrijpt op de AVG. 654 00:38:28,500 --> 00:38:32,168 Mag je data gebruiken voor een ander doel dan waarvoor die is verzameld? 655 00:38:32,268 --> 00:38:35,368 Het is niet eenvoudig om daar 1-2-3 antwoord op te geven. 656 00:38:35,468 --> 00:38:38,133 In een aantal gevallen zal er geen enkel probleem zijn. 657 00:38:38,233 --> 00:38:43,633 Zeker niet als je duidelijk kan maken dat het gaat om het maken van een beleid 658 00:38:43,733 --> 00:38:47,533 dat alleen ten goede kan komen van de personen, bedrijven of huishoudens 659 00:38:47,633 --> 00:38:49,268 van wie de data is verzameld. 660 00:38:49,368 --> 00:38:52,468 Maar als de bijvangst betekent dat je bijvoorbeeld sneller 661 00:38:52,568 --> 00:38:56,533 of makkelijker fraude kan opsporen of andere vormen van opsporing kan doen, 662 00:38:56,633 --> 00:39:01,233 zal de AVG zeggen dat je die data niet mag gebruiken en moet negeren. 663 00:39:01,333 --> 00:39:04,268 Ik hoop dat dit een voldoende duidelijk antwoord is. 664 00:39:04,368 --> 00:39:08,600 Laatste wat ik wil noemen wanneer je overschakelt op datagedreven werken: 665 00:39:08,700 --> 00:39:10,733 besef dat het een langdurig proces is. 666 00:39:10,833 --> 00:39:13,868 Je hebt het niet van vandaag op morgen ingevoerd. 667 00:39:13,968 --> 00:39:17,333 Het betekent behoorlijk wat veranderingen voor je organisatie. 668 00:39:17,433 --> 00:39:23,333 Zo kan het betekenen dat besluitvorming eerder langer duurt dan korter 669 00:39:23,433 --> 00:39:27,468 omdat je meer invalshoeken hebt en het moeilijker is om een besluit te nemen. 670 00:39:27,568 --> 00:39:30,768 Processen en patronen die je normaal ziet in je eigen organisatie 671 00:39:30,868 --> 00:39:34,000 voor het maken van beleid kunnen anders worden en dat kan wennen zijn. 672 00:39:34,100 --> 00:39:37,400 Je krijgt andere partijen aan tafel, misschien wel met andere belangen. 673 00:39:37,500 --> 00:39:40,400 Het zal bovendien moeten ontwikkelen in de organisatie 674 00:39:40,500 --> 00:39:42,968 voordat het bij iedereen tussen de oren zit. 675 00:39:43,068 --> 00:39:46,568 Zorg dus ook, als je dit gaat doen, voor sponsors in je organisatie 676 00:39:46,668 --> 00:39:50,533 op elk niveau en zorg dat die doorhebben dat dit een proces is van lange adem 677 00:39:50,633 --> 00:39:55,300 en niet iets dat je ergens tussen neus en lippen door in een weekendje invoert. 678 00:39:58,200 --> 00:40:01,100 Valkuilen van data gedreven werken. 679 00:40:02,668 --> 00:40:08,900 Een van de belangrijkste valkuilen is het verschil tussen correlatie en causaliteit. 680 00:40:09,000 --> 00:40:12,168 Correlatie is de samenhang tussen twee fenomenen 681 00:40:12,268 --> 00:40:15,468 en causaliteit is de reden waarom ze met elkaar samenhangen. 682 00:40:15,568 --> 00:40:18,833 Een bekend voordeel van het verschil tussen correlatie en causaliteit 683 00:40:18,933 --> 00:40:22,333 is een onderzoek dat ergens in de jaren 70 is gedaan in Duitsland. 684 00:40:22,433 --> 00:40:27,100 Daarbij werd een patroon ontdekt tussen ooievaars en geboortecijfers. 685 00:40:27,200 --> 00:40:30,768 Waar veel ooievaars voorkwamen, waren de geboortecijfers hoog. 686 00:40:30,868 --> 00:40:34,468 Dit is waarschijnlijk voor veel mensen een bekend voorbeeld. 687 00:40:34,568 --> 00:40:36,733 Hier is sprake van correlatie. 688 00:40:36,833 --> 00:40:40,200 Maar het voor de hand liggende causale verband is er natuurlijk niet. 689 00:40:40,300 --> 00:40:42,900 Het kan best zijn dat er een causaal verband is. 690 00:40:43,000 --> 00:40:46,033 Zo komen ooievaars meer voor in landelijk gebied 691 00:40:46,133 --> 00:40:48,400 en zeker in de jaren 70 van de vorige eeuw 692 00:40:48,500 --> 00:40:51,068 was landelijk gebied geloviger en conservatiever 693 00:40:51,168 --> 00:40:53,068 en waren de geboortecijfers daar hoger. 694 00:40:53,168 --> 00:40:55,768 Dus er is misschien een causaal verband, 695 00:40:55,868 --> 00:40:58,900 maar correlatie wil nog niet meteen zeggen 696 00:40:59,000 --> 00:41:02,400 dat er ook sprake is van een causaal verband. 697 00:41:02,500 --> 00:41:06,233 Een tweede belangrijk aspect is de kwaliteit van de data die je gebruikt. 698 00:41:06,333 --> 00:41:09,300 Bekende regel is: garbage in garbage out. 699 00:41:09,400 --> 00:41:12,268 In veel gevallen zul je bij datagedreven werken 700 00:41:12,368 --> 00:41:17,433 data gaan gebruiken die niet per se precies voor dat doel is verzameld. 701 00:41:17,533 --> 00:41:21,733 Je gaat kijken naar een niche in de data, niet naar het totale pakket. 702 00:41:21,833 --> 00:41:27,100 En is de data nog steeds even goed als je naar het totale pakket gaat kijken? 703 00:41:27,200 --> 00:41:29,200 De kwaliteit van de data die je gebruikt, 704 00:41:29,300 --> 00:41:31,733 zeker als die aan de basis staat van je beleid 705 00:41:31,833 --> 00:41:34,133 en misschien aan de basis van je analyse, 706 00:41:34,233 --> 00:41:37,068 is het belangrijk voor de kwaliteit van het eindresultaat 707 00:41:37,168 --> 00:41:39,868 en uiteindelijk dus ook van je besluit. 708 00:41:39,968 --> 00:41:43,068 Zorg dus dat je goed zicht hebt op de kwaliteit van data. 709 00:41:43,168 --> 00:41:45,400 Dat hoor je ook op te slaan in je metadata. 710 00:41:45,500 --> 00:41:48,933 Als je er twijfels over hebt, doe onderzoek, zoek naar andere bronnen. 711 00:41:49,033 --> 00:41:52,868 Ga kijken hoe je de kwaliteit van de data goed zou kunnen bepalen. 712 00:41:52,968 --> 00:41:55,768 Daarnaast is het belangrijk: weet wanneer het genoeg is. 713 00:41:55,868 --> 00:41:58,833 Een goed kunstenaar onderscheidt zich van een slechte 714 00:41:58,933 --> 00:42:01,033 doordat die weet wanneer een product af is. 715 00:42:01,133 --> 00:42:03,133 Zo gaat het ook met datagedreven werken. 716 00:42:03,233 --> 00:42:07,633 Je kunt altijd één spade dieper, iets verder dooronderzoeken, 717 00:42:07,733 --> 00:42:10,668 altijd nog even een aantal aspecten erbij pakken, 718 00:42:10,768 --> 00:42:12,600 maar weet ook als het voldoende is. 719 00:42:12,700 --> 00:42:16,000 Weet wanneer je klaar bent en het beeld zo goed is dat je op basis daarvan 720 00:42:16,100 --> 00:42:19,068 een weloverwogen besluit kan nemen. 721 00:42:19,168 --> 00:42:23,100 Een vierde valkuil is dat er altijd, zeker in een politieke context, 722 00:42:23,200 --> 00:42:27,768 discussie kan ontstaan over de feiten in het datagedreven traject. 723 00:42:27,868 --> 00:42:30,668 Hebben we inderdaad de exacte juiste definitie? 724 00:42:30,768 --> 00:42:33,333 Hebben we op deze manier de doelgroep in kaart? 725 00:42:33,433 --> 00:42:36,333 Is dit wel het juiste aantal? 726 00:42:36,433 --> 00:42:40,968 Dat is vervelend, maar die discussies krijg je ook zonder datagedreven werken, 727 00:42:41,068 --> 00:42:43,068 alleen worden ze nu wat meer expliciet 728 00:42:43,168 --> 00:42:45,733 en kunt je ze ook doen op basis van gedegen cijfers. 729 00:42:45,833 --> 00:42:51,668 Je kunt echt aantonen of bepaalde conclusies wel of niet juist zijn. 730 00:42:51,768 --> 00:42:56,033 Daarnaast, betekent datagedreven werken niet automatisch 731 00:42:56,133 --> 00:43:01,033 dat er ook snellere en betere besluiten worden genomen. 732 00:43:01,133 --> 00:43:03,068 In elk geval zien we vaak in de praktijk 733 00:43:03,168 --> 00:43:07,000 dat als mensen meer van een probleem weten, meer invalshoeken kennen, 734 00:43:07,100 --> 00:43:10,868 daarbij ook meer inschatten wat de resultaten van een bepaald besluit zijn 735 00:43:10,968 --> 00:43:15,733 en het daarmee zelfs nog wel moeilijker kan worden om een besluit te nemen. 736 00:43:15,833 --> 00:43:19,168 Ik zie intussen een vraag van ESR. 737 00:43:19,268 --> 00:43:23,068 Ik neem aan dat het een afkorting is die voor een naam staat. 738 00:43:23,168 --> 00:43:24,800 'In het licht van aanbestedingen 739 00:43:24,900 --> 00:43:30,068 beschouwt het CBS zich als unieke aanbieder van data voor de overheid.' 740 00:43:30,168 --> 00:43:31,968 Ja en nee. 741 00:43:32,068 --> 00:43:33,433 Wij zijn aan de ene kant uniek 742 00:43:33,533 --> 00:43:36,900 in de zin dat de data die wij in huis hebben uniek is voor het CBS, 743 00:43:37,000 --> 00:43:41,533 voor Nederland en misschien zelfs wel, op een aantal Scandinavische landen na, 744 00:43:41,633 --> 00:43:44,368 een unieke datapositie in de wereld. 745 00:43:44,468 --> 00:43:46,200 Daarmee zijn we wel degelijk uniek. 746 00:43:46,300 --> 00:43:49,668 Aan de andere kant zorgen wij dat er veel partijen in Nederland 747 00:43:49,768 --> 00:43:53,300 ook met die data kunnen werken. Dat gebeurt onder strikte voorwaarden, 748 00:43:53,400 --> 00:43:55,968 want het gaat om zeer privacygevoelige informatie. 749 00:43:56,068 --> 00:43:58,300 Maar er zijn ook partijen in het bedrijfsleven 750 00:43:58,400 --> 00:44:00,400 en in de universitaire wereld 751 00:44:00,500 --> 00:44:03,333 die ook met de data van het CBS kunnen werken. 752 00:44:03,433 --> 00:44:06,468 Die geven ook adviezen en staan overheden ook terzijde 753 00:44:06,568 --> 00:44:08,500 bij datagedreven werken voor beleid. 754 00:44:08,600 --> 00:44:12,700 Die zijn bovendien niet gebonden aan de beperkingen die het CBS wel heeft. 755 00:44:12,800 --> 00:44:15,500 Zo mag bijvoorbeeld een bedrijf of een universiteit 756 00:44:15,600 --> 00:44:18,668 ook prognoses en inhoudelijke beleidsuitspraken doen 757 00:44:18,768 --> 00:44:22,368 en adviezen geven over welke beleid tot bepaalde effecten zal leiden 758 00:44:22,468 --> 00:44:25,200 of welk beleid een bepaald effect heeft gehad. 759 00:44:25,300 --> 00:44:28,700 Als je ondersteuning nodig hebt, is het CBS zeker niet de enige partij. 760 00:44:28,800 --> 00:44:33,833 Er is een wereld aan mogelijkheden. Ik zal daar zo nog iets meer over vertellen. 761 00:44:33,933 --> 00:44:36,300 Even terug naar de valkuilen: 762 00:44:36,400 --> 00:44:38,533 Scherp formuleren van de vraag is essentieel. 763 00:44:38,633 --> 00:44:42,300 Het gebeurt ook regelmatig dat halverwege het traject 764 00:44:42,400 --> 00:44:44,000 wordt teruggegrepen op: 765 00:44:44,100 --> 00:44:46,200 'hebben we wel de goeie vraag gesteld? 766 00:44:46,300 --> 00:44:50,000 Hebben we echt het goede probleem te pakken waarvoor we beleid gaan maken? 767 00:44:50,100 --> 00:44:51,700 Aan de ene kant dat is frustrerend, 768 00:44:51,800 --> 00:44:56,000 maar is het natuurlijk goed dat je halverwege tot inkeer komt. 769 00:44:56,100 --> 00:45:01,700 Beter ten halve gekeerd dan ten hele gedwaald, vanzelfsprekend. 770 00:45:01,800 --> 00:45:05,100 Daarnaast is een van de valkuilen van datagedreven werk 771 00:45:05,200 --> 00:45:07,268 dat je vaak met meer instanties te maken hebt 772 00:45:07,368 --> 00:45:10,400 die allemaal een deel van de datapositie hebben. 773 00:45:10,500 --> 00:45:14,500 En je moet die data bij elkaar brengen op zo'n manier dat het veilig is. 774 00:45:14,600 --> 00:45:17,433 Maar wie neemt als eerste de stap om z'n data uit handen te geven 775 00:45:17,533 --> 00:45:20,000 en bij een andere organisatie naar binnen te krijgen? 776 00:45:20,100 --> 00:45:24,068 Of moet je daar een gezamenlijk platform voor maken? Wie is daar dan de baas? 777 00:45:24,168 --> 00:45:27,100 Het beheren van de eigen data, zeggenschap 778 00:45:27,200 --> 00:45:29,633 en precies weten wat er met de eigen data gebeurt, 779 00:45:29,733 --> 00:45:32,033 is voor veel organisaties die data verzamelen 780 00:45:32,133 --> 00:45:35,200 en zich eigenaar voelen, enorm belangrijk. 781 00:45:35,300 --> 00:45:38,600 Het goed bij elkaar brengen van de data uit verschillende invalshoeken 782 00:45:38,700 --> 00:45:42,933 kan zeer complex zijn en daarmee ook datagedreven werken vertragen. 783 00:45:43,033 --> 00:45:46,468 Nog even samenvattend: correlatie is geen causaal verband. 784 00:45:46,568 --> 00:45:50,000 Kwaliteit van data is belangrijk, weet ook wanneer het genoeg is, 785 00:45:50,100 --> 00:45:53,200 want je kan altijd meer onderzoeken en nog een stap verder. 786 00:45:53,300 --> 00:45:56,268 Discussie over feiten en afbakening, ga dat niet uit de weg. 787 00:45:56,368 --> 00:45:59,200 Het is belangrijk dat je die discussie op tafel krijgt 788 00:45:59,300 --> 00:46:02,833 in plaats van dat die onder tafel blijft. 789 00:46:02,933 --> 00:46:05,668 Het staat niet gelijk aan snellere besluitvorming. 790 00:46:05,768 --> 00:46:07,833 Scherp formuleren van de vraag is essentieel 791 00:46:07,933 --> 00:46:11,968 en het delen van data tussen meerdere organisaties kan complex zijn. 792 00:46:13,668 --> 00:46:17,000 Het laatste onderwerp gaat over: 'Waar kan ik hulp halen 793 00:46:17,100 --> 00:46:21,633 als ik aan de slag wil gaan met datagedreven werken?' 794 00:46:21,733 --> 00:46:27,468 Op de eerste plaats is er een overschot aan cursussen, opleidingen, seminars, 795 00:46:27,568 --> 00:46:32,033 workshops, masterclasses op het gebied van datagedreven werken te vinden. 796 00:46:32,133 --> 00:46:34,968 Typ gewoon 'datagedreven werken' en een opleiding erbij 797 00:46:35,068 --> 00:46:38,900 en je wordt overspoeld door een enorme hoeveelheid aanbod. 798 00:46:39,000 --> 00:46:41,733 Daarbij belangrijk is dat je goed moet kijken naar: 799 00:46:41,833 --> 00:46:43,933 wat zijn de verschillende doelgroepen? 800 00:46:44,033 --> 00:46:47,333 Datagedreven werken voor iemand die daadwerkelijk de analyse doet, 801 00:46:47,433 --> 00:46:50,833 gaat meer over het onder de knie krijgen van technische hulpmiddelen, 802 00:46:50,933 --> 00:46:55,768 zoals een R, STATA, SPSS, Python. 803 00:46:55,868 --> 00:46:58,100 Daarnaast is er ook veel opleiding beschikbaar, 804 00:46:58,200 --> 00:47:01,768 voor mensen die juist in staat moeten zijn om de vraag te formuleren. 805 00:47:01,868 --> 00:47:04,068 Het goed stellen van de vraag, op zo'n manier 806 00:47:04,168 --> 00:47:06,600 dat er een datagedreven antwoord uit kan komen, 807 00:47:06,700 --> 00:47:09,568 vergt wel een andere manier van nadenken 808 00:47:09,668 --> 00:47:11,833 dan gewoon maar het stellen van de vraag. 809 00:47:11,933 --> 00:47:14,100 Er is ook expertise om mensen te helpen 810 00:47:14,200 --> 00:47:17,100 om van een vage vraag een scherpe vraag te maken 811 00:47:17,200 --> 00:47:20,600 en te kijken: met welke data kun je een goed antwoord formuleren? 812 00:47:20,700 --> 00:47:25,468 Kortom, er zijn verschillende doelgroepen en uiteraard ook verschillende niveaus. 813 00:47:27,768 --> 00:47:31,968 Als je data zoekt, kun je overspoeld worden door de hoeveelheid. 814 00:47:32,068 --> 00:47:35,668 Maar er zijn een aantal portalen waarbij goed overzicht te vinden is. 815 00:47:35,768 --> 00:47:40,633 Een van de belangrijkste is het Open Data Portaal van het ministerie van BZK. 816 00:47:40,733 --> 00:47:44,568 Die hebben een sleutelrol op het gebied van open data en open overheid 817 00:47:44,668 --> 00:47:47,800 en verzamelen ook heel veel data op hun website. 818 00:47:49,100 --> 00:47:51,668 Die open data is allemaal veilig. 819 00:47:51,768 --> 00:47:55,568 Het is statistiek, geen privacygevoelige data, 820 00:47:55,668 --> 00:48:02,368 dus die is voor iedereen en alle doeleinden veilig te gebruiken. 821 00:48:02,468 --> 00:48:05,400 Daarnaast heb je de open data van het CBS. 822 00:48:05,500 --> 00:48:08,300 En belangrijk, ook de publieke dienstverlening op de kaart 823 00:48:08,400 --> 00:48:10,700 is een dienst van het Kadaster. 824 00:48:10,800 --> 00:48:13,968 Daarbij is veel geografische informatie te vinden. 825 00:48:14,068 --> 00:48:16,433 Al deze data is veilig, kan je zomaar gebruiken 826 00:48:16,533 --> 00:48:20,233 en bijna is allemaal gratis op te halen en te downloaden, met metadata. 827 00:48:20,333 --> 00:48:22,233 Je kan er goed in zoeken. 828 00:48:22,333 --> 00:48:24,368 En vaak is er ook nog hulp beschikbaar, 829 00:48:24,468 --> 00:48:28,500 als je iets meer over die data wil weten. 830 00:48:28,600 --> 00:48:31,533 Het gebruik van microdata van het CBS is ook mogelijk, 831 00:48:31,633 --> 00:48:33,368 onder strenge voorwaarden. 832 00:48:33,468 --> 00:48:38,300 Zoals ik al zei, verzamelen we zeer privacygevoelige informatie. 833 00:48:38,400 --> 00:48:42,568 Daar is informatie over alle Nederlanders in te vinden, over mij, maar ook over u. 834 00:48:42,668 --> 00:48:46,033 Zoals ik al aangaf in het schema met alle soorten data, 835 00:48:46,133 --> 00:48:48,333 ook veel informatie over iedereen. 836 00:48:48,433 --> 00:48:51,068 Daarom is het belangrijk dat we strenge eisen stellen 837 00:48:51,168 --> 00:48:53,568 aan wie er toegang heeft tot die data. 838 00:48:53,668 --> 00:48:56,700 Dat geldt zowel voor de organisatie, die moet goedgekeurd worden, 839 00:48:56,800 --> 00:48:59,200 maar ook voor de onderzoekers van die organisatie. 840 00:48:59,300 --> 00:49:03,168 Die moet laten zien dat ze begrijpen wat de veiligheidsmaatregelen zijn. 841 00:49:03,268 --> 00:49:07,100 En dan kan je inloggen op de systemen van het CBS en daar onderzoek doen. 842 00:49:07,200 --> 00:49:10,168 Op het moment dat wij denken dat het onderzoek afgerond is 843 00:49:10,268 --> 00:49:12,800 en je maakt output die weer naar buiten moet, 844 00:49:12,900 --> 00:49:15,168 controleren wij eerst of het veilig is. 845 00:49:15,268 --> 00:49:18,368 Veel Nederlandse organisaties binnen de overheid zijn ook in staat 846 00:49:18,468 --> 00:49:21,768 om dergelijk onderzoek binnen hun eigen organisatie te doen. 847 00:49:21,868 --> 00:49:24,300 Als je dat wil, kijk op de website van het CBS. 848 00:49:24,400 --> 00:49:29,000 Het is niet het makkelijkste proces, maar het kan je wel erg helpen. 849 00:49:30,700 --> 00:49:34,133 Daarnaast is hulp bij projecten bij het doen van analyses ook mogelijk. 850 00:49:34,233 --> 00:49:37,900 Je kunt dan bij het CBS terecht. Als je prognoses en toekomstvoorspellingen wil, 851 00:49:38,000 --> 00:49:40,368 kun je ook bij een planbureau aankloppen. 852 00:49:40,468 --> 00:49:42,568 Die zijn wel bedoeld om prognoses te maken 853 00:49:42,668 --> 00:49:46,000 en je kunt ook hier weer hulp halen bij het bedrijfsleven. 854 00:49:46,100 --> 00:49:49,768 We zien dat er veel partijen in de Nederlandse samenleving 855 00:49:49,868 --> 00:49:51,933 bezig zijn met datagedreven werken. 856 00:49:52,033 --> 00:49:56,833 En we hebben gepoogd om die bij elkaar te brengen in een data-ecosysteem. 857 00:49:56,933 --> 00:49:59,668 Hier proberen we zowel universiteiten als hogescholen, 858 00:49:59,768 --> 00:50:02,533 die ook meer naar de bestuurskundige of bedrijfsmatige kant 859 00:50:02,633 --> 00:50:05,700 van datagedreven werken kijken, te koppelen aan bedrijfsleven 860 00:50:05,800 --> 00:50:10,100 dat inhoudelijke voorspellingen mag doen, maar ook beleidsuitspraken, 861 00:50:10,200 --> 00:50:11,933 het CBS met de datapropositie 862 00:50:12,033 --> 00:50:14,700 en andere overheden die de vraagkant vertegenwoordigen. 863 00:50:14,800 --> 00:50:17,800 De bedoeling is: hoe kunnen we samen de Nederlandse samenleving 864 00:50:17,900 --> 00:50:21,068 een stap laten maken op het gebied van verder datagedreven werken. 865 00:50:21,168 --> 00:50:23,800 Ook daar is voor veel partijen hulp te halen. 866 00:50:23,900 --> 00:50:28,768 We hebben ook een website waar je terecht kan. 867 00:50:28,868 --> 00:50:31,833 Samenvattend: waar kan ik hulp halen? 868 00:50:31,933 --> 00:50:35,033 Inhoudelijke keuzes en opleiding, een scala wordt aangeboden. 869 00:50:35,133 --> 00:50:38,433 Kijk naar de rollen en het niveau. 870 00:50:38,533 --> 00:50:42,600 Er zijn verschillende portalen waarin je open data en statistiek kan vinden. 871 00:50:42,700 --> 00:50:45,733 Gebruik van microdata kan ook, maar wel onder voorwaarden 872 00:50:45,833 --> 00:50:49,068 en vergt ook de nodige kennis en ervaring om goed mee om te gaan. 873 00:50:49,168 --> 00:50:54,233 Hulp bij projecten is mogelijk en kijk ook naar het data-ecosysteem. 874 00:50:55,900 --> 00:50:59,568 Ik zie nog een vraag van de heer of mevrouw Ploem: 875 00:50:59,668 --> 00:51:03,400 'Heb ik goed begrepen dat het CBS in principe geen extra data verzameld 876 00:51:03,500 --> 00:51:04,868 voor specifieke vragen, 877 00:51:04,968 --> 00:51:08,900 maar wel beschikbare data kan combineren daarvoor?' 878 00:51:09,000 --> 00:51:12,400 Ook hier is het antwoord weer ja en nee. 879 00:51:12,500 --> 00:51:15,868 We verzamelen wel degelijk af en toe nieuwe data. 880 00:51:15,968 --> 00:51:19,200 We doen nog steeds enquêtes. Er is nog steeds bepaalde informatie 881 00:51:19,300 --> 00:51:24,400 die we niet kunnen halen uit de registers en administraties. 882 00:51:24,500 --> 00:51:26,733 We doen bijvoorbeeld enquêtes op het gebied van: 883 00:51:26,833 --> 00:51:28,733 hoe veilig voelen mensen zich in de buurt? 884 00:51:28,833 --> 00:51:32,633 Of op het gebied van verkeer en vervoer. 885 00:51:32,733 --> 00:51:37,033 Het is mogelijk om bij dat soort enquêtes specifieke vragen toe te voegen 886 00:51:37,133 --> 00:51:41,900 die te maken hebben met een beleids- onderwerp waar iemand mee bezig is. 887 00:51:42,000 --> 00:51:46,033 Ik kan me indenken dat we bij verkeer en vervoer dingen toevoegen als: 888 00:51:46,133 --> 00:51:49,300 'Wat is het doel van deze rit,' als het over auto's gaat. 889 00:51:49,400 --> 00:51:51,968 Daarnaast is iets mogelijk in de vorm van oversampling. 890 00:51:52,068 --> 00:51:55,933 Als wij een enquête uitsturen, willen we een landelijk dekkend beeld krijgen. 891 00:51:56,033 --> 00:51:57,668 Zo doen in een bepaalde gemeente 892 00:51:57,768 --> 00:52:00,568 misschien maar een of twee huishoudens mee. 893 00:52:00,668 --> 00:52:03,600 Als je ook iets over die specifieke gemeente willen zeggen, 894 00:52:03,700 --> 00:52:06,900 moet je veel meer huishoudens in die gemeente selecteren 895 00:52:07,000 --> 00:52:09,268 om mee te doen aan die specifieke enquête. 896 00:52:09,368 --> 00:52:11,368 Dit heet oversampling. 897 00:52:11,468 --> 00:52:14,868 Dat kunnen we doen en daarmee krijg je dus een beeld van die gemeente. 898 00:52:14,968 --> 00:52:17,568 Het gaat hier over het extra stellen van vragen 899 00:52:17,668 --> 00:52:21,733 of het extra meenemen van mensen in een bepaalde enquête. 900 00:52:21,833 --> 00:52:25,500 Het gebeurt zelden dat we een nieuwe enquête opzetten. 901 00:52:25,600 --> 00:52:28,700 Het gebeurt nog weleens dat we nieuwe data uit administraties 902 00:52:28,800 --> 00:52:31,300 en registraties proberen te krijgen als dat nodig is 903 00:52:31,400 --> 00:52:33,900 om op een belangrijke beleidsvraag antwoord te geven. 904 00:52:34,000 --> 00:52:35,968 Maar dit is wel een zeldzaamheid. 905 00:52:36,068 --> 00:52:39,433 Er zijn databronnen in Nederland waar het CBS geen toegang toe heeft 906 00:52:39,533 --> 00:52:42,600 die bijvoorbeeld wel beschikbaar zijn binnen de overheid, 907 00:52:42,700 --> 00:52:46,968 maar ook bij partijen in het bedrijfsleven of buiten de overheid. 908 00:52:47,068 --> 00:52:50,768 Als we die data nodig hebben om aan een beleidsvraag te kunnen voldoen, 909 00:52:50,868 --> 00:52:54,433 zullen we kijken of we daarbij kunnen komen, maar we kunnen dat niet opeisen. 910 00:52:54,533 --> 00:52:58,100 We kunnen nooit garanderen dat we dat beschikbaar krijgen. 911 00:53:00,168 --> 00:53:01,300 Dan afsluitend: 912 00:53:01,400 --> 00:53:05,468 voor dit webinar heb ik nog een aantal nuttige bronnen verzameld 913 00:53:05,568 --> 00:53:07,833 en ik kan deze sheet even laten staan. 914 00:53:07,933 --> 00:53:12,068 Ik heb hier een aantal bronnen met daarbij de internetadressen 915 00:53:12,168 --> 00:53:16,868 waar aanvullende informatie te vinden is, verspreid over een aantal onderwerpen. 916 00:53:16,968 --> 00:53:20,668 Een aantal ervan verwijzen naar de website van het CBS, 917 00:53:20,768 --> 00:53:25,868 maar ook PDOK, wat ik al noemde, en data.overheid.nl bij het BZK. 918 00:53:25,968 --> 00:53:29,633 En hier staat ook het data-ecosysteem bij, dat, 919 00:53:29,733 --> 00:53:33,933 hoe kan het ook anders, te herkennen is aan data-ecosysteem.nl. 920 00:53:34,033 --> 00:53:35,700 Als u deze informatie wil bewaren, 921 00:53:35,800 --> 00:53:39,200 ik weet niet waar deze presentatie nog openbaar wordt gemaakt. 922 00:53:39,300 --> 00:53:44,168 Ik raad u al snel even een foto te maken van het scherm. 923 00:53:44,268 --> 00:53:50,000 En dan wil ik u allemaal hartelijk bedanken voor uw kijken naar dit seminar. 924 00:53:50,100 --> 00:53:52,300 Als u aan de volgende seminars wilt deelnemen, 925 00:53:52,400 --> 00:53:55,668 heeft u hier een scherm waarop u uw deelname kunt bevestigen. 926 00:53:55,768 --> 00:53:57,900 Ik wens u verder veel succes 927 00:53:58,000 --> 00:54:03,100 met het opstarten van beleidsgedreven datawerken in eigen praktijk. 928 00:54:03,200 --> 00:54:04,800 Hartelijk dank.