Regio Noord-Holland | Synthetiseren en verrijken van data voor datagedreven beleidsimplementaties
Gemeenten zijn sinds 2015 onder andere verantwoordelijk voor jeugdzorg, en zorg aan langdurig zieken en ouderen. Om hiervoor effectief beleid te ontwikkelen, en gegronde beslissingen te nemen, is datagedreven werken van cruciaal belang. Het blijkt echter dat gemeenten te weinig inzichten hebben over hun eigen inwoners en die van soortgelijke gemeenten om efficiënt en effectief datagedreven beleid te implementeren..Eén van de oorzaken van dit maatschappelijke probleem is dat cijfers over de diverse beleidsterreinen en demografische karakteristieken apart worden geregistreerd en bijgehouden, waardoor comparatief inzicht vaak ontbreekt. Daarnaast is data van de aanverwante wetgevingen slechts beperkt en niet op persoonsniveau gekoppeld beschikbaar, waardoor substitutie effecten niet geduid kunnen worden. Een andere oorzaak waardoor gemeenten moeite hebben om efficiënt en effectief datagedreven beleid te implementeren ligt in de restricties van datadeling. Privacygevoelige data mag vanwege wet- en regelgeving, zoals de algemene verordening gegevensbescherming (AVG), niet gedeeld worden. Hierdoor is het voor gemeenten niet mogelijk om trends te benchmarken ten opzichte van andere gemeenten..Microdata van het Centraal Bureau van de Statistiek (CBS) biedt mogelijkheden om gemeenten veel meer inzicht te geven dan momenteel beschikbaar binnen gemeentelijke registers. Echter, de data in deze dataset komt met een vertraging van 3 maanden tot soms 2 jaar beschikbaar, waardoor het realtime analyseren van trends om gericht beleidsinterventies te doen en te evalueren niet mogelijk is. Daarnaast beschikken de meeste gemeenten niet over de capaciteiten om data-analyses binnen de CBS-microdata omgeving uit te voeren en überhaupt tot bruikbare inzichten te komen.Syntho en Stichting AHTI willen dit maatschappelijke probleem oplossen door een gebruiksvriendelijk softwareplatform te ontwikkelen waarmee datadeling van privacygevoelige gegevens tussen gemeenten mogelijk wordt en waarmee de beperkte data die nu voor gemeente beschikbaar is wordt aangevuld/verrijkt. De samenwerkingspartners beogen dit te realiseren door Federated Learning en Conditional Data Generation (CDG) technieken toe te passen..Via CDG wordt data van gemeenten (bijv. geslacht, leeftijd, nationaliteit en verblijfplaats) met een minimale tijdvertraging verrijkt met data zoals inkomstendata en opleidingsniveau uit de CBS-dataset. Doordat gemeenten hiermee meer actuele data hebben over specifieke groepen kunnen zij bijvoorbeeld snel profielen identificeren die significant meer zorgkosten maken dan andere profielen. Het softwareplatform geeft deze inzichten op een gebruiksvriendelijke manier weer aan gemeenten, waardoor er vervolgens effectief en efficiënt beleid gemaakt kan worden om deze profielen specifiek te bereiken en de effecten van dit beleid realtime te monitoren..Via Federated Learning (synthetiseren) is het mogelijk om privacygevoelige data van gemeenten veilig te ontsluiten, waardoor datadeling tussen gemeenten wordt gefaciliteerd. Hiermee maakt het softwareplatform het mogelijk om data, inzichten en beleidsinterventies realtime te vergelijken en te benchmarken ten opzichte van andere gemeenten zonder privacy hierbij in het geding te brengen. Het samenwerkingsverband verwacht dat het innovatieve softwareplatform op deze manier voor datagedreven best-practices zal zorgen. Met als eindresultaat effectieve en efficiënte beleidsimplementaties.