salonanarchist | leunstoelactivist

Data

Trust instead of algorithms

A number of Dutch cities have contracted a company named Totta data lab to predict which welfare recipients may have committed fraud (the cities were somewhat secretive about this approach, but newspaper NRC wrote about it last spring). Totta has trained algorithms on a considerable amount of personal data: 2 to 3 hundred variables over a period of 25 years.

Such analyses carry the risk that existing biases are reproduced:

Luk [A Totta spokesperson] says that in some municipalities more fraud is found among people who have a partner (e.g., they don’t report income), whereas in others it is people without a partner (failing to report they live together). «But it’s quite possible that only that group has been investigated and we build our algorithms on that.»

Luk says they sometimes add ‘deviant’ citizens to the suspects, apparently in an attempt to look beyond the usual suspects.

Another problem is the lack of transparency regarding how this type of algorithms work. Totta doesn’t disclose its algorithms because it wants to protect its business interests; further, it can be difficult to interpret and explain how algorithms work. As a result, the government is unable to explain what criteria it uses to prepare decisions that affect citizens. Recently, the Dutch Council of State expressed concerns over digital decision-making by the government.

Proponents of algorithms argue that they help to detect more fraud while reducing the burden for innocent citizens. In fact, there may not be such a clear distinction. The organisation of welfare agencies said that alleged welfare frauds are often people who mean no harm, but who get into trouble as a result of complex and ambiguous welfare rules.

Still, Amsterdam city council member Anne Marttin (VVD) finds the approach interesting. She asked if Amsterdam uses algorithms and data mining to detect welfare fraude. The answer is no. This is why:

The city government is aware of the use by other municipalities of algorithms and/or data mining to fight welfare fraud. The city does not use such instruments to deal with or prevent welfare fraud. […]

Our services for welfare recipients are based on trust. Further, the city government attaches great importance to the privacy of citizens and the way in which their data is used by the government, for example to develop algorithms. The city government thinks it’s very important that the use of data mining and algorithms doesn’t have a negative impact on the privacy and the legal protection of citizens.

Source (pdf)

Vertrouwen in plaats van algoritmes

Verschillende gemeenten hebben het bedrijf Totta data lab ingehuurd om te voorspellen welke uitkeringsgerechtigden misschien frauderen (ze hebben dit zelf niet actief naar buiten gebracht, maar de NRC schreef er afgelopen voorjaar over). Totta heeft algoritmes getraind op een enorme hoeveelheid persoonsgegevens: twee- tot driehonderd variabelen over een periode van 25 jaar.

Dit soort analyses brengen het risico met zich mee dat bestaande vooroordelen worden versterkt:

Luk [een Tottawoordvoerder] zegt dat bij de ene gemeente meer fraude gevonden wordt bij mensen mét partner (die geven bijvoorbeeld inkomsten niet op), terwijl het in andere gaat het om mensen zónder partner (die geven niet op dat ze samenwonen). «Maar het kan ook zijn dat er alleen onderzocht is op die groep en dat wij daar ons algoritme op bouwen.»

Luk zegt dat ze soms ook ‘afwijkende’ burgers als verdachte aanmerken. Zo willen ze waarschijnlijk voorkomen dat alleen de usual suspects in beeld komen.

Een ander probleem is het gebrek aan transparantie. Totta houdt zijn algoritmes geheim om zijn bedrijfsbelang te beschermen. Daarnaast kan het lastig zijn om de werking van algoritmes te interpreteren en uit te leggen. Hierdoor kan de overheid niet goed uitleggen welke criteria een rol spelen bij besluiten over burgers. De Raad van State heeft onlangs vraagtekens geplaatst bij de digitalisering van overheidsbesluiten.

De aanbieders van algoritmes zeggen dat deze aanpak helpt om meer fraudeurs op te pakken en tegelijk minder onschuldige burgers lastig te vallen. De werkelijkheid is waarschijnlijk ingewikkelder. Volgens de koepel van sociale diensten zijn vermeende fraudeurs vaak mensen van goede wil, die in de problemen komen door de complexe en onduidelijke bijstandsregels.

Gemeenteraadslid Anne Marttin (VVD) ziet de aanpak even goed wel zitten. Ze wil weten of Amsterdam al gebruik maakt van algoritmes en datamining bij de aanpak van bijstandsfraude. Het antwoord is nee. Dit is de reden:

Het college is bekend met het gebruik van algoritmes en/of datamining ter bestrijding van bijstandsfraude in andere gemeenten. Het college maakt geen gebruik van dergelijke instrumenten in de aanpak en preventie van bijstandsfraude. […]

De basis van de dienstverlening aan bijstandsgerechtigden is vertrouwen. Het college hecht ook grote waarde aan de privacy van de burger en de wijze waarop diens gegevens door de overheid worden gebruikt, bijvoorbeeld voor het ontwikkelen van algoritmes. Het college vindt het van groot belang dat gebruik van datamining en algoritmes geen negatieve invloed heeft op de privacy van de bijstandsgerechtigde en diens rechtsbescherming.

Beantwoording raadsvragen (pdf)

Adressen koppelen aan wijken of buurten

Het CBS heeft uitgebreide gegevens (selecteer thema Nederland regionaal) op wijk- en buurtniveau. Soms kan het handig zijn om adressen te koppelen aan de bijbehorende wijk of buurt. Daar komt wel wat bij kijken: adressen geocoden (of coördinaten opzoeken bij het Kadaster) en vervolgens die lokaties weer koppelen aan de shapefile van de Kernkaart wijken en buurten.

Maar dat kan nu ook sneller en simpeler. Het CBS heeft een tabel vrijgegeven waarin elke combinatie van postcode en huisnummer wordt gekoppeld aan de bijbehorende buurt en wijk.

Vijf Wob-verzoeken over de speech van minister Blok

Op 10 juli sprak minister Blok zijn twijfels uit over de multiculturele samenleving en noemde hij Suriname een failed state. Sindsdien zijn er tenminste vijf Wob-verzoeken ingediend. De vragen verschillen nogal, de antwoorden ook.

De onderwerpen

Ik heb de verzoeken genummerd (de nummering is willekeurig). Zie eind van het artikel voor de precieze formulering zoals weergegeven door het ministerie.

  • Twee Wob-verzoeken vragen om de opnames van de speech (verzoek 3, 5). Dit levert niets op: het transcript van de speech en de discussie daarna was inmiddels openbaar. Het was half augustus naar de Kamer gestuurd in antwoord op vragen van Ploumen (PvdA).
  • In zijn speech zei Blok dat hij op zijn ministerie de vraag had uitgezet: ‘noem mij een voorbeeld van een multi-etnische of multiculturele samenleving, waar de oorspronkelijke bevolking nog woont’. Twee Wobverzoeken gingen over de vraag van Blok en de reactie van zijn ambtenaren (verzoek 1, 2). Dit had politiek gevoelige antwoorden op kunnen leveren, maar er kwam niets: volgens het ministerie heeft Blok nooit een formele vraag uitgezet; het is alleen ‘opgeworpen’ tijdens intern overleg en daar is geen ‘specifiek antwoord’ op gekomen. Overigens kwam dit onderwerp ook al aan de orde in de Kamervragen van Ploumen en de beantwoording daarvan.
  • De twee verzoeken die wel resultaat hebben opgeleverd zijn tegelijk specifiek en ruim geformuleerd. Ze vragen onder meer om alle interne (en externe) communicatie tijdens de voorbereiding van de speech en de weken na de speech. Eén van de verzoeken vraagt specifiek naar communicatie met buitenlandse autoriteiten (verzoek 4, 5).

De documenten die zijn vrijgegeven op basis van verzoeken 4 en 5 lijken grotendeels identiek te zijn, maar verzoek 4 heeft meer praktische informatie opgeleverd over de voorbereiding van de bijeenkomst.

Verzoek 5 vroeg om Alle ambtelijke correspondentie ter voorbereiding van de speech; verzoek 4 om alle interne en externe communicatie en overige documenten die betrekking hebben op de aanwezigheid van en uitspraken gedaan door minister Blok. Die laatste formulering leverde blijkbaar meer op.

Betrekkingen met andere staten

Vaak worden Wobverzoeken (deels) afgewezen met een beroep op de persoonlijke levenssfeer van betrokkenen, of de persoonlijke beleidsopvattingen van ambtenaren. In de Blokwobs duikt een ander argument op: openbaarmaking zou de betrekkingen met andere staten schaden. Dit wordt vrij ruim opgevat:

Voor de toepassing van deze bepaling is het niet noodzakelijk dat men een verslechtering van de goede betrekkingen als zodanig met andere landen voorziet. Voldoende is dat men als gevolg van het verschaffen van informatie voorziet dat het internationale contact op bepaalde punten stroever zal gaan lopen […].

Meteen online, RTL pikt het op

De verzoeken zijn ingediend tussen 23 juli en 27 augustus. De besluiten zijn allemaal gedateerd op 3 september en diezelfde dag online gezet. De journalisten die een verzoek hadden ingediend moesten dus snel handelen als ze nog met een scoop wilden komen. RTL lijkt zelf geen verzoek te hebben gedaan, maar ontdekte de besluiten en zette ’s nachts een artikel online op basis van de antwoorden op verzoek 4.

De NOS heeft de dag erna een verhaal gepubliceerd van researchredacteuren Ben Meindertsma en Hugo van der Parre. Dat verhaal was gebaseerd op hun eigen Wobverzoek. Vermoedelijk ging dit ook om verzoek 4, waar RTL dus al een berichtje over had gemaakt.

De Volkskrant meldt dat ze een Wob hadden ingediend over de rondvraag van Blok onder zijn eigen ambtenaren (ik gok verzoek 2).

Conclusie

In de eerste plaats, maar dat is een open deur: het maakt nogal uit hoe je je Wobverzoek formuleert.

Hard nieuws hebben de Wobverzoeken niet opgeleverd. Voor een deel zal dat komen doordat er al informatie naar buiten was gebracht in antwoord op de Kamervragen van Ploumen; voor een deel doordat er niets op papier stond over de uitvraag die Blok onder zijn ambtenaren heeft gedaan. Wel bieden de Wobs een inkijkje in de cultuur op het ministerie, waar de minister M wordt genoemd en sommige mails worden ge-cc’d aan het hele M-team.

Bijlage: de gestelde vragen

Onder voorbehoud van eventuele ocr-fouten:

Verzoek 1, 27 juli

U vraagt om de openbaarmaking van: “alle informatie […] betreffende de vraag die door minister Stef Blok van Buitenlandse Zaken en/of zijn medewerkers is uitgezet op het ministerie aangaande multi-etnische en/of multiculturele samenlevingen waar wel of geen vreedzaam samenlevingsverband is en waarop hij heeft gedoeld tijdens het netwerkevenement Touch Dutch Base op 10 juli 2018. Hieronder valt ook alle correspondentie over dit onderwerp, de complete vraagstelling en de beantwoording door ambtenaren en/of externen — evenals alle andere informatie en documentatie die met deze vraag van de minister samenhangt.”

Verzoek 2, 27 augustus

In uw brief haalt u de volgende uitspraak aan van minister Blok:
“(..) Ik heb de vraag uitgezet op mijn ministerie maar die doe ik hier
ook: noem mij een voorbeeld van een multi—etnische of multiculturele
samenleving, waar de oorspronkelijke bevolking nog woont. (…)”

Naar aanlelding van die uitspraak, vraagt u op grond van de Wob om het
volgende:

  1. “Kopie van, subsidiair inzage in, alle documenten bij of onder uw ministerie aanwezig met vermelding van ‘de vraag’ van minister Blok waarop hij doelde tijdens zijn gesprek bij de Touch Dutch Base 2018.

  2. Kopie van, subsidiair inzage in, alle documenten bij of onder uw ministerie aanwezig met betrekking tot de afhandeling van ‘de vraag’ van minister Blok waarop hij doelde tijdens zijn gesprek bij de Touch Dutch Base 2018.”

Verzoek 3, 30 juli

U vraagt om de openbaarmaking van: “de opnames die op 10 juli 2018 zijn gemaakt van de onder auspiciën van het ministerie van Buitenlandse Zaken georganiseerde Touch Dutch Base-conferentie in het Johan de Witthuis in Den Haag.”

Verzoek 4, 23 juli

U vraagt om de openbaarmaking van: “alle interne en externe communicatie en overige documenten die betrekking hebben op de aanwezigheid van en uitspraken gedaan door minister Blok op de besloten bijeenkomst Touch Dutch Base 2018, op 10 juli 2018, zowel voorafgaand als na afloop van de bijeenkomst, in de periode 7 maart 2018 tot en met 23 juli 2018.”

Uw verzoek is inclusief: “alle communicatie die valt onder of bij de Nationaal Coördinator Internationale Functies (NCIF) en alle schriftelijke communicatie met buitenlandse autoriteiten die betrekking heeft op de uitspraken gedaan door minister Blok op deze bewuste bijeenkomst, alsmede reacties van bultenlandse autoriteiten die betrekking hebben op de uitspraken van de minister.”

Verzoek 5, 31 juli

U vraagt om de openbaarmaking van de volgende documenten:

  1. “de opname van de toespraak die u op genoemde bijeenkomst heeft gehouden, waaronder ook de interactie met de toehoorders. Het besloten karakter van deze bijeenkomst is door alle publiciteit reeds geschonden, en in het kader van het democratisch proces en de maatschappelijke discussie, is het van belang te weten hoe deze bijeenkomst precies verlopen is. Subsidiair verzoek ik een kopie van de opname van uw bijdrage aan bovengenoemde bijeenkomst, waarbij de stemmen van de andere sprekers (niet zijnde de minister) onherkenbaar zijn.

  2. Een kopie van de tekst van de speech, zoals die oorspronkelijk (in concept) aan u is aangeleverd. Ook indien dit niet de toespraak was die u daadwerkelijk gehouden hebt.

  3. Alle ambtelijke correspondentie ter voorbereiding van de speech.

  4. Alle ambtelijke correspondentie over de speech/het optreden in de eerste dagen na genoemde bijeenkomst en na het openbaar worden van delen daarvan. Dat wil zeggen de correspondentie van u en ambtenaren van uw ministerie over deze bijeenkomst van 10 juli t/m 25 juli 2018.”

Is het woord ‘data’ enkelvoud

Veel Engelstalige publicaties zijn allang gestopt om het woord data als meervoud te beschouwen (‘pompous’). Volgens m’n digitale Van Dale is het woord in het Nederlands nog altijd meervoud, maar volgens een onderzoeker van het Meertensinstituut is er ook in onze taal niets mis met ‘de data is’. Mijn niet-gefundeerde indruk is dat deze variant nog niet erg is ingeburgerd. Misschien komt dat omdat we het woord ‘gegevens’ als niet-pompeus alternatief hebben.

Pages