Hieronder vind je een recent voorbeeld van de maandelijkse nieuwsbrief. Meld je hier aan om de nieuwsbrief te ontvangen.

Persoonsgegevens

‘Tracking in strijd met AVG’

De manier waarop Google en andere bedrijven je gedrag op internet volgen is in strijd met de AVG. De popups waarmee ze toestemming vragen veranderen daar niets aan: «IAB Europe created a fake consent system that spammed everyone, every day, and served no purpose other than to give a thin legal cover to the massive data breach at the heart of online advertising.»

Dat zou blijken uit een conceptbesluit van de Belgische Gegevensbeschermingsautoriteit in een zaak die is aangekaart door de Irish Council for Civil Liberties, in samenwerking met o.a. het Nederlandse Bits of Freedom. TechCrunch spreekt alvast van een nucleaire uitspraak en beschrijft hoe het verdere proces eruitziet. (via @marleenstikker)

Geheime html-code

Een journalist in de Amerikaanse staat Missouri heeft een datalek blootgelegd: persoonsgegevens van docenten stonden open en bloot in de html-code van een overheidswebsite. De journalist gaf de beheerders van de site de gelegenheid om het probleem op te lossen voordat hij erover publiceerde.

In plaats van de journalist te bedanken, gaf de gouverneur opdracht om hem te vervolgen. Hij noemde de journalist een hacker, die zichzelf onrechtmatig toegang had verschaft tot informatie met als doel om de staat in verlegenheid te brengen. Zo’n beetje iedereen vindt dit een vrij bizarre reactie, maar de gouverneur lijkt zich hier weinig van aan te trekken. Hij vindt dat hij het mikpunt is van elitaire kritiek omdat hij geen verstand heeft van computers.

Openbaarheid

Handelsregister

De KvK moet adresgegevens van zzp’ers afschermen, maar voor de rest moeten bedrijfsgegevens gewoon als open data beschikbaar komen. Op die manier waren de schimmige constructies van minister Hoekstra en andere prominenten eerder boven water gekomen, schrijven Serv Wiemers en Bo Hijstek van Open State.

Ongenuanceerd

Het is een beetje onwerkelijk om je eigen emails terug te lezen in stukken die openbaar zijn gemaakt op basis van de Wob. Wat Volkskrantjournalist Ariejan Korteweg overkwam gaat nog een stapje verder: hij las in een gewobt document hoe ambtenaren commentaar geven op zijn column. Ze vonden die column ‘wat ongenuanceerd’.

Algoritmes

Five points for anger

In 2017 besloot Facebook om berichten prominenter te laten zien als ze emotionele reacties oproepen. Je kan op een artikel reageren met een gewone ‘like’; dat levert 1 punt op. Maar je kan ook reageren met de emoji love, haha, wow, sad of angry; dat levert 5 punten op. Het voorspelbare gevolg was een toename van spam/abuse/clickbait.

Het bericht geeft een verassend inkijkje in de techniek achter Facebook. Je zou verwachten dat geavanceerde zelflerende programma’s bepalen welke berichten een prominente plek krijgen, maar in werkelijkheid zijn het dus gewoon engineers die met een natte vinger punten toekennen aan de reacties die een bericht ontvangt: «five points for anger, one for a ‘like’.»

Risicoprofielen

Maureen van der Pligt (FNV) en Ronald Huissen (Platform Burgerrechten) plaatsen vraagtekens bij het gebruik van risicoprofielen door de overheid. Ze hebben niet alleen kritiek op zwarte lijsten op basis van etniciteit, maar ook op risicoprofielen die gebruikmaken van andere kenmerken. «Want op basis van welke kennis meen je dat je iemand op een risicolijst mag plaatsen? Omdat diegene statistisch lijkt op iemand die in het verleden iets fout deed?» Het artikel staat wel achter een betaalmuur.

Statistiek

Statistiekwaakhond heeft het druk

Door corona is er een sterke toename van het aantal zaken die zijn behandeld door de Britse statistiekwaakhond OSR. In de 12 maanden tot en met maart 2020 boog de OSR zich over 109 zaken; in het jaar erna steeg dat naar 323. In het verleden werden zaken vaak aangedragen door ambtenaren en onderzoekers, maar afgelopen jaar kwam ruim de helft van gewone burgers. Veel zaken hadden te maken met coronacijfers.

Sowieso is het natuurlijk interessant dat ze in Groot-Brittannië een statistiekwaakhond hebben. De OSR houdt onder meer toezicht op de ONS, de Britse tegenhanger van het CBS.

Stakingsstatistiek

In Amerika is een stakingsgolfje aan de gang, met werkonderbrekingen in de gezondheidszorg, de mijnbouw, de afvalverwerking, bij tractorbouwer John Deere en bij Kellogg’s. Aan de officiële statistieken zou je dat niet snel merken. Sinds de jaren tachtig worden stakingen in Amerika pas geregistreerd als er minstens duizend mensen aan meedoen en ze minstens een hele dienst duren.

Onderzoekers van Cornell University hebben besloten om een eigen database op te bouwen van stakingen en acties. Ze verzamelen de informatie handmatig via Google News, maar ze werken ook aan scrapers om informatie automatisch van Twitter te plukken.

In Nederland hebben we de stakingsdatabase van historicus Sjaak van der Velden, met flink wat stakingen die niet zijn opgenomen in de stakingsstatistiek van het CBS. Voor een deel ligt dat aan de methodes en definities; zo telt het CBS politieke stakingen en solidariteitsstakingen gewoonlijk niet mee. Het mooie is overigens dat het CBS ooit samen met Van der Velden precies heeft uitgezocht (pdf) waar de verschillen vandaan komen.

Grafieken

Declutter & focus

Bijna alle boeken over datavisualisatie adviseren om onnodige details te verwijderen (declutter) en om de aandacht te vestigen op relevante onderdelen van een grafiek (focus).

Een groep onderzoekers heeft getest of deze adviezen in de praktijk ook betere grafieken opleveren. Als je onnodige details verwijdert (declutter) dan maakt je grafiek een professionelere indruk. Als je ook nog de aandacht richt op relevante onderdelen van de grafiek (focus) dan vinden mensen je grafiek mooier en duidelijker en onthouden ze bovendien beter de relevante informatie uit de grafiek.

De aanpassingen zorgen er niet voor dat proefpersonen de betrouwbaarheid van grafieken anders inschatten (via @maartenzam).

Kaarten

Strandscherm in vogelgebied

Bij vrijwilligers van Open Street Map in Duitsland zijn klachten binnengekomen over overlast van badgasten en barbecuefeesten op stranden in natuurgebieden die tijdens de broedperiode afgesloten zijn voor het publiek (hier bijvoorbeeld).

Een deel van de vrijwilligers ziet het probleem vooral bij Komoot. Deze fiets- en looprouteapp zou de indruk wekken dat elk strand toegankelijk is voor badgasten: «Komoot zeichnet hübsch überall mitten ins Vogelschutzgebiet ein Strandschirmchen ein.»

Inmiddels hebben de vrijwilligers van het strandje een kiezelstrand gemaakt, het natuurgebied ingetekend en nog wat wijzigingen doorgevoerd. Komoot maakt nu melding van een beruhigte Zone (wel even inzoomen). Via weeklyOSM.

Uitdaging voor kaartenmakers

Deze maand is er weer de 30-day map challenge. Het idee is om elke dag een kaart te maken; elke dag heeft een eigen thema of opdracht. Op 14 november bijvoorbeeld ‘Map with a new tool’, de dag erna ‘Map without using a computer’ en op 29 november is het thema NULL.

Hier vast een greep uit de voorbeelden die de eerste dagen hebben opgeleverd: wat gebeurt er als je de kustlijn van Ierland stap voor stap versimpelt; vanaf waar kan je de vuurtorens langs de Engelse kust zien; een variant op the Correct Map of England Adapted for the Use of the Ladies (?) en een heatmap van Chinese restaurants in New York.

Reisduur

Een intrigerende kaart laat zien welke delen van Frankrijk je vanuit Parijs sneller per trein bereikt (blauw), en welke met de auto (rood). Eigenlijk moet je er ook een kaart van het TGV-netwerk bijpakken.