champagne anarchist | armchair activist

Data

How did Tinkebell obtain all that personal information

Almost three years ago, artists Tinkebell and Coralie Vogelaar published the book Dearest Tinkebell, in which they revealed the identity, photos, addresses and all sorts of embarrassing personal information about people who had sent hate mail to ‘cat murderer’ Tinkebell. The book is again drawing attention because of an article in the Guardian.

How did Tinkebell go about investigating the people who had made threats against her? “By checking whether the email addresses were registered at other websites as well, she could easily discover the identity of many of the people who had made threats against her”, the Volkskrant wrote. In this way, she got access to ‘Facebook profiles, Amazon wish lists and Youtube accounts’.

Of course, it wasn’t as easy as the Volkskrant suggests. In a supplement to the book, Vogelaar describes five steps to find out the identity of a mailer. Step 1 simply consists in googling the email address. “Often this only resulted in comments on blogs and sometimes a small profile but rarely in a full name.”

Apparently, the interesting information didn’t usually surface until step 2, in which the email addresses were linked to the Rapleaf database (steps 3 to 5 are mainly about verifying the information). When Tinkebell and Vogelaar published their book, nobody had heard about that company. That changed in 2010, when the Wall Street Journal created a bit of a fuss with a series of articles on the trade in personal information, under the title ‘What they know’.

One of the main companies active on this market is Rapleaf, which at the time claimed it had one billion email addresses at its disposal. These addresses are linked with data on your social network activity, your purchases and other information. In this way, the company builds a detailed profile of you. A spokesperson said at the time that Rapleaf never reveals people’s names to clients, but Vogelaar and Tinkebell had already shown that you can easily obtain someone’s identity with the data provided by the company – and much more.

Summary: 

In 2010, the WSJ caused a bit of a stir by describing how companies like Rapleaf deal in very detailed personal information, gathered online. A year and a half earlier, artists Tinkebell and Vogelaar had already demonstrated how Rapleaf’s databases can be used to expose the identity, photos, addresses and embarrassing personal details of people who had sent threat mails to ‘cat murderer’ Tinkebell (see also the Guardian on their project).

Metalbands in kaart gebracht


Ik hou niet eens van metal, maar het idee is briljant: iemand heeft een wereldkaart gemaakt met het aantal metalbands per 100.000 inwoners (via FlowingData). Als je het trucje doorhebt is het niet zo ingewikkeld om er ook een van Nederland te maken. De Encyclopaedia Metallum, waar de gegevens vandaan komen, bevat gegevens over een stuk of 1.750 Nederlandse bands. De metaldichtheid is het hoogst in Groningen, Schoonhoven en Kampen.

Ik heb me er wel een beetje gemakkelijk van afgemaakt, zo tel ik bands die in verschillende steden geworteld zijn niet mee en heb ik niet gecheckt of bands nog bestaan. Ook heb ik niet de moeite genomen om steden en dorpen die zelf geen gemeente zijn aan de juiste gemeente te koppelen (in principe moet daar bij het CBS wel een bestandje voor te vinden zijn). Wel heb ik hier en daar de spelling aangepast (denk aan 's-Gravenhage). Voor het bewerken van de kaart heb ik QGIS gebruikt.

Summary: 

I’m not into metal, but I think this metal band density map is a brilliant idea. For the fun of it I did one of the Netherlands.

De uitvinders van skip logic?

Vroeger had je papieren formulieren met ingewikkelde instructies: als je bij deze vraag “Ja” hebt ingevuld, ga dan verder met vraag 12; heb je “Nee” ingevuld ga dan naar vraag 16 op pagina 3. Tegenwoordig word je automatisch door vragenlijsten heengeloodst met behulp van skip logic (of conditional branching).

Houdt u van korte vragenlijsten?

Ja
Nee

Ik had er nooit bij stilgestaan hoe dat technisch werkt, tot ik in Beautiful Data (2009) een artikel las van Jonathan Follett en Matthew Holm over gebruikersvriendelijke enquêteformulieren. Als illustratie gebruiken ze een enquête waarin vermogende 55-plussers werden ondervraagd over een niet nader genoemd luxeproduct.

Follett en Holm beschrijven een aantal manieren waarop ze rekening probeerden te houden met hun doelgroep: val respondenten niet lastig met eindeloze variaties op dezelfde vraag (sociale wetenschappers hebben daar een handje van); gebruik een sobere, functionele vormgeving; maak duidelijk dat je geïnteresseerd bent in de mening van de respondenten en dat je ze niet iets probeert te verkopen. Allemaal open deuren, maar die kunnen niet vaak genoeg worden ingetrapt.

En daarnaast maakten ze dus gebruik van skip logic - al gebruiken ze zelf die term niet. Ze kwamen op het idee toen ze een portfolio-site maakten voor een ontwerper:

We used JavaScript to hide and reveal details about different projects, making it possible to take in all of the designer’s work at a glance and then dive deeper into areas of interest, all without leaving the home page.

Datzelfde idee gebruikten ze vervolgens ook in de vragenlijst voor rijke 55-plussers:

As programming goes, this is child’s play and hardly worth mentioning. But the impact from the user’s standpoint is subtle and powerful. It meant that we could ‘listen’ and ‘respond’ to the user’s input in a very conversational manner.

Dat het technisch gezien kinderspel is kan ik persoonlijk niet beamen, maar hé, ik ben nog maar net met JavaScript begonnen. Wat ik wel intrigerend vind is dat de auteurs zich in feite opwerpen als de uitvinders van skip logic. Terwijl ik niet anders weet dan dat deze functie standaard aanwezig is in allerlei online enquêteprogramma’s (ik heb het gecheckt, Limesurvey gebruikt ongeveer dezelfde code als Follett en Holm).

Skip logic in online vragenlijsten bestaat al zeker tien jaar en het is dus onwaarschijnlijk dat Follett en Holm dit hebben uitgevonden. In theorie is het wel mogelijk dat zij het script hebben bedacht waarmee vragen zichtbaar worden gemaakt in reactie op eerder gegeven antwoorden. Vroeger werd skip logic op een omslachtigere manier vormgegeven, waarbij respondenten van de ene naar de andere pagina werden gestuurd (zie bijvoorbeeld dit artikel uit 2007 waarin wordt gewaarschuwd dat respondenten kunnen afhaken als je skip logic gebruikt).

Veel garages, weinig fietsenstallingen

De Amsterdamse Dienst Infrastructuur Verkeer en Vervoer heeft alle beschikbare verkeer- en vervoergegevens als open data beschikbaar gesteld voor wie er maar iets mee wil. Wethouder Eric Wiebes:

Nieuwe aanbieders van belparkeren en parkeerapps hebben staan trappelen om zich op de Amsterdamse markt te begeven. De toekomst is een applicatie voor de mobiele telefoon die de reiziger voorziet van multi-modale reisinformatie richting bestemming, dáár wil ik naartoe.

Persoonlijk zou ik wel geïnteresseerd zijn in een app waarmee je kan opzoeken in welke fietsenstalling er nog plekken vrij zijn, maar daar zijn blijkbaar geen gegevens over beschikbaar. Wel over de locaties van Fietspunten en parkeergarages (inclusief P&R). Zo valt te zien dat er veel meer garages dan fietsenstallingen zijn. Natuurlijk zegt dit niet alles, zo ontbreken particuliere voorzieningen en parkeerplekken op straat. Maar het geeft wel te denken.

Summary: 

Amsterdam has released it’s traffic and transportation data as open data. There are more car parks than Fietspunt bicycle parking facilities.

Schouderklopje voor belastingparadijs

Toevallig stuitte ik op een intrigerende statistiek van de Wereldbank: daar meten ze de ‘average number of times firms spent in meetings with tax officials’. De statistiek blijkt afkomstig uit Doing Business, een jaarlijkse ranglijst van de meest ondernemersvriendelijke landen. Daarbij beoordelen de onderzoekers dus ook het belastingstelsel, zowel de procedures als de hoogte van de belastingen. Ze geven zelf al aan dat ze vooral naar de negatieve aspecten van belastingen kijken en niet naar de positieve dingen die je ermee kan doen:

Doing Business also does not attempt to measure all costs and benefits of a particular law or regulation to society as a whole. The paying taxes indicators, for example, measure the total tax rate, which is a cost to business. The indicators do not measure, nor are they intended to measure, the social and economic programs funded through tax revenues.

Wel hamert de Wereldbank op het belang van transparantie en willen ze voorkomen dat landen worden beloond als ze een extreem laag belastingtarief hebben. Tegen deze achtergrond is het een beetje pijnlijk dat de belastingstelsels van bijna alle belastingparadijzen die in het onderzoek zijn opgenomen een gunstige beoordeling krijgen (de enige uitzondering is Panama, dat ergens onderaan de ranglijst bungelt). Op #1 staan de Maldiven, een land dat volgens sommigen ook kenmerken heeft van een belastingparadijs. Enig zoeken leert overigens dat er jaren geleden al eens vraagtekens zijn geplaatst bij de manier waarop de Wereldbank belastingstelsels beoordeelt, zie pagina 30 van dit evaluatierapport.

De bovenstaande grafiek laat zien welke positie de belastingparadijzen innemen op de ranglijst van 183 beoordeelde landen. Ter informatie wordt ook de positie van Nederland getoond, maar uiteraard mag je ons land geen belastingparadijs noemen.

Summary: 

Most people would call these countries tax havens, but judging by the criteria of the World Bank they have pretty good tax systems (the Netherlands are included for comparison, although some would argue this is a tax haven too).

Pages