salonanarchist | leunstoelactivist

Open Data

Het einde van de anonieme fietser

Amsterdam wil de markt voor ‘deelfietsen’ reguleren. Er worden straks allerlei gegevens bijgehouden over het gebruik van die fietsen en je zou die gegevens beschikbaar kunnen stellen als open data, zoals in veel steden al gebeurt. Amsterdam, een stad met ambities als het gaat om verantwoord datagebruik, lijkt dit echter niet van plan te zijn.

Ok. Maar het is ondertussen ook goed om stil te staan bij het feit dat die gegevens verzameld worden.

Je kunt je nauwelijks nog verplaatsen zonder dat je wordt gevolgd. Als je een telefoon bij hebt, is je locatie bekend. Automobilisten worden gevolgd via hun navigatiesysteem en met nummerplaatscanners. In het openbaar vervoer wordt je ook gevolgd - tenzij je een anonieme ov-chipkaart koopt en betaalt met muntjes.

Fietsers kunnen wel nog over straat zonder dat ze gevolgd worden. Maar ook daar wordt aan gewerkt. In Tilburg wordt een test uitgevoerd waarbij fietsers sneller groen krijgen als ze zich laten detecteren met een app (terwijl er ook wel andere manieren zijn om fietsers te detecteren - als je per se innovatief wil zijn gebruik je gewoon een warmtesensor). De gemeente belooft dat deelnemers anoniem blijven, maar verzamelt wel gegevens om analyses te maken.

VanMoof stopt een gps-chip in sommige fietsen om diefstal te ontmoedigen (waarom je een VanMoof zou willen stelen ontgaat me, maar dat terzijde). Amsterdam test een systeem waarbij je fiets dankzij een chip herkend wordt in de fietsenstalling. De Amsterdamse ondernemerslobby, die klaagt dat er teveel fietsen zijn, wil ook dat fietsen een chip krijgen.

Bij ‘deelfietsen’ zit ingebakken dat de fietsen gevolgd worden. Sterker nog, Amsterdam eist van aanbieders dat ze real-time gaan volgen waar hun fietsen zijn. Liefst zo nauwkeurig dat ze kunnen zien of je je fiets in of naast een fietsvak hebt neergezet. Natuurlijk beloven de fietsverhuurders dat ze zorgvuldig omgaan met de gegevens die ze over je verzamelen (alhoewel). Maar de gemeente stelt hierover geen voorwaarden aan de vergunninghouders.

Straks ben je een moderne Luddiet als je nog op je eigen fiets rondrijdt en weigert om een chip of een groenlicht-app te installeren. Je weet dat het een verloren strijd is, maar toch doe je het.

Tot en met 16 februari kan er schriftelijk gereageerd worden op het plan van Amsterdam om deelfietsen te reguleren. Op dindsdag 23 januari is er een inspraakbijeenkomst.

Gemeenteraad Amsterdam gaat informatie over besluitvorming toegankelijk maken

De Amsterdamse gemeenteraad gaat meedoen aan het landelijke project Open Raadsinformatie, met als doel om informatie zoals voorstellen, notulen, moties en stemuitslagen beter toegankelijk te maken. Dit maakt het makkelijker voor onderzoekers, journalisten, belangenorganisaties en burgers om te analyseren hoe de stad wordt bestuurd.

Eind dit jaar worden standaarden ontwikkeld en medio 2018 moet het nieuwe systeem gaan werken. Daarmee wordt uitvoering gegeven aan het raadsvoorstel voor «radicale transparantie» dat Zeeger Ernsting (GroenLinks) in juni 2015 heeft ingediend. Ondertussen heeft Helmie Bijleveld (SP) ook een motie hierover ingediend.

In principe is de meeste raadsinformatie al openbaar, maar vaak verstopt in pdf’s die soms ook nog eens moeilijk te vinden zijn. De gemeenteraad gaat de informatie nu in «herbruikbare» vorm beschikbaarstellen. Op die manier wordt het makkelijker om de informatie te analyseren en om apps te ontwikkelen die gebruikmaken van raadsinformatie.

Begin dit jaar kreeg de gemeenteraad al een nieuwe website, waar je bijvoorbeeld kan opzoeken hoe raadsleden hebben gestemd. Tegelijk werd het echter moeilijker om voorstellen te vinden. Als je zoekt naar een trefwoord dat voorkomt in een voorstel dat naar de raad is gestuurd, dan verwijst de zoekmachine je naar de agenda van de vergadering waar dat voorstel besproken is. Meestal staan er echter tientallen stukken op de agenda en is het onduidelijk welk van die voorstellen jouw zoekterm bevat.

De 1.368 tabellen van Onderzoek en Statistiek

Op de website van de afdeling Onderzoek, Informatie en Statistiek van de gemeente Amsterdam zijn veel gegevens te vinden, maar die zijn niet altijd even makkelijk te vinden. Dat probleem los je ook niet op door te googelen naar filetype:xlsx site:ois.amsterdam.nl, want dat levert maar een fractie op van de beschikbare tabellen.

Daarom hier een overzichtje met alle (?) 1.368 tabellen op de website van OIS. Kan van pas komen als je cijfers zoekt over de fitnessexplosie van de afgelopen jaren, over de groei van het aantal uitgeleende buitenlandse jeugdboeken door bibliotheken, of over de afdelingen van de gemeente die het meeste uitgeven aan uitzendkrachten.

The network of Dutch firms

One of the ways in which firms are linked is through board members who also sit on the boards of other firms. Researchers use these board interlocks to determine which firms occupy a central position in the corporate network. This «is widely considered as an indication of a powerful or at least advantageous position», Frank Takes and Eelke Heemskerk explain in an interesting paper on the subject.

Two Dutch newspapers, de Volkskrant and NRC Handelsblad, have published visualisations of the Dutch (corporate) elite and their board memberships. You can use the data from those visualisations to create board interlock networks. Below is an example using data from NRC Handelsblad from 2017:

Darker nodes represent organisations with a more central position in the network, as measured by their betweenness centrality. Below is another example, using data from de Volkskrant from 2013:

The most obvious difference is that the second graph contains far more nodes (organisations) and edges (shared board members) than the 2017 chart. But there’s more. The 2017 dataset contains only nodes that have at least two edges - probably the result of a selection criterion used by NRC Handelsblad because of the type of visualisation they wanted to make. Further, the 2013 dataset consists of multiple components: three sets of organisations only share board members with each other; not with the rest of the network.

Given the differences between the datasets, would it still be meaningful to make comparisons between the two? The table below shows the top 10 of organisations with the highest centrality scores, for 2013 and 2017. The comparison is limited to organisations that are included in both datasets.

2013 2017
VNO-NCW VNO-NCW
DNB Ahold
Concertgebouw Concertgebouw
KLM KLM
ABN Amro Schiphol
Aegon NV FrieslandCampina
Concertgebouw Fonds Philips
DSM DNB
Philips Rabobank Groep
Heineken NV Vopak

Organisations like employers’ organisation VNO-NCW, the Concertgebouw concert hall and airline KLM seem to occupy a pretty stable position at the centre of the network. VNO-NCW has a huge non-executive board with representatives from a wide range of industries. The Concertgebouw has been described years ago as the living room of the [Dutch] elite.

Aside from these stable elements, there are substantial differences between the two rankings. The rank correlation is only 0.33 and not statistically significant. This may be due to differences in the way the datasets were created; the small size of the overlap between them (only 34 organisations) and other data quality issues.

On the other hand, some changes in the ranking appear to reflect genuine changes in the position firms occupy. Two examples:

  • One of the fastest risers is Ahold. Ahold merged with Belgian retailer Delhaize in 2016. It would seem plausible that this has strengthened their position in the corporate network.
  • ABN Amro disappeared from the top 10. The bank used to have a board with well-connected members like Gerrit Zalm and Joop Wijn (both have gone through the revolving door between government and the corporate world), Peter Wakkie and Marjan Oudeman (one of the most influential Dutch women according to various rankings). In 2015, chairman Wakkie stepped down over a commotion caused by excessive executive board remunerations (the bank was still state-owned after having been bailed out with public money in 2008). Subsequently, Oudeman, Zalm and Wijn also left the bank, for reasons partly related to its upcoming flotation. It appears the current board has a lower profile.

This type of analyses could benefit enormously from having a larger dataset available. This is yet another reason why the Dutch Company Register should be opened up as open data: this will allow for better understanding of the networks of corporate control.

Method and data

Both de Volkskrant (2013, 2014) and NRC Handelsblad (2017) have published visualisations of the Dutch (corporate) elite and their board memberships. Note that these board memberships not only include companies, but also employers’ organisations, cultural institutions and other types of organisations the collectors of the data deemed relevant for analysing corporate elite networks.

Before comparisons can be made, the names of the organisations need to be cleaned up. Beyond correcting typos and dealing with additions like N.V. (plc) and B.V. (ltd), this involves deciding when to consider units as part of the same organisation. Pragmatically, I decided to treat businesses that are part of the same corporate structure as identical. This may not always be the ideal approach; on the other hand, it’s not always possible to determine what unit a name refers to (e.g. ING could refer to the holding or to one of its subsidiaries). I did treat foundations (e.g. charities linked to a company) as separate from the company.

There are different ways to measure the centrality of a node in a network. Taking my cue from Takes and Heemskerk, I used betweenness centrality, which is based on how often a node is on the shortest path between two other nodes. I calculated centrality for the entire network, that is, before taking a subgraph. I included endpoints to prevent many nodes having a score of zero.

I used the Python library networkx to analyse the graphs (here’s the code and here’s the accompanying text file for cleaning up organisation names). I used d3.js to visualise the network graphs - here’s a description of the problems I ran into and how I dealt with them.

Het netwerk van Nederlandse ondernemingen

Een van de manieren waarop bedrijven met elkaar verbonden zijn, is door gedeelde bestuurders: een commissaris bij een bepaald bedrijf zal soms ook commissaris zijn bij andere bedrijven. Onderzoekers gebruiken deze ‘board interlocks’ om te analyseren welke bedrijven een centrale plek innemen in het ondernemingennetwerk. Dit «wordt veelal beschouwd als indicatie voor een machtige of tenminste gunstige positie», aldus Frank Takes en Eelke Heemskerk in een interessant artikel over dit onderwerp.

Zowel de Volkskrant als NRC Handelsblad hebben visualisaties gemaakt van de (zakelijke) elite en hun commissariaten en andere functies. De gegevens van die visualisaties kan je weer gebruiken om netwerken te maken op basis van board interlocks. Hieronder een voorbeeld met gegevens van NRC Handelsblad uit 2017:

Donkere nodes verwijzen naar organisaties met een centrale positie in het netwerk, afgemeten aan hun betweenness centrality. Hieronder nog een voorbeeld, op basis van gegevens van de Volkskrant uit 2013:

Het duidelijkste verschil is dat de tweede grafiek veel meer nodes (organisaties) en edges (gedeelde bestuurders) bevat dan de grafiek over 2017. Maar er zijn nog meer verschillen. De dataset uit 2017 bevat alleen nodes met tenminste twee edges - waarschijnlijk het gevolg van een selectiecriterium dat NRC Handelsblad heeft gebruikt vanwege het type visualisatie dat ze wilden maken. De dataset uit 2013 bestaat verder uit meerdere componenten: drie sets van organisaties zijn alleen onderling verbonden en niet met de rest van het netwerk.

Er zijn dus flinke verschillen tussen de datasets. Is het desondanks zinvol om ze onderling te vergelijken? De tabel hieronder laat voor beide jaren de top–10 van organisaties met de hoogste betweenness centrality zien. De vergelijking beperkt zich tot organisaties die in beide datasets voorkomen.

2013 2017
VNO-NCW VNO-NCW
DNB Ahold
Concertgebouw Concertgebouw
KLM KLM
ABN Amro Schiphol
Aegon NV FrieslandCampina
Concertgebouw Fonds Philips
DSM DNB
Philips Rabobank Groep
Heineken NV Vopak

Organisaties als VNO-NCW, het Concertgebouw en KLM lijken een vrij stabiele centrale positie in te nemen. VNO-NCW heeft een omvangrijke Raad van Commissarissen met vertegenwoordigers uit uiteenlopende sectoren. Het Concertgebouw werd jaren geleden al omschreven als de huiskamer van de elite.

Naast deze constante factoren zijn er flinke verschillen tussen de twee ranglijsten. De rangcorrelatie is slechts 0.33 en niet statistische significant. Dit kan te maken hebben met verschillen in de manier waarop de datasets zijn samengesteld; de kleine omvang van de overlap tussen de twee dataset (slechts 34 organisaties) en andere problemen die te maken hebben met de kwaliteit van de gegevens.

Aan de andere kant, sommige verschillen tussen de ranglijstjes lijken wel degelijk overeen te komen met daadwerkelijke veranderingen in de positie van ondernemingen. Twee voorbeelden:

  • Een van de snelste stijgers is Ahold. Ahold is in 2016 met Delhaize gefuseerd. Het lijkt plausibel dat dit hun positie in het bedrijvennetwerk heeft versterkt.
  • ABN Amro is verdwenen uit de top–10. Vroeger had de bank commissarissen met veel connecties, zoals Gerrit Zalm en Joop Wijn (die allebei door de draaideur tussen overheid en bedrijfsleven zijn gegaan), Peter Wakkie en Marjan Oudeman (volgens verschillende lijstjes één van de meest invloedrijke Nederlandse vrouwen). In 2015 stapte voorzitter Wakkie op na een rel over buitensporige beloningen (de bank was nog altijd in handen van de staat nadat hij in 2008 met publiek geld was gered). Vervolgens verlieten ook Oudeman, Zalm en Wijn de bank, deels vanwege de beursgang die eraan kwam. Het huidige bestuur lijkt een bescheidener profiel te hebben.

Bij dit soort analyses zou het enorm helpen om meer gegevens te hebben. Dat is nog een extra reden waarom het Handelsregister beschikbaar zou moeten komen als open data: dat biedt meer inzicht in de onderlinge verhoudingen in zakelijk Nederland.

Methode en gegevens

Zie de Engelstalige versie van dit artikel.

Pages