Open Data

Deelfietsen: wie profiteert

Amsterdam is de afgelopen weken overspoeld door «deelfietsen» die met een app gehuurd kunnen worden. Big business, aldus het Parool. Amsterdammers reageerden op deze commerciële rotzooi door fietsen demonstratief bij het grof vuil te zetten. De gemeente heeft inmiddels laten weten dat de fietsen worden verwijderd, om vervolgens de markt te reguleren.

Hoe moet dat nieuwe beleid eruit zien? Het gebruik van de openbare ruimte moet goed geregeld zijn. Dat geldt ook voor de kwaliteit van de fietsen. Het zou mooi zijn als de gebruiksgegevens als open data beschikbaar komen via een API. Verder vragen veel mensen zich af of de fietsen voor toeristen bestemd zijn, of voor Amsterdammers. De volgende vraag die je zou moeten stellen: zijn ze bestemd voor alle Amsterdammers?

Uit Amerikaans onderzoek blijkt dat inwoners van armere buurten veel belangstelling hebben voor deelfietsen. Toch worden de fietsen het meest gebruikt door rijkere, witte stadsbewoners. Sommige steden en fietsverhuurders doen wel hun best om het systeem toegankelijk te maken voor iedereen.

In Amsterdam richt fietsverhuurder Donkey Republic zich vooral op de buurten rond het centrum, zo suggereert hun kaartje (het laat niet de daadwerkelijke locaties van fietsen zien, maar wel hoe het bedrijf zich profileert). Concurrent Hello Bike richt zich specifiek op de Zuidas.

Natuurlijk is dit geen specifiek kenmerk van deelfietsen. In de rijkere buurten rond het centrum wordt sowieso meer gefietst dan buiten de ring. Maar als er vergunningen komen voor fietsverhuurders, dan kan je best in de voorwaarden zetten dat ze hun product aantrekkelijk en toegankelijk moeten maken voor alle Amsterdammers.

Airbnb’s agreement with Amsterdam: some insights from scraped data

Airbnb is under fire. The platform would harm the liveability of Amsterdam neighbourhoods and drive up house prices. In December last year, Amsterdam and Airbnb signed a Memorandum of Understanding (MOU) to deal with abuses. According to Airbnb, the agreement is already bearing fruit. Airbnb thinks Amsterdam should focus its enforcement efforts on other platforms. But Amsterdam wants to introduce a registration requirement for holiday lettings, a measure Airbnb vehemently opposes.

In this article, I analyse some of the changes that occurred since the announcement of the MOU. I use data from Murray Cox (Inside Airbnb) and Tom Slee, who have scraped the Airbnb website various times between May 2014 and May 2017 (scraping is automated retrieval of data from websites). Note that data about Airbnb is always controversial. Read this article to understand why the data collected by Cox and Slee is an important addition to the data provided by the company itself.

Sixty-day limit

Amsterdam residents may rent out their home sixty days per year. According to the new agreement, Airbnb will block advertisements when they exceed that limit. However, this applies only to entire homes and not to rooms, because these may be B&Bs, where the sixty-day cap doesn’t apply.

According to Airbnb, there has been a substantial decrease in the number of homes offered for rent more than sixty days per year. This would be evidence that the MOU is already reducing illegal offerings.

The chart below shows how many rooms and entire homes were available more than sixty days per year, using data from Murray Cox.

The chart appears to confirm what Airbnb has claimed: the number of entire homes available more than sixty days has gone down. However, this started in the first half of 2016, well before the MOU was signed (let alone implemented). So it appears that it was caused by something else.

Perhaps it was the threat of stricter enforcement by the government itself. On 16 February 2016, Amsterdam announced that it was creating its own scraper to collect information from home rental platforms such as Airbnb. In March, the Green Party and Social-Democrats filed motions to step up enforcement.

Room type changes

Does this mean the agreement between Amsterdam and Airbnb wasn’t a turning point? Perhaps it was - but in a different way.

Aggregate data about Airbnb listings are the result of a complex interplay of developments. Some listings are taken off the platform, and new ones are created. In addition, some hosts change the type of their listing - from room to entire home, or vice versa. This is shown in the chart below (using data from Tom Slee).

Until recently, few hosts changed the type of their listings. But since the announcement of the MOU, hundreds of listings have been changed from entire home to room. As indicated above, in the MOU, Airbnb promised to block advertisements for homes that have reached the sixty-day limit. Could it be that people changed their listings into «rooms» to evade the sixty-day limit?

I analysed listings that were changed from home to room between early March and early April 2017 (data from Murray Cox). In early April, over three-quarters of these listings were available more than sixty days per year. This would be consistent with the theory that hosts changed these homes into rooms because of the cap.

It’s possible that these hosts actually stopped renting out entire homes and started to rent out a single room instead. In that case, you’d expect them to have lowered the price and changed the description. However, the price was almost never lowered. Often, the host didn’t even change the description. In some cases, the description still explicitly says that guests have the entire home to themselves.

Incidentally, this is not the first time enforcement led to a large-scale conversion of homes into rooms. This has also happened in New York.

Conclusions

With the available data, it’s not possible to know with certainty what exactly happened over the past months. That said, there are indications the agreement between Amsterdam and Airbnb may be less effective than it seemed:

  • There has been a decrease in the number of entire homes offered for rent more than sixty days. However, this started well before the agreement was signed. It could be a result of (the threat of) enforcement by the government itself.
  • After the announcement of the agreement between Amsterdam and Airbnb, hundreds of entire homes were categorised as rooms. This could be a way for hosts to evade the sixty-day cap for entire homes.

Method and data

Both Murray Cox and Tom Slee frequently scrape the Airbnb website. Cox’ data is more detailed (including, for example, the texts used in advertisements and availability information). Slee collects his data more frequently, at least so for Amsterdam. Both Cox and Slee have made their data available as open data (thanks!).

Cox and Slee are not the only ones who collect data from the Airbnb website; there are commercial providers as well. In addition, the Amsterdam Municipality has started scraping the websites of Airbnb and other platforms. It appears Amsterdam only shares this data with city council members on a confidential basis.

As for room type changes: the data probably underestimates the actual number of changes, especially for the earlier periods. The reason is that you can only detect changes if an avertisement is in both the old and the new dataset. The longer the period between two measurements, the higher turnover will be (listings disappear, new ones are added) and therefore the higher the chance of missing room type changes.

Therefore, I did an additional calculation, correcting for the amount of overlap between the old and the new measurement. The result can be seen here. The picture is slightly different, but the conclusion stands: as of the end of 2016, there was a clear increase in home-to-room changes.

I used Python for the analysis. Here’s the code. As always, comments regarding the analysis and interpretation of the data are welcome.

De afspraak tussen Amsterdam en Airbnb: een verkennende analyse met open data

Airbnb ligt onder vuur. Het platform zou de leefbaarheid van Amsterdamse buurten aantasten en de woningprijzen opdrijven. Eind vorig jaar hebben Amsterdam en Airbnb een Memorandum of Understanding (MOU) getekend om misstanden aan te pakken. Volgens Airbnb is de afspraak nu al succesvol en moet de gemeente zich nu op andere platforms richten. Maar de gemeente wil een meldplicht invoeren voor vakantieverhuur, een plan waar Airbnb zich fel tegen verzet.

In dit artikel analyseer ik enkele veranderingen sinds de aankondiging van de MOU. Ik gebruik gegevens van Murray Cox (Inside Airbnb) en Tom Slee. Zij hebben op verschillende momenten tussen mei 2014 en mei 2017 de site van Airbnb gescraped (scrapen is het geautomatiseerd verzamelen van gegevens van websites). Gegevens over Airbnb zijn altijd controversieel, maar dit artikel legt uit waarom de gegevens van Cox en Slee een belangrijke aanvulling zijn op de cijfers die Airbnb zelf naar buiten brengt.

Zestigdagengrens

Amsterdammers mogen hun woning zestig dagen per jaar verhuren. Amsterdam en Airbnb hebben afgesproken dat het bedrijf advertenties voor woningen gaat blokkeren als die termijn wordt overschreden. Dit geldt voor zelfstandige woningen, maar niet voor kamers, want dat kunnen bed and breakfasts zijn en daarvoor geldt de zestigdagengrens niet.

Volgens Airbnb is er een forse daling van het aantal woningen dat meer dan zestig dagen per jaar wordt aangeboden. De MOU zou nu al zorgen voor minder illegale advertenties.

De grafiek hieronder toont hoeveel kamers en woningen meer dan zestig dagen per jaar beschikbaar waren, gebaseerd op gegevens van Murray Cox.

De grafiek laat inderdaad een daling zien van het aantal woningen dat meer dan zestig dagen beschikbaar is. Maar de daling begon in de eerste helft van 2016, ruim voordat de MOU werd ondertekend (laat staan uitgevoerd). Blijkbaar was er dus een andere oorzaak.

Misschien heeft het iets te maken met de handhaving door de gemeente zelf. Op 16 februari 2016 maakte Amsterdam bekend dat het zijn eigen scraper ging inzetten om informatie te verzamelen van vakantiehuurplatforms zoals Airbnb. In maart dienden GroenLinks en PvdA moties in waarin werd aangedrongen op strengere handhaving.

Woningtype aangepast

Betekent dit dat de MOU geen keerpunt vormde? Misschien toch wel, alleen op een andere manier.

De totaalcijfers over Airbnb vormen het resultaat van een complex samenspel van ontwikkelingen. Sommige advertenties worden van het platform verwijderd en nieuwe worden toegevoegd. Daarnaast veranderen verhuurders soms het woningtype van hun advertentie - van woning naar kamer, of andersom. Dit valt te zien in de grafiek hieronder (gegevens van Tom Slee).

Tot voor kort kwam het niet zo vaak voor dat verhuurders het woningtype van hun advertentie veranderden. Maar sinds de aankondiging van de MOU zijn er honderden advertenties omgezet van woning naar kamer. Zoals gezegd; in de MOU heeft Airbnb beloofd om advertenties van zelfstandige woningen te blokkeren als ze de zestigdagengrens bereiken. Misschien hebben mensen hun advertentie in «kamer» veranderd om de zestigdagengrens te omzeilen?

Ik heb gekeken naar woonruimtes die tussen begin maart en begin april 2017 zijn omgezet van woning naar kamer (gegevens van Murray Cox). Begin april was meer dan driekwart van deze woonruimtes meer dan zestig dagen per jaar beschikbaar. Dit zou kloppen met de theorie dat verhuurders de woningen in kamers hebben veranderd om de zestigdagengrens te omzeilen.

Op zich is het mogelijk dat deze verhuurders ook echt zijn gestopt om hun hele woning te verhuren en dat ze in plaats daarvan alleen nog een kamer verhuren. In dat geval zou je verwachten dat ze de prijs hebben verlaagd en dat ze de beschrijving hebben aangepast. Maar bijna nergens is de prijs verlaagd. Vaak heeft de verhuurder zelfs de beschrijving niet aangepast. In sommige gevallen vermeldt de advertentie nog steeds expliciet dat de gast de hele woonruimte voor zichzelf heeft.

Overigens is dit niet de eerste keer dat strengere handhaving leidt tot een grootschalige omzetting van woningen in kamers. In New York is hetzelfde gebeurd.

Conclusies

Met de beschikbare gegevens is het niet mogelijk om met zekerheid te zeggen wat er precies is gebeurd de afgelopen maanden. Even goed zijn er aanwijzingen dat de afspraak tussen Amsterdam en Airbnb misschien minder effetief is dan gedacht:

  • Er is een daling van het aantal woningen die meer dan zestig dagen te huur worden aangeboden. Deze daling begon echter ruim voordat de afspraak werd getekend. Ze zou een gevolg kunnen zijn van (de dreiging van) strengere handhaving door de gemeente zelf.
  • Nadat de afspraak tussen Amsterdam en Airbnb werd aangekondigd zijn honderden woningen omgezet in kamers. Dit zou een manier kunnen zijn voor verhuurders om de zestigdagenlimiet voor woningen te omzeilen.

Methode en gegevens

Zowel Murray Cox als Tom Slee scrapen regelmatig de website van Airbnb. De gegevens van Cox zijn uitgebreider (ze omvatten bijvoorbeeld de advertentieteksten en informatie over de beschikbaarheid). Slee verzamelt zijn gegevens frequenter, in ieder geval voor Amsterdam. Zowel Cox als Slee hebben hun datasets beschikbaar gesteld als open data (dank!).

Cox en Slee zijn niet de enigen die gegevens van de Airbnb website verzamelen; er zijn ook commerciële aanbieders. Verder is de gemeente Amsterdam begonnen om de website van Airbnb en andere platforms te scrapen. De gemeente lijkt deze gegevens alleen vertrouwelijk met gemeenteraadsleden te delen.

Voor wat betreft de omzettingen van woningtype: de cijfers vormen waarschijnlijk een onderschatting van het werkelijke aantal omzettingen, vooral voor de eerdere perioden. Je kan alleen een verandering van woningtype vaststellen als een advertentie zowel in de oude als in de nieuwe dataset zit. Hoe langer de periode tussen twee metingen, hoe groter het verloop (advertenties verdwijnen, er komen nieuwe bij) en hoe groter dus de kans dat veranderingen van woningtype onopgemerkt blijven.

Ik heb daarom een aanvullende berekening gemaakt waarin is gecorrigeerd voor de hoeveelheid overlap tussen de oude en de nieuwe meting. Het resultaat is hier te zien. Het beeld verschilt inderdaad enigszins van de vorige grafiek, maar de conclusie blijft overeind: vanaf eind 2016 was er een duidelijke toename van de omzettingen van woning naar kamer.

Ik heb Python gebruikt om de gegevens te analyseren. Hier is de code. Opmerkingen over de verwerking en interpretatie van de gegevens zijn uiteraard welkom.

Zijn er genoeg stemlocaties

Open State heeft de locaties van stembureaus verzameld en ze als open data beschikbaar gesteld. Daaruit blijkt dat er woensdag op een kleine negenduizend plekken gestemd kan worden.

Is dat genoeg? Over ongeveer die vraag is vorig jaar een rechtzaak gevoerd. De Brabantse gemeente Son en Breugel had besloten om bij het Oekraïnereferendum drie stembureaus in te richten, in plaats van de gebruikelijke tien. Forum voor Democratie is toen samen met twee inwoners naar de rechter gestapt.

Uit onderzoek zou zijn gebleken «dat er causaal verband bestaat tussen, kort gezegd, de stemfaciliteiten die aan een kiezer worden geboden (aantal, afstand, locatie) en de mate waarin die kiezer gebruik zal maken van zijn stemrecht». Helaas ontbreekt een bronvermelding.

Uit het verslag van de rechtzaak blijkt dat er niet zoveel geregeld is. In de wet staat alleen dat een gemeente tenminste één stembureau moet inrichten. In de praktijk hanteren gemeenten een informele norm van 1.200 kiesgerechtigden per stembureau. De rechter neemt die informele norm niet zonder meer over, maar kwam wel met een nieuwe regel: je mag niet zomaar het aantal stembureaus drastisch verlagen. Met als argument dat gemeenten zich ‘servicegericht’ op moeten stellen.

Zoals gezegd deden twee inwoners uit Son en Breugel mee aan de rechtzaak. Ze kampen met gezondheidsklachten en wilden daarom graag dat hun ‘vaste’ stembureau om de hoek weer open zou gaan. Daar ging de rechter niet in mee: er is «geen recht voor de individuele burger op het instellen van een stembureau op een afstand op 50 meter van zijn woning, ook niet als die burger slecht ter been is».

Stemlocaties per gemeente

Een analyse van de stemlocaties in Nederland laat zien dat het aantal stemlocaties sterk samenhangt met het aantal kiesgerechtigden in een gemeente. Gezien de informele norm die gemeenten hanteren was dat ook wel te verwachten.

In een doorsnee gemeente is er een stemlocatie per ruim 1.400 kiesgerechtigden. Dat is meer dan de informele norm van 1.200, maar dat heeft wellicht te maken met het verschil tussen stemlocaties en stembureaus (zie Methode).

Er zijn relatief weinig stemlocaties in gemeenten als Haaren, Capelle a/d IJssel (allebei ongeveer 2.800 kiesgerechtigden per locatie) en Heerenveen (3.550). In Son en Breugel kan woensdag op 9 locaties worden gestemd; dat betekent gemiddeld 1.410 kiesgerechtigden per locatie. Een doorsnee gemeente, wat dat betreft. Maar het favoriete stembureau van de twee inwoners die naar de rechter waren gestapt, zit er niet meer bij.

Stemlocaties per wijk

Uit de referendumzaak blijkt dat er wel een informele norm bestaat over het aantal stembureaus in relatie tot het aantal kiesgerechtigden, maar niet over de afstand tot een stembureau. De meeste Amsterdammers zullen geen moeite hebben om een stembureau op loopafstand te vinden, maar hoe zit dat op het platteland? Daar valt wel iets over te zeggen met een analyse op wijkniveau.

Het aantal kiesgerechtigden per wijk is denk ik niet formeel bekend, maar het aantal inwoners natuurlijk wel. Ook dat hangt duidelijk samen met het aantal stemlocaties: hoe meer inwoners in een wijk, hoe meer stemlocaties. Maar de vraag is of er relatief meer stemlocaties zijn in dunbevolkte gebieden. De grafiek hierboven laat het antwoord zien: ja, hoe lager de bevolkingsdichtheid, hoe hoger het aantal stemlocaties per 10.000 inwoners.

Hoe dat in de praktijk ongeveer werkt, is te zien op de kaart hieronder.

kaart

Dunbevolkte gebieden van ons land hebben vaak relatief veel stemlocaties. Dit geldt bijvoorbeeld voor delen van Zeeland, Limburg, Oost-Nederland en vooral Noord-Nederland. Deels geldt dat ook voor de Waddeneilanden, maar daar zijn altijd extra stemmers vanwege het toerisme. De donkergroene wijken zijn vaak (maar zeker niet altijd) wijken met hoogstens een paar honderd inwoners, die toch een stembureau hebben gekregen.

Al met al lijkt het erop dat gemeenten bij de inrichting van stembureaus niet alleen kijken naar het aantal kiesgerechtigden, maar ook naar de afstand die ze moeten afleggen. Klinkt redelijk. Als je echt wil weten hoe het zit, dan zou je eigenlijk voor alle woonadressen in Nederland moeten uitrekenen hoe ver de dichtstbijzijnde stemlocatie is. Die klus laat ik graag aan iemand anders over.

UPDATE - DUIC heeft ondertussen voor de stad Utrecht de afstand van woonadressen tot stemlocaties laten berekenen. De maximale afstand is 3,5 kilometer; de mediaan 332 meter.

Methode

De gegevens over stemlocaties zijn verzameld en beschikbaar gesteld door Open State. Soms zijn er op een locatie meerdere stembureaus, althans in Amsterdam is dat vrij gebruikelijk. Open State lijkt in principe meerdere stembureaus op dezelfde locatie als één locatie te hebben opgevat. Toch komt het een enkele keer voor dat dezelfde locatie (identieke coördinaten) meer dan één keer in het bestand zit; ik denk dat die erdoor zijn geslipt. In het Open State-bestand zitten 9018 locaties; nadat ik de duplicaten had verwijderd waren dat er 8744.

Gegevens over kiesgerechtigden per gemeente zijn te vinden bij het CBS (in dit bestand zijn gemeenten Gennep, Schijndel en Sint Oedenrode nog opgenomen als aparte gemeenten).

Bij het samenvoegen van dit soort bestanden ontstaan altijd problemen doordat gemeentenamen niet consistent worden gespeld of omdat er problemen zijn met de weergave van namen met speciale tekens, zoals S√∫dwest-Frysl√¢n. Open State heeft dit ondervangen door netjes de gemeentecode in het bestand op te nemen. In de CBS-cijfers over kiesgerechtigden is dat helaas niet het geval.

Ik dacht dit op te lossen door elders bij CBS een bestand te downloaden met de gemeentecodes. Maar toen ik de twee CBS-bestanden aan elkaar wilde koppelen bleek dat het CBS zelf geen consistente schrijfwijze hanteert. Kortom, het zou fantastisch zijn als het CBS voortaan standaard in alle datasets met regionale gegevens de bijbehorende regiocodes zou opnemen…

Voor de analyse op wijkniveau heb ik de wijk- en buurtkaart van het CBS (editite 2015) gebruikt. Deze heb ik samen met de Open State-gegevens geopend in Qgis en bepaald hoeveel stemlocaties er zijn per wijk door middel van een points in polygon-analyse.

Hier is de code voor het verwerken van de gegevens.

Update - Het blijkt wel degelijk mogelijk te zijn om gemeentecodes te krijgen bij de CBS-data, als je ze downloadt als SPSS-bestand. Zie ook hier over het inlezen van de gegevens met Python.

Amsterdamse raadsleden stellen vooral vragen over stadsdeel Centrum

De gemeenteraad heeft een vernieuwde website met raadsinformatie (via AT5) waar je bijvoorbeeld op kan zoeken hoe raadsleden hebben gestemd, welke moties en amendementen ze hebben ingediend en welke vragen ze hebben gesteld. De belofte van open raadsinformatie is hiermee nog niet ingelost,[1] maar je kan er wel wat mee. Bijvoorbeeld: nagaan welke straten worden genoemd in raadsvragen (er zitten een paar haken en ogen aan, zie hieronder Methode).

Het kaartje laat zien welke straten zijn genoemd in raadsvragen. Vooral het centrum staat in de belangstelling. Het gebied buiten de ring krijgt weinig aandacht en dat geldt ook voor grote delen van Noord en Oost. De grafiek hieronder laat de aantallen per stadsdeel zien, waarbij ik heb gecorrigeerd voor het aantal inwoners.

Het beeld is duidelijk: straten in stadsdeel Centrum worden het vaakst genoemd. Relatief gezien zelfs bijna tien keer zo vaak als straten in Zuidoost, het stadsdeel dat het minste aandacht lijkt te krijgen van de gemeenteraad.

Is dat erg? Aan de ene kant komen veel Amsterdammers wel eens in het centrum en hebben ze een mening over wat daar gebeurt. Dus is het logisch dat gemeenteraadsleden wat meer aandacht hebben voor stadsdeel Centrum dan voor de rest van de stad. Aan de andere kant is het verschil wel groot en spelen er buiten het centrum ook zaken die de aandacht verdienen - denk bijvoorbeeld aan gentrification, etnisch profileren of fijnstof.

Type hieronder enkele letters om te kijken of de gemeenteraad vragen heeft gesteld over jouw straat (werkt niet met iOS / Safari, sorry).

Methode

Informatie over raadsvragen heb ik gedownload van de website van de gemeenteraad. Straatnamen heb ik uit dit bestand van de gemeente gehaald. Vervolgens heb ik gecheckt hoe vaak de straatnamen voorkomen in de tekst van raadsvragen. In de bijna 1.200 vragen wordt ruim 750 keer een straatnaam genoemd.

Sommige straatnamen heb ik buiten beschouwing gelaten. Amstel bijvoorbeeld, omdat dit het adres van de gemeente is dat altijd vermeld wordt. Daarnaast de straatnamen Samenwerking, Overleg, Inzet, Vertrouwen, Brink, Rusland. Even goed kan het voorkomen dat een woord wordt herkend als straatnaam terwijl er eigenlijk iets anders mee wordt bedoeld (bijvoorbeeld de naam Overtoom). Daarnaast zullen er ongetwijfeld ook vragen worden gesteld over lokaties zonder dat daarbij een straatnaam wordt genoemd.

Een ander praktisch punt is dat de tekst meestal zowel de vraag als de beantwoording bevat. Het kan daarom voorkomen dat een straatnaam niet wordt genoemd in de oorspronkelijke vraag, maar toch wordt meegeteld, omdat hij wordt genoemd in het antwoord op de vraag.

De coördinaten van de straten heb ik opgezocht met de Bing Maps api.


  1. Op initiatief van raadslid Zeeger Ernsting heeft de gemeenteraad besloten dat raadsinformatie beschikbaar moet komen als open data. Dat betekent dat je per raadslid bijvoorbeeld kan opzoeken wat ze gestemd hebben, maar ook dat die informatie beschikbaar komt in een vorm die je eenvoudig geautomatiseerd kan doorzoeken en analyseren. Dat laatste is nog niet het geval. Zo valt bij moties en vragen niet op een eenduidige manier te achterhalen wie de indiener was. Ook valt het stemgedrag van raadsleden niet eenduidig te koppelen aan de tekst van het voorstel waarover is gestemd. Informatie over moties en amendementen kan je downloaden als Excelbestand, maar het verwerken van die gegevens is (nog steeds) een hachelijk avontuur. De gemeente heeft afgelopen november laten weten dat de open raadsinformatie per september 2017 beschikbaar komt.  ↩

Pages