champagne anarchist | armchair activist

Strava

Nekt Strava de Fietstelweek?

Strava is een populaire app om fietsritten mee op te nemen. Het bedrijf probeert al een paar jaar om zijn gegevens aan lokale overheden te verkopen zodat die ze kunnen gebruiken bij hun fietsbeleid. NDW, een platform van overheden waaronder Amsterdam, heeft zes maanden aan Stravagegevens gekocht om eens uit te proberen wat je hiermee kan.

De overstap naar Strava betekent mogelijk het einde van de Fietstelweek, een jaarlijkse actie om fietsgegevens te verzamelen waar duizenden vrijwilligers aan meedoen. Ik heb de gegevens van de Fietstelweek ooit gebruikt om te analyseren hoe lang je moet wachten bij stoplichten. De Fietstelweek kreeg geld van dezelfde overheden die nu experimenteren met gegevens van Strava.

Eén van de redenen waarom overheden naar alternatieven kijken is dat de Fietstelweek minder deelnemers heeft dan ze graag zouden willen. Daar zit iets in. Neem bijvoorbeeld de onderstaande kaart, met fietsroutes van en naar Amsterdam Centraal Station.

Op zich een interessante kaart. Niet heel verassend is de intensiteit het hoogst in de buurt van fietsenstallingen. De Geldersekade (met de soms chaotische kruising met de Prins Hendrikkade) en de Piet Heinkade lijken belangrijke toegangswegen te zijn. Het lijkt erop dat mensen die met de fiets naar CS gaan wat vaker in het oosten van de stad wonen.

Maar let op: het gaat om kleine aantallen. Zelfs de drukste segmenten vertegenwoordigen niet meer dan 40 ritten. Eén loyale deelnemer aan de Fietstelweek zou letterlijk de kaart kunnen veranderen door de hele week haar fietsrit naar werk op te slaan.

Strava beschikt over veel grotere datasets, maar deze gegevens roepen weer andere vragen op. Strava noemt zich ‘het sociale netwerk voor sporters’ en wil weten of je een racefiets, een mountainbike, een tijdritfiets of een cyclocrossfiets gebruikt (‘anders’ is geen optie). Is Strava wel representatief voor mensen die bijvoorbeeld op hun stadsfiets naar werk gaan?

Het antwoord van Strava op dit soort vragen is dat ze proberen om competitie minder centraal te stellen en hun app socialer te maken, met Facebook-achtige tools. Op die manier hopen ze meer gegevens te verzamelen over ‘normale’ fietsritten Ze zeggen ook dat mensen met de app vaak dezelfde routes rijden als andere fietsers, vooral in de steden.

Maar klopt dat wel? De Strava heatmap (kies rood en rides) voor Amsterdam zou je misschien kunnen interpreteren als een combinatie van recreatieve routes (Vondelpark, Amstel) en fietsers die zo snel mogelijk de stad in of uit proberen te rijden (plus flink wat mensen die hun rondjes op de Jaap Edenbaan hebben opgeslagen als fietstochten).

Misschien valt er een manier te bedenken om de recreatieve en sportieve ritten eruit te filteren en hou je dan nog genoeg ‘normale’ fietsritten over. Aan de andere kant, bijna driekwart van de fietsritten in Nederland is korter dan 3,7 km, en ik vermoed dat zulke korte ritjes zelden op Strava worden gezet.

Er is ook nog een sociaal-economisch aspect. Er is aangevoerd dat Strava vooral wordt gebruikt door mensen die in de rijkere buurten wonen, terwijl andere buurten misschien wel meer behoefte hebben aan betere fietsinfrastructuur.

Natuurlijk is het fietsgebruik sowieso ongelijk verdeeld, en dat zie je ook terug in de gegevens van de Fietstelweek. De kaart hieronder toont de start- en eindpunten van fietsritten in Amsterdam.

De dichtheid is het grootst in het gebied binnen de ring ten zuiden van het IJ. Het aantal fietstochten per 1.000 inwoners correleert ook met woningwaarde: veel fietstochten beginnen of eindigen in rijkere buurten. Zoals gezegd, dit weerspiegelt waarschijnlijk het werkelijke fietsgebruik en wijst dus niet op een probleem met de gegevens.

Om samen te vatten: de Fietstelweek heeft kleinere aantallen deelnemers dan je zou willen, terwijl de gegevens van Strava vragen oproepen over de representativiteit. Strava zou natuurlijk kunnen helpen om die vragen te beantwoorden door een deel van de Amsterdamse gegevens beschikbaar te stellen als open data.

Dit Python-script laat zien hoe de analyse is uitgevoerd.

Dutch governments consider using Strava data

Strava is a popular app to record bicycle rides. For some years, the company has been trying to sell its data to local governments for traffic planning. NDW, a platform of Dutch governments including the city of Amsterdam, has bought six months’ worth of Strava data to give it a try.

The switch to Strava may mean the end of the Fietstelweek, an annual one-week effort to collect bicycle data from thousands of volunteers. In the past, I’ve used Fietstelweek data to analyse waiting times at traffic lights. The Fietstelweek received funding from the same governments that are now experimenting with Strava data.

One reason why they are looking for alternatives is that the number of Fietstelweek participants is lower than they’d like. They seem to have a point. Consider for example the map below, which shows bicycle routes to and from Amsterdam Central Station.

As such, it’s an interesting map. Unsuprisingly, it seems that intensity is highest near the bicycle parking facilities. Main access routes appear to be the Geldersekade (with the sometimes chaotic crossing with Prins Hendrikkade) and the Piet Heinkade. It seems that people cycling to and from Central Station are somewhat more likely to live in the eastern part of the city.

There’s one caveat though: the numbers are small. Even the busiest segments represent at most 40 rides. One loyal Fietstelweek participant recording her commute during the entire week could literally change the map.

Strava has far larger numbers, but its data raises different kinds of questions. Strava calls itself ‘the social network for athletes’ and wants to know if you use a road bike, a mountain bike, a TT bike or a cyclocross bike (no option ‘other’ available). So how representative is Strava data of people who use their city bike for commutes and other practical purposes?

Strava’s response to such questions is that they’re trying to make the app less competition-focused and more social, with Facebook-like features. This should help them collect data about ‘normal’ bike rides. They have also argued that «especially in cities, those with the app tended to ride the same routes as everyone else».

But is that really true? Strava’s heatmap (choose red and rides) for Amsterdam could perhaps be interpreted as a combination of recreational rides (Vondelpark, Amstel) and cyclists trying to get in or out of the city as quickly as possible (plus quite a few people who recorded their laps at the Jaap Eden ice skating rink as bicycle rides).

Perhaps you could find a way to filter out ‘lycra’ rides and end up with a sufficient number of ‘normal’ rides. Then again, almost three-quarters of bicycle rides in the Netherlands are under 3.7 km, and I suspect very few of those short rides end up on Strava.

There’s also a socio-economic aspect. It has been argued that Strava is used most by people living in wealthier neighbourhoods, which aren’t necessarily the neighbourhoods most in need of better cycling infrastructure.

Of course, bicycle use is unequal in the first place, which is also reflected in Fietstelweek data. The map below shows the start and end points of rides for Amsterdam.

Density is highest in the area within the ring road and south of the IJ. The number of trips per 1,000 residents also correlates with house values: more bicycle trips start or end in affluent neighbourhoods. As said, this probably reflects actual patterns in bicycle use and not a problem of the data.

To summarise, Fietstelweek has smaller numbers than one would like, while Strava data raises questions about representativeness. One way for Strava to help answer these questions would be to make a subset of its Amsterdam data available as open data.

This Python script shows how the analysis was done.

Strava has new maps, created by Mapbox

strava-with-route-vancouver

Strava has new maps. They look good and they are well-designed. Highways, which dominate normal maps, have gotten a modest grey colour. Paths and pedestrian areas are highlighted in yellow. Parks and water bodies serve as orientation marks.

They have removed clutter so you can easily follow the road pattern. And they’ve taken care to make elevation patterns visible (too bad most hills in the Netherlands are too low to qualify for such markings).

The maps have been created by Mapbox, an alternative for Google Maps. Some of the material they use is from Open Street Maps and they contribute to Leaflet, an open source Javascript library for creating online maps. When Strava initially switched from Google Maps to Mapbox last summer, they apparently got some complaints about the disappearance of Streetview. Good thing they decided to stick with Mapbox and further improve the maps.

Hopefully the new Strava maps will become available open source for use with Leaflet. Or for your Garmin.

Via @hapee.

Update

23 July 2018 - I’m still very happy with the Strava maps Mapbox created. I do think one thing could be improved, though: railways are almost invisible unless you really zoom in.

Of course, this is in keeping with the design philosophy of the maps. On the other hand, motorways are clearly indicated, so why not railways. Adding railways and stations would improve the readability of the maps, especially in large cities. It would also add practical value to cyclists who take their bicycle on a train.

Strava heeft nieuwe kaarten, gemaakt door Mapbox

strava-with-route-vancouver

Strava heeft nieuwe kaarten. Ze zien er mooi uit en ze zitten goed in elkaar. Snelwegen, die op gewone kaarten de aandacht trekken, hebben een bescheiden grijze kleur gekregen. Fiets- en voetpaden zijn juist opvallend geel. Parken en water vormen oriëntatiepunten.

Onnodige details zijn weggelaten zodat je het patroon van de wegen goed kan volgen. En er is de nodige aandacht besteed aan het zichtbaar maken van hoogteverschillen (jammer dat de meeste heuvels in Nederland te weinig voorstellen om hiervoor in aanmerking te komen).

De kaarten zijn gemaakt door Mapbox, een alternatief voor Google Maps. Ze maken onder meer gebruik van Open Street Maps en ze dragen bij aan Leaflet, een open source Javascript-library waar je online kaarten mee kan maken.

Toen Strava afgelopen zomer overstapte van Google Maps naar Mapbox kregen ze klachten over het verdwijnen van Street View. Goed dat ze hebben besloten om bij Mapbox te blijven en de kaarten verder te verbeteren.

Hopelijk komen de nieuwe Stravakaarten ook open source beschikbaar voor gebruik met Leaflet. Of voor in je Garmin.

Via @hapee.

Strava tweets II: after dinner rides and Sunday morning rides

The other day I posted an article about using Strava tweets to analyse road cycling patterns. I plan to do some more analysis on this but first I wanted to take another look at the time at which tweets are posted. Below is a chart that shows the number of Strava tweets per hour of the day.

Two things stand out: on weekdays, there’s an after-dinner peak, and on Sundays, many trips are finished before lunch. The pattern suggests that people tend to tweet pretty quickly after they finish their ride. This in turn seems to suggest that post times may well be a meaningful indicator of the time at which rides take place.

Gender

I used a variant of this script to determine the gender of people who tweeted their Strava rides, based on the first name of their Twitter screen name. According to the results, 9.7% are women. This is more than the 5.5% women in the SWOV survey among Dutch road cyclists, but then again people who use Strava (and tweet about it) are probably more likely to be young and young road cyclists more likely to be women.

For women the median distance of rides is 48km; for men 54km. The difference doesn’t appear very large.

In the chart above, you can select to see data for women instead of all riders (note that the scale changes). The main difference seems to be that for women, there’s much less of an after-dinner peak on weekdays. Perhaps something to do with the fact that women are less likely to have full-time jobs. But the numbers are relatively small so perhaps one shouldn’t read too much into it.

Pages