champagne anarchist | armchair activist

Data

Predictive policing

Media schrijven met enige bewondering over de nieuwe algoritmes van de politie, het Criminaliteits Anticipatie Systeem, dat in Amsterdam is ontwikkeld:

CAS legt daarin als het ware een raster over een wijk met ‘vakjes’ van 125 bij 125 meter. Als een vakje rood is, voorspelt CAS problemen zoals een straatroof. Het systeem doet voorspellingen binnen tijdslots van maximaal vier uur. De politie hoopt effectiever, dus goedkoper, te werken door op de juiste plek te surveilleren. Op basis van deze voorspellende kaarten worden roosters van sommige politieteams al ingepland.

Het klinkt als science fiction, schrijft het AD. Nou, niet echt: in Amerika worden dit soort methodes al jarenlang ingezet. Daar worden ook kanttekeningen geplaatst bij de suggestie dat algoritmes een «objectief» beeld van de werkelijkheid geven. Vrij Nederland vatte vorig jaar de argumenten van wiskundige Cathy O’Neil samen:

Als predictive policing-modellen aangeven dat er in arme wijken meer criminaliteit is, zullen de politiewagens meer rondrijden in de arme wijk en arme jongens betrappen die dezelfde dingen doen die rijke jongens ook doen, en die data gaan terug in het model dat daardoor nog sterker het beeld geeft dat het niet pluis is in de arme wijk.

Hier vind je een uitgebreide passage uit O’Neils boek, waarin ze ingaat op predictive policing.

Subsidies en topinkomens in Amsterdam

Amsterdam gaf in 2015 subsidie aan 38 organisaties die hun bestuurders meer betaalden dan de inkomensnorm die de gemeente hanteert voor zijn eigen personeel. Dat blijkt uit een overzicht dat raadslid Johnas van Lammeren (PvdD) heeft opgevraagd. Van Lammeren: «Dit is niet uit te leggen aan de Amsterdammer, én aan de werknemer […] Ik snap dat er soms uitzonderingen kunnen zijn, maar daarvoor is deze lijst veel te lang.»

Achtendertig instellingen lijkt misschien niet zo veel, als je bedenkt dat meer dan duizend organisaties subsidie hebben gekregen. Maar het verandert als je naar de bedragen kijkt. In 2016 gaf de gemeente meer dan 169 miljoen euro subsidie aan organisaties die in 2015 de inkomensnorm hadden overschreden. Dat is 38% van het totale subsidiebedrag van dat jaar.

Het grootste bedrag aan subsidies ging naar Welzijn en Zorg en een fors deel van dat geld kwam terecht bij organisaties die de inkomensnorm hadden overschreden.

Sommige subsidieregelingen werden voor meer dan tachtig procent benut door organisaties die de inkomensnorm hadden overschreden. Dat geldt bijvoorbeeld voor de Subsidie Brede talentontwikkeling en Jongerenwerk Nieuwe Stijl Zuid en de Begrotingspost Subsidie Economie (Organisatiespecifiek). Met die laatste regeling werd Stichting Amsterdam Marketing gesubsidieerd.

De subsidieverordening verwijst niet naar de Amsterdamse norm, maar stelt wel dat subsidies kunnen worden geweigerd als de norm uit de landelijke WNT, die wat hoger ligt, wordt overschreden. Verschillende gesubsidieerde organisaties die de Amsterdamse norm overschreden, staan ook in de landelijke WNT-rapportage over 2015, met inkomens die oplopen tot bijna drie ton. Zij beroepen zich op overgangsrecht waardoor ze formeel niet in overtreding van de wet zijn (of daarmee de weigeringsgrond van de Amsterdamse subsidieregeling ook vervalt, is een vraag voor juristen).

Vijf jaar geleden verscheen op Nieuws uit Amsterdam een overzicht van organisaties die subsidie ontvingen terwijl ze hun bestuurders ruim boven de Balkenendenorm betaalden. Het ging om Hogeschool van Amsterdam / Universiteit van Amsterdam, Stichting Arkin, GGZ InGeest, ROC van Amsterdam, Cordaan, Reade, Stadgenoot, Rochdale en mogelijk het Concertgebouworkest. Al die namen staan ook op het lijstje dat Van Lammeren heeft gekregen, en sommige staan ook al in het subsidieoverzicht van 2017. Er verandert blijkbaar weinig.

Methode

Het overzicht met gesubsidieerde instellingen die de Amsterdamse norm overschreden is afkomstig van AT5. Informatie over verleende subsidies is te vinden in het subsidieregister van de gemeente (zie ook de toelichting daar: bepaalde subsidies zoals loonkostensubsidies zijn niet meegenomen). Organisaties die deel uitmaken van dezelfde groep heb ik als een geheel beschouwd.

Academic support for Mélenchon, mapped

On Sunday, the first round of the French presidential election will be held. Left-wing candidate Jean-Luc Mélenchon has surged in the polls and rightwingers have called his programme devastating. On the other hand, over a hundred economic scientists have said he offers a serious and credible alternative to the destructive austerity policies of the past decades.

Given Mélenchon’s criticism of Germany’s economic policy and his support for Greece, one might expect academic support for his programme to be concentrated in the south of Europe. However, the map shows his academic supporters are also in countries like the UK and Germany.

Read more about Mélenchon’s programme here and here.

Method

I geocoded the affiliations of the list of supporters using this tool and Bing’s map api. Sometimes Bing gets the location of the institution right, sometimes it gives the location of the city where it’s located and sometimes it fails. I’ve corrected a few coordinates manually but I can’t rule out I missed any errors.

Reject all evidence: How George Orwell’s 1984 went viral last January

On Sunday 22 January 2017, Trump adviser Kellyanne Conway introduced the term alternative facts to justify disputed White House claims about how many people had attended Trump’s inauguration. The term alternative facts was quickly associated with the newspeak and doublethink of George Orwell’s novel Nineteen Eighty-Four. Sales of the book became ‘hyperactive’ during the following week.

I looked up some 150,000 tweets about Orwell’s ‘1984’ to see how interest in the novel developed during that week (note that analysing tweets is a somewhat messy business - see Method below for caveats).

But first, a basic timeline. On Friday 20 January, the inauguration took place. Afterwards, people started tweeting photos showing empty spots in the audience. On Saturday, the White House claimed the photos were misleading and that the inauguration had drawn the «largest audience to ever witness an inauguration». On Sunday, Conway appeared on NBC’s Meet the Press and defended the White House claim as alternative facts.

Alternative facts

The chart below shows tweets about Orwell’s 1984 and how many of those tweets specifically mention alternative facts. Immediately after Conway’s Meet the Press interview, the first tweets appeared that made the connection between alternative facts and 1984 (the green line in the chart). The real peak occured on Tuesday, when major media started to discuss the connection.

The alternative facts quote can explain some of the interest in ‘1984’, but there was also a peak in Orwell 1984 tweets even before the interview with Conway took place.

Amazon sales

Meanwhile, sales of the book ‘1984’ on Amazon started to rise. On Sunday, the day of the interview, it reached the top 20. On Tuesday, the Guardian reported it had reached number 6 and in the evening of that same day, it became the number 1 best-selling book on Amazon.

At some point, people started to discuss the rising book sales on twitter, as the chart below shows.

Tweets about sales of ‘1984’ didn’t really take off until Tuesday, and largely coincided with talk about the alternative facts quote.

Reject all evidence

That still leaves the question what the earlier Orwell 1984 tweets were about. Interestingly, almost all these earlier tweets contain the following quote from ‘1984’, which describes how the authorities redefine truth:

The Party told you to reject all evidence of your eyes and ears. It was their final, most essential command.

The chart below shows tweets containing this quote.

On Saturday evening, the White House had held its press conference at which it claimed a record number of people had attended the inauguration. The first reject all evidence tweet I could find was posted before that press conference, but the quote didn’t catch on until after the press conference. Within days, the quote was tweeted over 50,000 times.

In short, Conway’s remark on Sunday about alternative facts boosted interest in ‘1984’, but didn’t start it.

Meanwhile, the 1984 tweets probably reflect a broader phenomenon. Various media have discussed how dystopian novels like ‘1984’ are ‘chiming with people’ (get your reading list here).

Method

I used Python and the Tweepy library to search the Twitter API for orwell 1984. This method has limitations. Twitter provides a sample of all tweets and no-one knows exactly how much is missing from that sample. Further, searching for orwell 1984 may overlook tweets only mentioning orwell or 1984, or even nineteen eighty-four, as in the official book title.

The search for orwell 1984 yielded some 150,000 tweets. If the text contains both alternative and facts (this includes tweets containing #alternativefacts) I classified them as being about alternative facts; if they contain amazon or sales or bestseller or best-seller, I classfied them as being about sales. If they contain reject and evidence and eyes, I classified them as containing the quote «The Party told you to reject all evidence of your eyes and ears. It was their final, most essential command».

I used 9 am as the time at which Meet the Press was aired. For the time of the original White House claim about attendance at the inauguration, I used this recorded live feed which was announced to start at 4:30 pm; the actual press conference starts after about 1.5 hrs, i.e. 6 PM.

Python script to import .sps files

In a post about voting locations (in Dutch) I grumbled a bit about inconsistencies in how Statistics Netherlands (CBS) spells the names of municipalities and why don’t they include the municipality codes in their data exports. This afternoon, someone who works at CBS responded on Twitter. She had asked around and found a workaround: download the data as SPSS. Thanks!

CBS offers the option to download data as an SPSS syntax file (.sps). I wasn’t familiar with this filetype, I don’t have SPSS and I couldn’t immediately find a package to import this filetype. But it turns out that .sps files are just text files, so I wrote a little script that does the job.

Note that it’s not super fast; there may be more efficient ways to do the job. Also, I’ve only tested it on a few CBS data files. I’m not sure it’ll work correctly if all variables have labels or if the file contains not just data but also statistical analysis.

That said, you can find the script here.

Pages