champagne anarchist | armchair activist

Data

Data viz course assignment: bailout and votes

The fourth assignment of the data visualisation course was to do something with this data on unemployment in US states, published by the Guardian Data Blog. My project could be summarised as ‘It’s the unions, stupid’.

P.S. I didn’t post my work for the third assignment on this blog. I’m afraid it wasn’t any good.

Update - Elsewhere, the impact of the bailout on the election is questioned as well.

Clint Eastwood won the LAUGHTER contest

I’m not sure what this says about the audiences at US national party conventions, but among a sample of 16 speeches, Clint Eastwood’s was the one that elicited the most laughter (Rand Paul’s got most applause). Among the presidential candidates, Obama won the applause contest, while being about equally funny as Romney.

For the second lesson of Alberto Cairo’s online data visualisation course, we were asked to comment on and perhaps redesign this convention word count tool created by the NYT. I wouldn’t be able to do such a cool interactive thing myself (I got stuck in the jQuery part of Codeyear), so I decided to focus on differences between individual speeches instead.

First I needed the transcripts – preferably from one single source to make sure the transcription had been done in a uniform way. As far as I could find, Fox News has the largest collection of transcripts online. As a result, Republican speakers are overrepresented in my sample, but that’s ok because the key Democratic speakers are included as well.

I wrote a script to do the word count (I’m sure this could be done in a more elegant way). One problem with my script was that html-code got included in the total word count. I thought I could correct this by subtracting 1,000 from each word count, but this didn’t work so well, so I had to make some corrections.

This assignment was a bit of a rush job so I hope I didn’t make any stupid mistakes.

85,1% kans dat Obama dinsdag wint

Volgens polling analyst extraordinaire Nate Silver is de kans 85,1% dat Obama dinsdag de presidentsverkiezing wint. Zijn voorspellingen roepen wel enige weerstand op. Als ik de discussie goed begrijp kunnen sommige mensen moeilijk bevatten dat er zo’n grote kans is dat Obama wint, terwijl de meeste peilingen maar een krappe overwinning voorspellen.

Silver heeft een kleurrijke achtergrond: ooit adviseerde hij bedrijven hoe ze hun belastingen zo laag mogelijk kunnen houden. Hij ontwikkelde een programma om statistieken van baseballspelers te analyseren en won als professionele online pokerspeler $400.000, om vervolgens weer $130.000 te verliezen.

Vervolgens ontwikkelde hij een model om verkiezingsuitslagen te voorspellen, waarbij hij gebruik maakt van een groot aantal polls en er onder meer rekening mee houdt hoe accuraat deze polls in het verleden waren. In 2008 wist hij de uitslag van 49 van de 50 staten correct te voorspellen, waarmee zijn reputatie was gevestigd.

In zijn blog op de website van de New York Times doet Silver de meest uiteenlopende voorspellingen, inclusief de relatieve kans dat een individuele kiezer de doorslag geeft - die kans is uiteraard het grootst in Ohio. Eerder opperde ik dat Obama wellicht zou kunnen winnen in North Carolina vanwege de hoge opkomst bij de early vote, maar volgens Silver is die kans maar 21%.

Data visualisation course assignment

As part of Alberto Cairo’s data visualisation course, we’ve been asked to take a look at this graphic of social media use in selected countries and see how it can be improved. What struck me most (although this probably would not surprise social media experts) is the high level of activity in emerging economies. Above is my reinterpretation of the data. As a general indicator of social media use, I calculated the average of the listed types of social media use (upload photos; upload videos; manage profile; blogging; microblogging). Note that the data are from 2009.

Wint Obama North Carolina?

Persoonlijk hou ik van het ritueel om op verkiezingsdag naar het stadsdeelkantoor om de hoek te gaan en m‘n stem uit te brengen, liefst met potlood, in de wetenschap dat miljoenen mensen op dezelfde dag hetzelfde doen. Het enige wat eraan ontbreekt is dat je een I voted-stickertje krijgt, zoals in Amerika. Ondertussen neemt in Amerika het belang van de verkiezingsdag af. Deskundigen verwachten dat misschien wel veertig procent van de kiezers gebruik maakt van early voting. Dat heeft wel weer als voordeel dat meer mensen gaan stemmen en dat de verkiezingen in dat opzicht dus eerlijker worden. Dat is weer gunstig voor Obama.

NRC Handelsblad wees op een website is waar professor Michael McDonald de tussenresultaten van de early vote bijhoudt. Om deze cijfers te interpreteren is het handig om de voorspellingen van Politico er bij te pakken. Een kandidaat heeft 270 electoral votes nodig om te winnen. Obama heeft er waarschijnlijk 237, Romney waarschijnlijk 191 en de rest hangt af van de battleground states.

Als je de voorspellingen van Politico vergelijkt met de tussenresultaten van McDonald dan is met name North Carolina, goed voor 15 electoral votes, interessant. Politico denkt dat deze stemmen naar Romney gaan en sommige Republikeinen speculeerden al dat de Obamacampagne North Carolina zou hebben opgegeven. In de early vote hebben geregistreerde Democraten echter een duidelijke voorsprong (het is niet zeker dat zij ook allemaal op Obama hebben gestemd).

McDonald wijst erop dat de Republikeinen het in North Carolina tot nog toe ietsje beter doen in de early vote dan in 2008. Aangezien Obama deze staat in 2008 maar net won, zou de balans dit keer door kunnen slaan naar Romney. Tegelijk erkent McDonald dat er dit jaar veel meer inwoners van North Carolina gebruik maken van de early vote, wat weer in het voordeel van Obama is.

In dit artikel is gebruik gemaakt van de cijfers per 26 oktober; inmiddels heeft McDonald zijn website bijgewerkt met nieuwe cijfers.

Pages