Data

Data visualisation course assignment

As part of Alberto Cairo’s data visualisation course, we’ve been asked to take a look at this graphic of social media use in selected countries and see how it can be improved. What struck me most (although this probably would not surprise social media experts) is the high level of activity in emerging economies. Above is my reinterpretation of the data. As a general indicator of social media use, I calculated the average of the listed types of social media use (upload photos; upload videos; manage profile; blogging; microblogging). Note that the data are from 2009.

Wint Obama North Carolina?

Persoonlijk hou ik van het ritueel om op verkiezingsdag naar het stadsdeelkantoor om de hoek te gaan en m‘n stem uit te brengen, liefst met potlood, in de wetenschap dat miljoenen mensen op dezelfde dag hetzelfde doen. Het enige wat eraan ontbreekt is dat je een I voted-stickertje krijgt, zoals in Amerika. Ondertussen neemt in Amerika het belang van de verkiezingsdag af. Deskundigen verwachten dat misschien wel veertig procent van de kiezers gebruik maakt van early voting. Dat heeft wel weer als voordeel dat meer mensen gaan stemmen en dat de verkiezingen in dat opzicht dus eerlijker worden. Dat is weer gunstig voor Obama.

NRC Handelsblad wees op een website is waar professor Michael McDonald de tussenresultaten van de early vote bijhoudt. Om deze cijfers te interpreteren is het handig om de voorspellingen van Politico er bij te pakken. Een kandidaat heeft 270 electoral votes nodig om te winnen. Obama heeft er waarschijnlijk 237, Romney waarschijnlijk 191 en de rest hangt af van de battleground states.

Als je de voorspellingen van Politico vergelijkt met de tussenresultaten van McDonald dan is met name North Carolina, goed voor 15 electoral votes, interessant. Politico denkt dat deze stemmen naar Romney gaan en sommige Republikeinen speculeerden al dat de Obamacampagne North Carolina zou hebben opgegeven. In de early vote hebben geregistreerde Democraten echter een duidelijke voorsprong (het is niet zeker dat zij ook allemaal op Obama hebben gestemd).

McDonald wijst erop dat de Republikeinen het in North Carolina tot nog toe ietsje beter doen in de early vote dan in 2008. Aangezien Obama deze staat in 2008 maar net won, zou de balans dit keer door kunnen slaan naar Romney. Tegelijk erkent McDonald dat er dit jaar veel meer inwoners van North Carolina gebruik maken van de early vote, wat weer in het voordeel van Obama is.

In dit artikel is gebruik gemaakt van de cijfers per 26 oktober; inmiddels heeft McDonald zijn website bijgewerkt met nieuwe cijfers.

Hoe snel staan uitspraken van rechters online?

Uitspraken van rechters kan je opzoeken op rechtspraak.nl, maar niet alles is daar te vinden. Slechts 2% van de uitspraken wordt online gezet. Als uitspraken al worden gepubliceerd, dan nog moet je er soms te lang op wachten, zo klaagden journalisten in het verleden.

Is die kritiek (nog steeds) terecht? Een analyse van 3.000 recent gepubliceerde uitspraken levert het volgende beeld op: ongeveer de helft van deze uitspraken stond binnen een week online, bij de rest duurde het langer. Je kan je voorstellen dat journalisten vaak nog op de dag zelf over een uitspraak willen kunnen beschikken; dit was bij iets meer dan een kwart van de gepubliceerde uitspraken mogelijk.

Methode

Ik heb bij rechtspraak.nl een verzoek ingediend voor metagegevens over recent gepubliceerde uitspraken, maar dit leverde vooralsog slechts een ontvangstbevestiging op. Via de zoekfunctie op rechtspraak.nl heb ik daarom een steekproef van 3.000 recent gepubliceerde uitspraken bekeken. Een kanttekening bij deze methode is dat het onduidelijk is hoe de zoekresultaten worden gesorteerd; dit zou van invloed kunnen zijn op de samenstelling van de steekproef.

Massale onlinecursus datavisualisatie

‘We are certain our server capacity will operate fine’, schrijft het Knight Center for Journalism in the Americas in een email aan de deelnemers aan een onlinecursus Introduction to Infographics and Data Visualisation, die aanstaande zondag van start gaat. Oorspronkelijk was het de bedoeling dat iedereen mocht meedoen, maar bij nader inzien heeft men toch maar een grens gelegd bij 2.000 deelnemers en die grens is twee weken geleden bereikt. Voor het geval de servers het onverhoopt toch begeven wordt een reservewebsite achter de hand gehouden.

De cursus wordt gegeven door Alberto Cairo, auteur van the Functional Art, een boek dat in recensies wordt geprezen als het nieuwe standaardwerk over datavisualisatie. Inmiddels ben ik erin begonnen en het is goed, maar wat mij betreft toch niet zo goed als Visualise This van Nathan Yau. Yau geeft meer praktische uitleg en zijn strakke vormgeving spreekt me meer aan dan de toch wat barokke aanpak van Cairo. Evengoed ben ik erg benieuwd naar Cairo’s onlinecursus.

Concernrelaties uit het KvK-handelsregister opslaan

Onder welk moederbedrijf valt een onderneming? Welke BV’s hangen eronder? Bij de Kamer van Koophandel kan je tegen betaling de bedrijfsstructuur van een onderneming bekijken, of tenminste het Nederlandse deel. Helaas is het niet mogelijk om deze informatie op een eenvoudige manier te exporteren. Je kan de hele structuur kopiëren en plakken in een worddocument, maar bij een uitgebreide structuur kan dit eindeloos duren (of is mijn macbook zo traag?). Deze aanpak werkt beter:

  • Plaats de cursor ergens in de bedrijfsstructuur.
  • Selecteer de hele structuur (cmd-a of ctr-a).
  • Klik rechts en selecteer ‘Bron van selectie bekijken’ (zo heet dat althans in Firefox).
  • Opslaan met extensie .html; dit document kan je vervolgens met je browser openen.

So far so good, maar op deze manier verlies je de lijnen en symbolen aan de linkerkant van de pagina die de relaties tussen de bedrijven weergeven. Dit kan je met een paar stappen verhelpen:

  • De symbolen aan de linkerkant bestaan uit gif-afbeeldingen. Sla ze allemaal op door rechts klikken, opslaan als; bewaar ze in dezelfde map waar ook het html-document is opgeslagen. Afhankelijk van de complexiteit van de structuur heb je de volgende afbeeldingen nodig: A.GIF, B.GIF, BA.GIF, BE.GIF, BEA.GIF, E.GIF, LIJN2.GIF, PIXEL.GIF, TSTUK.GIF, VERT.GIF. Het is even zoeken om ze allemaal te vinden, maar dit hoef je maar één keer te doen: je kan de afbeeldingen in de toekomst weer gebruiken.
  • Open het html-document met een teksteditor en gebruik zoeken en vervangen om alle instanties van /wwwsrvu/gif/ te verwijderen.
  • Sla het gewijzigde html-document op. Als je hem nu opnieuw in de browser opent (en de afbeeldingen staan in dezelfde map als het html-document) dan staan de symbolen op hun plek.

Mag dit zomaar? Ik denk het wel, de disclaimer van de KvK zegt dat je informatie voor eigen gebruik mag downloaden. Een beetje omslachtig is het wel. Mocht iemand een slimmere manier weten dan hou ik me aanbevolen.

Pages