Hack de Overheid!

Data

NPO Backstage Datablog #3: Met je hoofd op tv!

Experts, BN’ers, politici. Televisieprogramma’s staan er bol van. Soms komen ze langs, in bijvoorbeeld actualiteitenprogramma’s, maar ze kunnen ook genoemd worden in nieuws bulletins, zoals het Achtuurjournaal. Met behulp van de NPO Backstage API kunnen we achterhalen hoe vaak een persoon wordt genoemd. Dit kunnen we gebruiken als een indicator voor de populariteit van een persoon. In deze blog post laten we zien hoe je dat op een simpele manier een overzicht maakt van de populariteit van een groep mensen (in dit geval politici).

Personen

Het is verleidelijk om Named Entity Recognition toe te passen om een volledige lijst van personen te krijgen, maar dat is een complexe en tijdrovende oplossing. Handiger is om een vaste lijst te nemen. Voor dit voorbeeld stellen we een lijst samen van Nederlandse politici. Dit doen we door de kamerleden van tweedekamer.nl te scrapen en door de bewindspersonen van rijksoverheid.nl te scrapen. Dit scrapen is betrekkelijk eenvoudig door gebruik te maken van BeautifulSoup:

De API gebruiken

Hierna kunnen we queries afvuren op de NPO Backstage API. We doen dit door voor elke politicus een aparte query te doen. Het totaal aantal resultaten kan eenvoudig worden uitgelezen (Met behulp van de date facet kan je zelfs het aantal resultaten per week of per maand terug krijgen!):

Het eindresultaat

Wat dan nog rest is de resultaten uit deze queries te combineren en ordenen:

De volledige code staat in de NPO Backstage Examples GitHub repository. We hebben dit nu voor politici gedaan, maar het principe gaat het ook op voor bijvoorbeeld presentatoren, of zelfs producten dan wel plaatsen.

De twee grafieken hieronder laten het resultaat zien. Niet verrassend is dat minister-president Mark Rutte de politicus is die het vaakst genoemd wordt, net voor Geert Wilders en Diederik Samsom. Bij de partijen valt op dat de fractie Klein het vaakst lijkt genoemd te worden, maar dit komt natuurlijk omdat klein als los woord ook gebruikt wordt.

DataHero 2015-08-31 10-37-16 DataHero 2015-08-31 10-36-48

Doe mee met de NPO Backstage Competitie!

Wil je ook aan de slag met de data in de NPO Backstage API? Bekijk dan vooral de documentatie. Tot en met donderdag 17 september 2015 kun je jouw app of website die gebruik maakt van data uit de NPO Backstage API insturen. Zo maak je kans op de hoofdprijs van €3.000 of één van de andere geldprijzen als je bij de beste 15 zit. Op 25 september 2015 vindt in Hilversum de prijsuitreiking plaats. Laat hier weten of je daarbij wil zijn!

Ook kun je NPO Backstage volgen op Twitter en Facebook en houd npo.nl/backstage in de gaten voor alle informatie!

The following two tabs change content below.
Breyten is developer bij Open State Foundation en werkt in die hoedanigheid aan diverse projecten, waaronder Politwoops.

2 comments on “NPO Backstage Datablog #3: Met je hoofd op tv!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.