Hack de Overheid!

Data

Voornamen data beschikbaar voor Apps

In de Verenigde Staten is de meest voorkomende meisjesnaam van nieuwgeborenen Arya, een van de karakters is uit de fantasyserie  ‘Game of Thrones’. Dit soort feitjes zijn leuk voor een persbericht, maar met open data wordt er meer mogelijk.

De Sociale Verzekerings Bank (SVB)  maakt een dataset beschikbaar met alle voornamen in Nederland waardoor er op de hackathon Apps gemaakt kunnen worden. Bijvoorbeeld een App waarmee je makkelijker een voornaam kan uitkiezen, maar ook Apps waarmee de ontwikkelingen in het namenlandschap in kaart worden gebracht.

Een naam kiezen is lastig

In de Verenigde Staten komt deze data jaarlijks beschikbaar, en met dit soort data kan je een toepassing a la Nameberry maken. Dit willen we in Nederland natuurlijk ook, maar dan met de bekende Johnny’s en Anita’s?!

Het Meertens Instituut heeft al eerder deze data gebruikt, en op hun website kan je een hoop achtergrond informatie over namen vinden. Zo zijn er 365 mensen in Nederland die Alper heetten, maar deze leggen het toch echt af tegen een naam als Lex (2016x).

Voornamen analyse in combinatie met media

Zoals Arya een bekende naam in de V.S. is geworden, zou je in een voornamen database ook terug willen kunnen halen hoe dit zit in de  Nederlandse cultuur. Was er ten tijde van de opkomst van Goede Tijden Slechte Tijden er sprake van een ‘Arnie’-golf? Kortom, een open namendatabase heeft ook zeker wetenschappelijke toepassingen.

Met namendatabases kan je zaken doen in het buitenland

Een meer zakelijke toepassing valt te maken door een wereldwijde database van voornamen en achternamen op te bouwen. Niet relevant? Ja zeker wel, getuige dit bericht  op het Open Data  forum van Stack Exchange:

‘Is there a database containing the list of the most popular first names and surnames (with occurrence count, or at least sorted by popularity) for many nations/countries? I need such data for the generating of sample customer database. Customers from given land should at best have the realistic names from that land.’ (door Łukasz Lech)

Nieuwe applicaties en diensten voor het bedrijfsleven  zou zeer geholpen zijn met dit soort databases. Stel je hebt een geweldige nieuw CRM product en je wilt dat in China verkopen. Een goede demo valt of staat met dummy data die aansluit bij de belevingswereld van de klant. Kortom, er zijn bedrijven die hier prima geld voor over hebben.

 Aan de slag met de data

We hebben inmiddels een sneak preview mogen uitvoeren en over de data kunnen we het volgende zeggen:

  • Looptijd 2000-2012
  • 50.000 records CSV,
  • Velden: Geslacht, Naam, Geboortejaar, Geboortemaand, Aantal
  • Sample:

M;2000; 1;Adriaan;11
M;2000; 1;Ahmed;13
M;2000; 1;Albert;17
M;2000; 1;Alex;12

Prijzen winnen

We hopen dan ook dat er paar mooie Naam Apps gemaakt worden, zodat er goede redenen zijn om deze data frequenter (bv. maandelijks) vrij te geven. De twee beste Prototypes / Apps krijgen een geld prijs van €500 euro (excl. BTW)! Kortom, het wordt weer een geweldige Hackathon de 29ste! Vergeet je vooral niet in te schrijven.

 

Download q05a

The following two tabs change content below.

Lex Slaghuis

Lex Slaghuis is een van de oprichters van Hack de Overheid en CTO bij Open State. Hij houdt zich bezig data, API's, community en Apps. Speciale aandacht gaat uit naar Open Cultuur Data, Open Spending en politieke transparantie.

Laatste berichten van Lex Slaghuis (toon alles)


One comments on “Voornamen data beschikbaar voor Apps

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.