Aan de vooravond van TK2017 én de dataverzameling

Een paar maanden geleden ben ik gestart met mijn masterthesis. Destijds schreef ik daar deze blogpost over, waarbij ik mij nog in de oriënterende fase bevond. De maatschappelijke en wetenschappelijke relevantie zijn inmiddels verder uitgewerkt en ook de hypotheses zijn opgesteld op basis van wetenschappelijke literatuur. Mijn onderzoeksvraag luidt:

Welk effect heeft het inzetten van Twitter in een politieke campagne op het aantal voorkeurstemmen dat een politicus haalt tijdens de Tweede Kamerverkiezingen van maart 2017?

Vandaag – dinsdag 14 maart 2017 – staan we aan de vooravond van de Tweede Kamerverkiezingen. Om de manier waarop politici gebruik maken van Twitter tijdens de campagne-periode te onderzoeken, heb ik alle Twitteraccounts nodig van de verkiesbare kandidaten. Inmiddels heb ik een databestand aangemaakt waarin van iedere verkiesbare kandidaat de volgende kenmerken zijn verzameld:

Het verzamelen van de Twitteraccounts was nog een hele klus aangezien er ruim 1100 kandidaten deelnemen én sommige kandidaten meerdere accounts gebruiken. Naast hun persoonlijke account gebruiken ze voor de verkiezingen bijvoorbeeld nog een account waarin de partijnaam voorkomt. In dat geval neem ik beide accounts mee in de analyse.

Ook wisselen de kieslijsten van een aantal partijen in verschillende kieskringen wat betreft de volgorde van de kandidaten. Zo kan een kandidaat in kieskring 7 op plek 12 staan, terwijl dat in kieskring 12 een lagere positie is (of in die kieskring helemaal niet verkiesbaar is).

Om de activiteit uit de volledige campagneperiode te kunnen gebruiken, verzamel ik komende donderdag – de dag na de verkiezingen – de data van de Twitteraccounts van de verkiesbare kandidaten. Daarna kan ik aan de gang met de analyse van deze (waarschijnlijk) grote hoeveelheid tweets en dit gaan koppelen aan de verkiezingsuitslag.