Representativiteit

In veel onderzoek is het niet mogelijk om iedereen uit de populatie deel te laten nemen. Het is bijvoorbeeld onmogelijk om alle 16 miljoen Nederlanders te ondervragen. De onderzoeker selecteert dan een afvaardiging. Die afvaardiging moet dan wel representatief zijn. Representativiteit is afgeleid van de term ‘representant’. De onderzoeker stelt daarmee de eis dat de personen die hij ondervraagt representatief zijn voor de populatie.

Om vast te stellen of de deelnemers representatief staan, zal aangegeven moeten worden welke kenmerken van de populatie bij de kenmerken van de respondenten terug moeten komen. Van een populatie ‘bedrijven in een regio’ kan men kenmerken vaststellen zoals bedrijfsgrootte, branche, en plaats. Bij de deelnemers aan het onderzoek wil men nu dat er verhoudingsgewijs evenveel bedrijven voorkomen met dezelfde kenmerken als in de populatie. Is dat het geval dan noemt men de steekproef representatief; is dat niet het geval dan is de steekproef niet representatief. Een tweetal voorbeelden moge dit verduidelijken.

Voorbeeld 1:
Stel dat men wil nagaan of de verdeling van de bedrijven die meedoen aan het onderzoek overeenkomt met een verdeling in de populatie op het kenmerk bedrijfstype. Stel dat men in de populatie drie typen onderscheidt die de volgende mate van voorkomen hebben:

Soort bedrijf           Aantal           Percentage
industrieel
groothandel
dienstverlenend          
2500
1000
1500
50%
20%
30%
totaal 5000 100%

Hieruit trekt men (op systematische wijze met a-select begin) een steekproef van 200 bedrijven. Men verwacht nu dat de volgende aantallen in de steekproef zitten:

Soort bedrijf           Aantal           Percentages
industrieel
groothandel
dienstverlenend         
100
  40
  60
50%
20%
30%
totaal 200 100%

Na het verzameld hebben van de gegevens, blijken de volgende bedrijven te hebben gereageerd:

Soort bedrijf           Aantal           Percentages
industrieel
groothandel
dienstverlenend         
65
15
20
65%
15%
20%
totaal 100 100%

De representativiteit berekent men (in dit geval) met behulp van de Chikwadraattoets. In het voorbeeld wordt dit:

Chi2 =   (65 - 50)2/50 + (15 - 20)2/20 + (20 - 30)2/30 =   9,08333

Het aantal vrijheidsgraden is (3 groepen  - 1 =) 2. Opzoeken in een tabel met de chikwadraatverdeling levert als resultaat op dat er een significante afwijking is op alfa = .05 niveau (zelfs op alfa = .025 maar niet op alfa = .01 niveau). De respons is dus niet representatief voor de populatie op het aspect soort bedrijf.

Voorbeeld 2:
Stel dat men wil nagaan of de bedrijven die aan het onderzoek deelnemen overeenkomen met een verdeling in de populatie op het kenmerk bedrijfsgrootte. In de populatie worden vier groottes onderscheiden die de volgende mate van voorkomen hebben:

Soort bedrijf           Aantal           Percentages
klein (minder dan 10 werknemers)
middelklein (van 10 t.e.m. 49 werknemers)          
middelgroot (van 50 t.e.m. 99 werknemers) 
groot (vanaf 100 werknemers)
2000
1500
1000
  500
40%
30%
20%
10%
totaal 5000 100%

Hieruit trekt men (op systematische wijze met a-select begin) een steekproef van 200 bedrijven. Men verwacht nu dat de volgende aantallen in de steekproef zitten:

Soort bedrijf           Aantal           Percentages
klein (minder dan 10 werknemers)
middelklein (van 10 t.e.m. 49 werknemers)
middelgroot (van 50 t.e.m. 99 werknemers)           
groot (vanaf 100 werknemers)
80
60
40
20
40%
30%
20%
10%
totaal 200 100%

In de verzamelde gegevens zitten de volgende aantallen:

Soort bedrijf           Aantal           Percentages
klein (minder dan 10 werknemers)
middelklein (van 10 t.e.m. 49 werknemers)
middelgroot (van 50 t.e.m. 99 werknemers)           
groot (vanaf 100 werknemers)
38
33
21
  8
38%
33%
21%
  8%
totaal 200 100%

In dit voorbeeld berekent men de representativiteit naar bedrijfsgrootte als:

Chi2 = (38 - 40)2/40 + (33 - 30)2/30 + (21 - 20)2/20 +(8 - 10)2/10 =   0,85

Het aantal vrijheidsgraden is (4 groepen - 1 = ) 3. Opzoeken in een tabel met de chikwadraatverdeling levert als resultaat op dat er geen significante afwijking is op alfa = .05 niveau. De respons is dus wel representatief voor de populatie op dit kenmerk.

Waarom is de eis van representativiteit nu zo belangrijk? Dit heeft met het volgende te maken. Indien men de gegevens analyseert van de respondenten die representatief zijn voor de populatie dan mag men zeggen dat de uitkomst uit die analyse (onder voorbehoud van een bepaalde betrouwbaarheidsmarge) voor de hele populatie geldt. Indien de respons niet representatief is voor het totaal, dan mag men de conclusies uit de analyses niet generaliseren naar de totale populatie. Daarmee wordt het duidelijk dat het eigenlijk niet gaat om de representativiteit van de steekproef, maar dat het feitelijk gaat om de representativiteit van de respons. De representativiteit van de steekproef is een min of meer noodzakelijke tussenstap (tenzij men gebruikt maakt van oversampelen).

In de illustratie wordt dit visueel duidelijk gemaakt. De kenmerken van de populatie zitten ook in de steekproef, maar de dichtheid (het aantal elementen) van de steekproef is al veel minder. Bij de respons is de dichtheid nog weer minder, maar de responsgroep heeft nog steeds dezelfde kenmerken als de populatie. Bij een respons die niet representatief is, zit ergens een bepaalde verdichting of een bepaalde verdunning. Er is sprake van selectieve uitval. In het meest extreme geval mist zelfs een hele hoek. Dit kan veroorzaakt worden omdat de steekproef niet representatief is maar het kan ook het gevolg zijn van non-respons.

Soms is het gewenst om een niet representatieve steekproef te hebben om tot een representatieve respons te komen. En een enkele keer wil men zelfs een niet-representatieve respons. In het bovenstaande voorbeeld is de respons van 8 bedrijven met meer dan 100 werknemers eigenlijk te klein om daar iets zinvols over te zeggen. Men kan dit verhogen door voor dit segment meer bedrijven te selecteren. Het gevolg is dan wel dat in het totaal dit segment nu een onevenredig groot aandeel heeft. Door middel van wegen (weging) kan hiervoor worden gecorrigeerd.

Copyrights

© Foeke van der Zee / BMOOO - Woordenboek onderzoek, methodologie en statistiek

Meer MOA


Kennispartners van Daily Data Bytes

MOA is een

CRKBO Instelling CMYK

Contact

MOA, Expertise Center voor Marketing-insights, Onderzoek & Analytics

VIDA-gebouw
Kabelweg 57, 2e verdieping
1014 BA Amsterdam
+31 20 5810710
Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken.