Het betrouwbaarheidsinterval geeft aan tussen welke uitersten de werkelijke waarde waarschijnlijk zal zitten.
Vaak wil de onderzoeker dat een onderzoeksresultaat staat of geldt voor de hele populatie. Het is echter onmogelijk om uit alle mogelijk combinaties van elementen uit de populatie steeds maar weer hetzelfde resultaat te krijgen. Stelt u zich eens voor, dat u van een populatie bestaande uit 1000 mensen een steekproef trekt van 200 mensen en van hun de leeftijd noteert. Als u opnieuw een steekproef trekt van 200 respondenten, zult u merken dat ondanks de toets op representativiteit de gemiddelde leeftijd van de eerste steekproeftrekking iets zal verschillen van de tweede keer (al was het maar in honderdsten achter de komma). U mag dan ook niet stellen dat de gemiddelde leeftijd zoals berekend uit de steekproef, ook echt precies het gemiddelde is van de populatie. Er zit een bepaalde marge tussen hetgeen men meet (het steekproefgemiddelde) en hetgeen feitelijk is (het populatiegemiddelde).
Om vanuit een resultaat uit een steekproef iets over de populatie te zeggen, houdt men een betrouwbaarheidsmarge aan. Deze wordt meestal op 95% gezet, maar men kan ook een betrouwbaarheidsinterval wensen van 99% of van 90%. Omdat men niet weet of het steekproefresultaat naar onderen of naar boven afwijkt, neemt men altijd een boven en een ondermarge.
De formule voor het berekenen van de betrouwbaarheidsmarges voor een gemiddelde staat in de pop-up illustratie (formule voor gemiddelden). Als men een proportionele verdeling heeft, dan neemt men de formule voor proporties.
Tot slot nog twee opmerkingen:
Indien men de betrouwbaarheid verhoogt (van bijvoorbeeld 95% naar 99%) dan wordt het betrouwbaarheidsinterval groter. Immers een verhoging van de betrouwbaarheid is een verhoging van de za/2-waarde (in dit voorbeeld van 1,96 naar 2,58). Dit heeft tot gevolg dat de minimale score lager uitvalt en de maximale score hoger.
De tweede opmerking is dat door het verhogen van het aantal onderzoekseenheden, het betrouwbaarheidsinterval kleiner wordt. Dit is ook vrij logisch: door steeds meer elementen uit de populatie in de steekproef op te nemen, komt men steeds dichter bij de feitelijke waarde van de populatie.