Problématique:
On étudie un caractère donné noté A (être malade, être exposé à un facteur de risque de maladie…).
On observe la fréquence f de la présence de A dans un échantillon d'individus de taille n tiré d'une population.
Par ailleurs on a la fréquence théorique de A dans une population de référence, notée p0.
La question est de savoir si la fréquence de A, notée p, dans l'ensemble de la population d'où est issu notre échantillon, est égale à cette fréquence théorique p0 (c'est l'hypothèse nulle H0) ou si ces deux fréquences sont statistiquement différentes (c'est l'hypothèse alternative H1).
C'est ce que l'on appelle un test de conformité.
Tests à réaliser :
Si la taille de notre échantillon est plus grand que 30 individus (n ≥ 30) et si le nombre d'individus avec le caractère A est de plus de 5 (np ≥ 5), ainsi que le nombre d'individus ne présentant pas le caractère A ( n(1-p)≥5 ), alors on peut calculer la statistique U qui sous l'hypothèse nulle suit une loi normale centrée réduite ( N(0,1) ):