Dictionnaire de mathématiques > Dénombrements et probabilités > Statistiques > Estimation et tests >
Tests du chi-deux
Les tests du chi-deux (ou khi-deux, ou
- le test du chi-deux d'ajustement, ou d'adéquation, qui compare globalement la distribution observée dans un échantillon statistique à une distribution théorique.
- le test du chi-deux d'indépendance, qui teste si deux caractères d'une population sont indépendants.
- le test d'homogénéité, qui teste si des échantillons sont issus d'une même population.
Test d'ajustement du chi-deux
Le but de ce test est de comparer une distribution théorique d'un caractère à une distribution
observée. Pour cela, le caractère doit prendre un nombre fini de valeurs, ou bien ces valeurs doivent être rangées
en un nombre fini de classes.
- Données :
- un caractère A dont les valeurs possibles sont réparties en k classes A1,...,Ak. La probabilité théorique dans chacune des classes est notée p1,...,pk.
- n observations, qui donnent un effectif n1 pour la classe A1,...,nk pour la classe Ak. Bien sûr, on doit avoir n1+...+nk=n.
- Hypothèse testée : "La distribution observée est conforme à la distribution théorique" avec un risque d'erreur a.
- Déroulement du test :
- On calcule les effectifs théoriques npj.
- On calcule la valeur observée de la variable de test :
- On cherche la valeur critique
dans la table de la loi du chi-2 à k-1 degrés de liberté.
- Si
, on accepte l'hypothèse, sinon on la rejette.
- Vérification a posteriori des conditions d'application : il faut $np_j\geq 5$ pour tout $j$.
Test d'indépendance du chi-deux
Le test d'indépendance du chi-deux permet de contrôler l'indépendance de deux caractères
dans une population donnée.
- Données :
- 2 variables $X$ et $Y$, les valeurs possibles de $X$ sont réparties en $\ell$ classes $A_1,\dots,A_\ell$, celles de $Y$ en $c$ classes $B_1,\dots,B_c$.
- $n$ observations réparties en $\ell\times c$ effectifs observés : $n_{i,j}$ observations ont donné à la fois $A_i$ et $B_j$, avec donc $\sum_{i,j}n_{i,j}=n$.
- Hypothèse testée : "Les variables $X$ et $Y$ sont indépendantes".
- Déroulement du test :
- On crée le tableau des effectifs qui est un tableau à double-entrée. A l'intersection de la $i$-ème ligne et de la $j$-ième colonne, on écrit l'effectif $n_{i,j}$.
- On "borde" le tableau pour calculer les effectifs marginaux : $L_i$ est la somme des termes sur la $i$-ème ligne, $C_j$ est la somme des termes sur la $j$-ième colonne. $$\begin{array}{c|c|c|c|c} &&\quad j \quad &&\\ \hline &\quad \cdots\quad&\cdots&\quad\cdots\quad&\quad\cdots\quad\\ \hline \quad i \quad&\cdots&n_{i,j}&\cdots&L_i\\ \hline &\quad \cdots\quad&\cdots&\quad\cdots\quad&\quad\cdots\quad\\ \hline &&C_j&& \end{array}$$
- On calcule les effectifs théoriques (ceux que l'on s'attend à rencontrer si $X$ et $Y$ étaient indépendantes) : $$e_{i,j}=\frac{L_i\times C_j}n.$$
- On calcule la valeur de la variable de test : $$\chi^2=\sum_{i=1}^{\ell}\sum_{j=1}^c \frac{(n_{i,j}-e_{i,j})^2}{e_{i,j}}.$$
- On cherche la valeur critique $\chi^2_a$ dans la table de la loi du chi-2 à $(\ell-1)\times (c-1)$ degrés de liberté.
- Si $\chi^2<\chi^2_a$, on accepte l'hypothèse, sinon on la rejette.
- Vérification a posteriori des conditions d'application : il faut que les effectifs théoriques vérifient $e_{i,j}\geq 5$ pour tous i,j.


Test d'homogénéité du chi-deux
Le problème d'homogénéité est le suivant. On a réalisé l études statistiques où on a observé
un caractère dont la valeur est répartie en c classes A1,...,Ac. Si les échantillons
de chaque étude étaient parfaitement représentatifs d'une même population, les proportions
d'individus de chaque classe seraient exactement les mêmes. Ce n'est évidemment jamais le cas, et un test
d'homogénéité consiste à étudier si cela est dû aux fluctuations d'échantillonage ou bien au fait que les échantillons
proviennent de populations différentes.
Un problème d'homogénéité peut en fait toujours se traduire en problème d'indépendance : est-ce que
la proportion d'individus dans chaque classe est indépendante de l'étude statistique réalisée. Le test
d'indépendance du chi-deux présenté ci-dessus s'applique alors mot pour mot.
Consulter aussi...