$$\newcommand{\mtn}{\mathbb{N}}\newcommand{\mtns}{\mathbb{N}^*}\newcommand{\mtz}{\mathbb{Z}}\newcommand{\mtr}{\mathbb{R}}\newcommand{\mtk}{\mathbb{K}}\newcommand{\mtq}{\mathbb{Q}}\newcommand{\mtc}{\mathbb{C}}\newcommand{\mch}{\mathcal{H}}\newcommand{\mcp}{\mathcal{P}}\newcommand{\mcb}{\mathcal{B}}\newcommand{\mcl}{\mathcal{L}} \newcommand{\mcm}{\mathcal{M}}\newcommand{\mcc}{\mathcal{C}} \newcommand{\mcmn}{\mathcal{M}}\newcommand{\mcmnr}{\mathcal{M}_n(\mtr)} \newcommand{\mcmnk}{\mathcal{M}_n(\mtk)}\newcommand{\mcsn}{\mathcal{S}_n} \newcommand{\mcs}{\mathcal{S}}\newcommand{\mcd}{\mathcal{D}} \newcommand{\mcsns}{\mathcal{S}_n^{++}}\newcommand{\glnk}{GL_n(\mtk)} \newcommand{\mnr}{\mathcal{M}_n(\mtr)}\DeclareMathOperator{\ch}{ch} \DeclareMathOperator{\sh}{sh}\DeclareMathOperator{\th}{th} \DeclareMathOperator{\vect}{vect}\DeclareMathOperator{\card}{card} \DeclareMathOperator{\comat}{comat}\DeclareMathOperator{\imv}{Im} \DeclareMathOperator{\rang}{rg}\DeclareMathOperator{\Fr}{Fr} \DeclareMathOperator{\diam}{diam}\DeclareMathOperator{\supp}{supp} \newcommand{\veps}{\varepsilon}\newcommand{\mcu}{\mathcal{U}} \newcommand{\mcun}{\mcu_n}\newcommand{\dis}{\displaystyle} \newcommand{\croouv}{[\![}\newcommand{\crofer}{]\!]} \newcommand{\rab}{\mathcal{R}(a,b)}\newcommand{\pss}[2]{\langle #1,#2\rangle} $$
Bibm@th

Correction de Yates

  La correction de Yates est une modification apportée au test d'indépendance du $\chi^2$ lorsque l'un des effectifs théoriques est trop faible. Précisément, voici comment se déroule un test du $\chi^2$ lorsqu'on applique la correction de Yates :
  • Données :
    • 2 variables $X$ et $Y$, les valeurs possibles de $X$ sont réparties en $\ell$ classes $A_1,\dots,A_\ell$, celles de $Y$ en $c$ classes $B_1,\dots,B_c$.
    • $n$ observations réparties en $\ell\times c$ effectifs observés : $n_{i,j}$ observations ont donné à la fois $A_i$ et $B_j$, avec donc $\sum_{i,j}n_{i,j}=n$.
  • Hypothèse testée : "Les variables $X$ et $Y$ sont indépendantes".
  • Déroulement du test :
    1. On crée le tableau des effectifs qui est un tableau à double-entrée. A l'intersection de la $i$-ème ligne et de la $j$-ième colonne, on écrit l'effectif $n_{i,j}$.
    2. On "borde" le tableau pour calculer les effectifs marginaux : $L_i$ est la somme des termes sur la $i$-ème ligne, $C_j$ est la somme des termes sur la $j$-ième colonne. $$\begin{array}{c|c|c|c|c} &&\quad j \quad &&\\ \hline &\quad \cdots\quad&\cdots&\quad\cdots\quad&\quad\cdots\quad\\ \hline \quad i \quad&\cdots&n_{i,j}&\cdots&L_i\\ \hline &\quad \cdots\quad&\cdots&\quad\cdots\quad&\quad\cdots\quad\\ \hline &&C_j&& \end{array}$$
    3. On calcule les effectifs théoriques (ceux que l'on s'attend à rencontrer si $X$ et $Y$ étaient indépendantes) : $$e_{i,j}=\frac{L_i\times C_j}n.$$
    4. On calcule la valeur de la variable de test. Si pour tout couple $(i,j)$, on a $e_{i,j}\geq 5$, alors on le calcule par la formule usuelle : $$\chi^2=\sum_{i=1}^{\ell}\sum_{j=1}^c \frac{(n_{i,j}-e_{i,j})^2}{e_{i,j}}.$$ Si au moins un des $e_{i,j}$ est inférieur ou égal à 5, on applique la correction de Yates en calculant : $$\chi^2=\sum_{i=1}^{\ell}\sum_{j=1}^c \frac{\left( |n_{i,j}-e_{i,j}|-\frac 12\right)^2}{e_{i,j}}.$$
    5. On cherche la valeur critique $\chi^2_a$ dans la table de la loi du chi-2 à $(\ell-1)\times (c-1)$ degrés de liberté.
    6. Si $\chi^2<\chi^2_a$, on accepte l'hypothèse, sinon on la rejette.
Consulter aussi...