$$\newcommand{\mtn}{\mathbb{N}}\newcommand{\mtns}{\mathbb{N}^*}\newcommand{\mtz}{\mathbb{Z}}\newcommand{\mtr}{\mathbb{R}}\newcommand{\mtk}{\mathbb{K}}\newcommand{\mtq}{\mathbb{Q}}\newcommand{\mtc}{\mathbb{C}}\newcommand{\mch}{\mathcal{H}}\newcommand{\mcp}{\mathcal{P}}\newcommand{\mcb}{\mathcal{B}}\newcommand{\mcl}{\mathcal{L}} \newcommand{\mcm}{\mathcal{M}}\newcommand{\mcc}{\mathcal{C}} \newcommand{\mcmn}{\mathcal{M}}\newcommand{\mcmnr}{\mathcal{M}_n(\mtr)} \newcommand{\mcmnk}{\mathcal{M}_n(\mtk)}\newcommand{\mcsn}{\mathcal{S}_n} \newcommand{\mcs}{\mathcal{S}}\newcommand{\mcd}{\mathcal{D}} \newcommand{\mcsns}{\mathcal{S}_n^{++}}\newcommand{\glnk}{GL_n(\mtk)} \newcommand{\mnr}{\mathcal{M}_n(\mtr)}\DeclareMathOperator{\ch}{ch} \DeclareMathOperator{\sh}{sh}\DeclareMathOperator{\th}{th} \DeclareMathOperator{\vect}{vect}\DeclareMathOperator{\card}{card} \DeclareMathOperator{\comat}{comat}\DeclareMathOperator{\imv}{Im} \DeclareMathOperator{\rang}{rg}\DeclareMathOperator{\Fr}{Fr} \DeclareMathOperator{\diam}{diam}\DeclareMathOperator{\supp}{supp} \newcommand{\veps}{\varepsilon}\newcommand{\mcu}{\mathcal{U}} \newcommand{\mcun}{\mcu_n}\newcommand{\dis}{\displaystyle} \newcommand{\croouv}{[\![}\newcommand{\crofer}{]\!]} \newcommand{\rab}{\mathcal{R}(a,b)}\newcommand{\pss}[2]{\langle #1,#2\rangle} $$
Bibm@th

Tests d'hypothèse

  Une partie du travail du statisticien consiste en l'aide à la décision grâce aux tests d'hypothèse. On considère une hypothèse de départ, qu'on nomme souvent hypothèse nulle, et qu'on note H0. A l'aide d'un échantillon de la population, on fait une étude statistique du caractère étudié. Le test d'hypothèse consiste alors à dire si, avec un risque d'erreur a, l'étude statistique n'est pas incompatible avec H0. Dans ce cas, on accepte H0, sinon on la rejette. Remarquons que le résultat d'un test est toujours négatif : accepter H0 ne signifie pas que l'hypothèse est vraie, mais que les résultats expérimentaux ne s'y opposent pas.

  Suivant la validité réelle de H0 et le résultat du test, il y a 4 cas possibles :
  1. H0 est vraie et on accepte H0 : c'est correct.
  2. H0 est vraie et on refuse H0 : on parle de rejet à tort ou d' erreur de première espèce. Par définition, cela se produit avec une probabilité a.
  3. H0 est fausse et on accepte H0 : on parle de manque de puissance ou d'erreur de deuxième espèce.
  4. H0 est fausse et on refuse H0 : c'est correct. La puissance du test est par définition la probabilité de refuser H0 si H0 est effectivement fausse.

  Il existe deux types de tests :
  • les test paramétriques : ce sont les tests pour lesquels on évalue un paramètre de la loi de probabilité de H0, loi qu'on suppose connue à l'avance. Ces tests sont très liés aux problèmes des intervalles de confiance.
  • les tests non-paramétriques, qui ne nécessitent aucune hypothèse sur la loi de H0. On compare alors si deux populations ont un caractère distribué de la même façon, etc... Un des tests non-paramétriques les plus célèbres est le test du chi-2.

Il faut faire attention à la signification du risque d'erreur. Comme écrit plus haut, le résultat d'un test est toujours négatif : accepter H0 signifie en fait ne pas refuser H0, ou encore que les résultats du test ne sont pas incompatibles avec H0. Dans la pratique, on s'arrange toujours pour que refuser H0 alors que H0 était vraie soit l'alternative la plus grave. Diminuer le risque d'erreur signifie donc diminuer la probabilité que ceci arrive (et pas du tout que quand on accepte H0, H0 soit effectivement vraie). Donnons deux exemples :
  • Le service de répression des fraudes enquête sur un casino. Sur un jeu de roulette à 37 numéros, le zéro est sorti 298 fois sur 10 000 numéros. Y-a-t-il tricherie? L'hypothèse à tester ici est H0:"P(zéro)=1/237". Bien sûr, il faut que le risque qu'on rejette cette hypothèse alors que le casino est honnête soit très faible (on appelle ceci le bénéfice du doute).
  • On compare l'efficacité de deux médicaments. Sur 100 malades, le premier donne 63 guérisons et le second 67 guérisons. Le second est-il meilleur que le premier, ou bien est-ce dû aux fluctuations de l'échantillon? L'hypothèse à tester ici est H0:"P(guérison avec 1er médicament)=P(guérison avec 2ème médicament)". Il est en effet grave d'affirmer que le second médicament soigne mieux que le premier si ce n'est pas le cas.
Consulter aussi...