$$\newcommand{\mtn}{\mathbb{N}}\newcommand{\mtns}{\mathbb{N}^*}\newcommand{\mtz}{\mathbb{Z}}\newcommand{\mtr}{\mathbb{R}}\newcommand{\mtk}{\mathbb{K}}\newcommand{\mtq}{\mathbb{Q}}\newcommand{\mtc}{\mathbb{C}}\newcommand{\mch}{\mathcal{H}}\newcommand{\mcp}{\mathcal{P}}\newcommand{\mcb}{\mathcal{B}}\newcommand{\mcl}{\mathcal{L}} \newcommand{\mcm}{\mathcal{M}}\newcommand{\mcc}{\mathcal{C}} \newcommand{\mcmn}{\mathcal{M}}\newcommand{\mcmnr}{\mathcal{M}_n(\mtr)} \newcommand{\mcmnk}{\mathcal{M}_n(\mtk)}\newcommand{\mcsn}{\mathcal{S}_n} \newcommand{\mcs}{\mathcal{S}}\newcommand{\mcd}{\mathcal{D}} \newcommand{\mcsns}{\mathcal{S}_n^{++}}\newcommand{\glnk}{GL_n(\mtk)} \newcommand{\mnr}{\mathcal{M}_n(\mtr)}\DeclareMathOperator{\ch}{ch} \DeclareMathOperator{\sh}{sh}\DeclareMathOperator{\th}{th} \DeclareMathOperator{\vect}{vect}\DeclareMathOperator{\card}{card} \DeclareMathOperator{\comat}{comat}\DeclareMathOperator{\imv}{Im} \DeclareMathOperator{\rang}{rg}\DeclareMathOperator{\Fr}{Fr} \DeclareMathOperator{\diam}{diam}\DeclareMathOperator{\supp}{supp} \newcommand{\veps}{\varepsilon}\newcommand{\mcu}{\mathcal{U}} \newcommand{\mcun}{\mcu_n}\newcommand{\dis}{\displaystyle} \newcommand{\croouv}{[\![}\newcommand{\crofer}{]\!]} \newcommand{\rab}{\mathcal{R}(a,b)}\newcommand{\pss}[2]{\langle #1,#2\rangle} $$
Bibm@th

Analyse de données statistiques : espérance, variance, écart-type...

  Lorsqu'on a des données statistiques, l'espérance correspond à la moyenne de ces données. Supposons par exemple qu'on dispose d'un lot de 1000 ampoules d'un même modèle, et que l'on souhaite connaïtre la durée moyenne de vie d'une ampoule. On appellera aussi ceci l'espérance (de vie) d'une ampoule. On note pour la i-ème ampoule Ti la durée effective de vie de l'ampoule. Alors l'espérance de vie d'une ampoule est :
E(T)=(T1+...+T1000)/1000.
Autre exemple, dans une classe de 25 élèves, l'espérance des notes à un devoir est la moyenne de ces notes!

  La variance et l'écart-type mesurent eux la dispersion des notes autour de la moyenne (ou espérance). Par exemple, on sait qu'en moyenne une ampoule aura comme durée de vie l'espérance, mais quelles peuvent-être les variations moyennes de cette durée. Autrement dit, y-a-t-il des ampoules qui durent très peu et d'autres beaucoup, ou bien est-ce que toutes les ampoules ont à peu près la même durée de vie? On appelle aussi cela mesurer les caractères de dispersion d'une série statistique. Dans le premier cas considéré, la variance vaut par définition :
V(T)=[ (T1-E(T))2+(T2-E(T))2+...+(T1000-E(T))2 ]/1000.
L'écart-type est-elle la racine carrée de la variance.

  Commentons encore un peu ce que peut signifier l'écart-type. Dans une classe de 25 élèves, à un devoir, on observe les notes suivantes :
  • 5 notes à 8.
  • 5 notes à 9.
  • 5 notes à 10.
  • 5 notes à 11.
  • 5 notes à 12.
L'espérance (ou moyenne des notes!) est 10. La variance vaut 4/5+1/5+0/5+1/5+4/5=2. Elle est assez faible, les notes sont donc très centrées autour de la moyenne.

Dans une autre classe de 25 élèves, au même devoir, les élèves ont obtenu :
  • 5 notes à 0.
  • 5 notes à 5.
  • 5 notes à 10.
  • 5 notes à 15.
  • 5 notes à 20.
  L'espérance vaut toujours 10, mais pourtant il est clair que les deux classes sont très différentes! Calculons la variance : elle vaut V=100/5+25/5+0/5+25/5+100/5=50. La variance est beaucoup plus grande que dans le premier cas, ce qui signifie que les notes sont très espacées!

Définition Mathématique
Si X est une variable aléatoire prenant les valeurs x1,...,xn avec les probabilités p1,...,pn. L'espérance mathématique de X est le réel :
La variance de X vaut, si on a posé m=E(X) :
et l'écart-type est défini par :
Pour des variables aléatoires continues, les définitions sont les mêmes, en remplaçant les sommes discrètes par des intégrales...