La Cryptogr@phie expliquée!

Accueil Plan BibM@th Forum

Calcul de l'entropie d'un texte


  Comment estimer l'entropie d'un texte M écrit en français et constitué de d lettres M1,...,Md? Si les lettres pouvaient être considérées comme indépendantes les unes des autres, on aurait H(M1...Md)=dH(M1). Mais ce n'est pas le cas! Après un L, il est beaucoup plus probable que l'on ait un A ou un E qu'un R. En revanche, au-delà de 3 ou 4 lettres d'écart, il y a beaucoup moins d'interactions : si on a un L en 1ère position, il n'est pas très clair que l'on aura en 5è position plutôt un A ou plutôt un R. Cela signifie que la suite

va très rapidement s'approcher d'une valeur limite H. Pour d suffisamment grand (en pratique, d>20 suffit), on pourra faire l'approximation :
L'applet au bas de cette page permet d'estimer H. Le calcul effectué sur un texte français de grande taille a donné comme estimation pour H : Remarquons que la valeur de H dépend fortement de la langue employée. Un calcul du même type sur un texte anglais (ou allemand) a donné une valeur de H sensiblement plus grande (de l'ordre de 4.2).

  Pour calculer l'entropie d'un message chiffré à l'aide d'une permutation, le principe est le même. On prend un texte très long, on calcule de nombreux chiffrés à partir de lui en utilisant une permutation aléatoire, on met bout à bout ces chiffrés, et on calcule l'entropie...

L'applet java.

Et encore, dans la cryptographie expliquée...



Pour signaler une erreur, proposer une amélioration, contacter les auteurs, écrivez à

La BibM@th 2000-2005 - Frédéric Bayart