$$\newcommand{\mtn}{\mathbb{N}}\newcommand{\mtns}{\mathbb{N}^*}\newcommand{\mtz}{\mathbb{Z}}\newcommand{\mtr}{\mathbb{R}}\newcommand{\mtk}{\mathbb{K}}\newcommand{\mtq}{\mathbb{Q}}\newcommand{\mtc}{\mathbb{C}}\newcommand{\mch}{\mathcal{H}}\newcommand{\mcp}{\mathcal{P}}\newcommand{\mcb}{\mathcal{B}}\newcommand{\mcl}{\mathcal{L}} \newcommand{\mcm}{\mathcal{M}}\newcommand{\mcc}{\mathcal{C}} \newcommand{\mcmn}{\mathcal{M}}\newcommand{\mcmnr}{\mathcal{M}_n(\mtr)} \newcommand{\mcmnk}{\mathcal{M}_n(\mtk)}\newcommand{\mcsn}{\mathcal{S}_n} \newcommand{\mcs}{\mathcal{S}}\newcommand{\mcd}{\mathcal{D}} \newcommand{\mcsns}{\mathcal{S}_n^{++}}\newcommand{\glnk}{GL_n(\mtk)} \newcommand{\mnr}{\mathcal{M}_n(\mtr)}\DeclareMathOperator{\ch}{ch} \DeclareMathOperator{\sh}{sh}\DeclareMathOperator{\th}{th} \DeclareMathOperator{\vect}{vect}\DeclareMathOperator{\card}{card} \DeclareMathOperator{\comat}{comat}\DeclareMathOperator{\imv}{Im} \DeclareMathOperator{\rang}{rg}\DeclareMathOperator{\Fr}{Fr} \DeclareMathOperator{\diam}{diam}\DeclareMathOperator{\supp}{supp} \newcommand{\veps}{\varepsilon}\newcommand{\mcu}{\mathcal{U}} \newcommand{\mcun}{\mcu_n}\newcommand{\dis}{\displaystyle} \newcommand{\croouv}{[\![}\newcommand{\crofer}{]\!]} \newcommand{\rab}{\mathcal{R}(a,b)}\newcommand{\pss}[2]{\langle #1,#2\rangle} $$
Bibm@th

Le paradoxe de l'amitié

Avez-vous le sentiment que vos amis ont plus d'amis que vous? Si la réponse est oui, pas d'inquiétude : c'est normal! En moyenne, les amis d'une personne choisie au hasard dans la population ont plus d'amis que la personne elle-même! Ce paradoxe a été mis en évidence par le sociologue Scott Feld en 1991. Et ceci est valable quelle que soit la structure de la population. C'est vrai en particulier pour les relations qu'on entretient sur les réseaux sociaux. Étonnant, non? Mathématique!

Prenons l'exemple suivant. On étudie un groupe de 4 personnes, Ahmed, Barbara, Cécile et Didier. Certains sont amis (on considère que la relation d'amitié est toujours réciproque) et d'autres non. On a représenté les liens d'amitié sur le dessin suivant (un graphe) où on a tracé un segment (en théorie des graphes, on appelle cela une arête) entre deux personnes lorsqu'elles sont amies :

Il est facile ici de calculer le nombre d'amis de chacun : Ahmed a 2 amis, Barbara 2 également, Didier 3 et Cécile 1. Ceci nous donne un nombre moyen d'amis égal à $$\frac{2+2+1+3}{4}=2.$$ Comptons maintenant le nombre moyen des amis de chacun. Commençons par Ahmed. Ses amis sont Barbara qui a $2$ amis et Didier qui a $3$ amis. Le nombre moyen d'amis des amis d'Ahmed est donc $2,\!5$. On peut faire le même calcul avec les autres personnes, et on trouve que

  • les amis de Barbara ont en moyenne $2,\!5$ amis.
  • les amis de Didier ont en moyenne $(2+2+1)/3=5/3$ amis.
  • les amis de Cécile ont en moyenne $3$ amis.

Le nombre moyen des amis d'amis est donc : $$\frac{2,\!5+2,\!5+\frac{5}3+3}4\simeq 2,\!41.$$ On voit bien sur cet exemple apparaître le phénomène décrit plus haut : le nombre moyen d'amis de nos amis est supérieur au nombre moyen d'amis!

Si on veut comprendre ce phénomène, il est bien de formaliser un peu le calcul ci-dessus. Notons $n(A)$ le nombre d'amis d'Ahmed, $n(B)$ le nombre d'amis de Barbara, etc... Le nombre moyen d'amis, dans ce réseau social, vaut donc : $$\frac 14 n(A)+\frac 14 n(B)+\frac 14 n(C)+\frac 14 n(D).$$ Le nombre moyen d'amis des amis d'Ahmed vaut : $$\frac{n(B)+n(D)}2.$$ En effectuant le même calcul avec les autres personnes du réseau, on trouve que le nombre moyen d'amis des amis vaut : \begin{eqnarray*} \frac 14\left(\frac{n(B)+n(D)}2+\frac{n(A)+n(D)}{2}+n(D)+\frac{n(A)+n(B)+n(C)}3\right) \\ =\frac{5}{24}n(A)+\frac {5}{24}n(B)+\frac2{24}n(C)+\frac{12}{24}n(D) \end{eqnarray*} On retrouve une moyenne pondérée de $n(A),$ $n(B),$ $n(C)$ et $n(D),$ mais avec des coefficients qui ne sont pas identiques : le coefficient devant $n(D)$ est le plus important, car Didier est central dans le réseau. Son nombre d'amis intervient beaucoup plus souvent quand on compte le nombre d'amis des amis.

Cette propriété fonctionne dans tous les cas. En général, on modélise les relations dans un réseau social par un graphe, constitué de noeuds (les personnes du réseau) et d'arêtes (les relations entre ces personnes).

Notons $V$ l'ensemble des noeuds et $E$ l'ensemble des arêtes. On a donc $\{u;v\}\in E$ lorsque $u$ et $v$ sont amis. On pose $N$ le nombre de noeuds (nombre de personnes) et $K$ le nombre d'arêtes (nombre de relations d'amitié). Pour un individu $u,$ notons $n(u)$ son nombre d'amis (dans le langage des graphes, $n(u)$ désigne le degré du sommet $u$). On a alors $$\sum_{u\in V}n(u)=2K.$$ Ceci est une propriété générale des graphes. Ici, on peut l'interpréter en disant que quand on fait la somme de tous les amis des personnes du réseau, on compte deux fois chaque relation d'amitié : une fois pour chaque personne concernée par cette relation.

Avec ces notations, le nombre moyen d'amis vaut $$\displaystyle \textrm{moy amis}=\frac 1N\sum_{u\in V}n(u)=\frac{2K}N.$$ Soit maintenant $u$ un individu. Le nombre moyen d'amis des amis de $u$ vaut : $$\frac{1}{n(u)}\sum_{\{u;v\}\in E}n(v).$$ \begin{eqnarray*} \textrm{moy amis-amis}&=&\frac 1N\sum_{u\in V}\frac 1{n(u)}\sum_{\{u;v\}\in E}n(v)\\ &=&\frac 1N\sum_{u\in V}\sum_{\{u;v\}\in E}\frac {n(v)}{n(u)}. \end{eqnarray*} Dans cette dernière somme, une arête $\{x;y\}\in E$ contribue deux fois : quand $u=x$ et quand $u=y$. Sa contribution totale est donc $\displaystyle \frac{n(x)}{n(y)}+\frac{n(y)}{n(x)}.$ On en déduit $$\textrm{moy amis-amis}=\frac 1N\sum_{\{x;y\}\in E}\left(\frac{n(x)}{n(y)}+\frac{n(y)}{n(x)}\right).$$ Mais, pour tous réels $a,b\geq 1,$ on a $\frac ab+\frac ba\geq 2.$ D'où $$\textrm{moy amis-amis}\geq \frac 1N\sum_{\{x;y\}\in E}2=\frac{2K}N=\textrm{moy amis}.$$

Recherche alphabétique
Recherche thématique