Résumé de cours : Fonctions convexes
$E$ désigne un espace vectoriel sur $\mathbb R$.
Soit $u_1,\dots,u_n$ des vecteurs de $E$, et $\lambda_1,\dots,\lambda_n$ des réels tels que $\sum_{i=1}^n \lambda_i\neq 0$. On appelle barycentre des vecteurs $u_1,\dots,u_n$ affectés des poids $\lambda_1,\dots,\lambda_n$ le vecteur $v$ défini par $$v=\frac{1}{\sum_{i=1}^n \lambda_i}\sum_{i=1}^n \lambda_i u_i.$$
Dans le plan ou l'espace muni d'un repère de centre $O$, on identifie le point $M$ et le vecteur $\overrightarrow{OM}$. On définit alors le barycentre $G$ des points $A_1,\dots,A_n$ affectés des poids $\lambda_1,\dots,\lambda_n$ par le fait que le vecteur $\overrightarrow{OG}$ est le barycentre des vecteurs $\overrightarrow{OA_1},\dots,\overrightarrow{OA_n}$ affectés des poids $\lambda_1,\dots,\lambda_n$. Ceci ne dépend pas du choix du repère initial.
Une partie $C$ de $E$ est dite convexe si, pour tous $u,v\in C$ et tout $t\in [0,1]$, alors $tu+(1-t)v\in C$.
Dans toute la suite, $I$ est un intervalle de $\mathbb R$ et $f$ est une fonction de $I$ dans $\mathbb R$.
On rappelle qu'une partie $E$ du plan $\mathbb R^2$ est convexe si, pour tout $A,B\in E$, le segment $[AB]$ est contenu dans $E.$
On dit que $f$ est convexe si, pour tous $x,y\in I$ et tout $\lambda\in [0,1]$, on a $$f(\lambda x+(1-\lambda)y)\leq \lambda f(x)+(1-\lambda )f(y).$$ Autrement dit, $f$ est convexe lorsque son épigraphe $E(f)$ est convexe, où $$E(f)=\{(x,y)\in\mathbb R^2;\ x\in I, y\geq f(x)\}$$ (il s'agit donc de la partie située au dessus de la courbe de $f$). Ceci signifie aussi que la courbe représentative de $f$ est en-dessous de l'une quelconque de ses cordes entre les deux extrémités de la corde.
La fonction $f$ est dite concave lorsque $-f$ est convexe, c'est-à-dire lorsque pour tous $x,y\in I$ et tout $t\in [0,1]$, on a $$f(tx+(1-t)y)\geq tf(x)+(1-t)f(y).$$ Dans la suite, nous ne formulerons les résultats que pour les fonctions convexes. Les énoncés pour les fonctions concaves s'en déduisent en remplaçant $\leq$ par $\geq$, croissant par décroissant, dessus par dessous.
La définition d'une fonction convexe dit que si l'on prend deux points $(x_0,f(x_0))$ et $(x_1,f(x_1))$ sur la courbe représentative de $f$, alors le segment joignant ces deux points est situé au-dessus de la courbe représentative de $f$. On peut préciser le comportement en comparant la position de la courbe représentative d'une fonction convexe et de ses sécantes.
Une autre façon de caractériser la convexité est d'utiliser la croissance des pentes des cordes.
- $f$ est convexe sur $I$.
- Pour tout $a\in I$, la fonction $\displaystyle x\mapsto \frac{f(x)-f(a)}{x-a}$ est croissante sur $I\backslash\{a\}$.
- Pour tous $a,b,c\in I$ avec $a<b<c$, on a $$\frac{f(b)-f(a)}{b-a}\leq \frac{f(c)-f(a)}{c-a}\leq \frac{f(c)-f(b)}{c-b}.$$
La définition d'une fonction convexe compare l'image d'un barycentre de deux points et le barycentre des images de ces deux points. Par récurrence, on peut passer à $n$ points.
De même, la courbe représentative d'une fonction concave est située en-dessous de ses tangentes.
A l'aide de cette propriété, on démontre de nombreuses inégalités comme $$\forall x\in\left[0,\frac\pi2\right],\ \frac{2}{\pi}x\leq\sin(x)\leq x$$ $$\forall x\in\mathbb R,\ \exp(x)\geq 1+x$$ $$\forall x>-1,\ \ln(1+x)\leq x.$$