$$\newcommand{\mtn}{\mathbb{N}}\newcommand{\mtns}{\mathbb{N}^*}\newcommand{\mtz}{\mathbb{Z}}\newcommand{\mtr}{\mathbb{R}}\newcommand{\mtk}{\mathbb{K}}\newcommand{\mtq}{\mathbb{Q}}\newcommand{\mtc}{\mathbb{C}}\newcommand{\mch}{\mathcal{H}}\newcommand{\mcp}{\mathcal{P}}\newcommand{\mcb}{\mathcal{B}}\newcommand{\mcl}{\mathcal{L}} \newcommand{\mcm}{\mathcal{M}}\newcommand{\mcc}{\mathcal{C}} \newcommand{\mcmn}{\mathcal{M}}\newcommand{\mcmnr}{\mathcal{M}_n(\mtr)} \newcommand{\mcmnk}{\mathcal{M}_n(\mtk)}\newcommand{\mcsn}{\mathcal{S}_n} \newcommand{\mcs}{\mathcal{S}}\newcommand{\mcd}{\mathcal{D}} \newcommand{\mcsns}{\mathcal{S}_n^{++}}\newcommand{\glnk}{GL_n(\mtk)} \newcommand{\mnr}{\mathcal{M}_n(\mtr)}\DeclareMathOperator{\ch}{ch} \DeclareMathOperator{\sh}{sh}\DeclareMathOperator{\th}{th} \DeclareMathOperator{\vect}{vect}\DeclareMathOperator{\card}{card} \DeclareMathOperator{\comat}{comat}\DeclareMathOperator{\imv}{Im} \DeclareMathOperator{\rang}{rg}\DeclareMathOperator{\Fr}{Fr} \DeclareMathOperator{\diam}{diam}\DeclareMathOperator{\supp}{supp} \newcommand{\veps}{\varepsilon}\newcommand{\mcu}{\mathcal{U}} \newcommand{\mcun}{\mcu_n}\newcommand{\dis}{\displaystyle} \newcommand{\croouv}{[\![}\newcommand{\crofer}{]\!]} \newcommand{\rab}{\mathcal{R}(a,b)}\newcommand{\pss}[2]{\langle #1,#2\rangle} $$
Bibm@th

Résumé de cours : Fonctions convexes

Fonctions convexes d'une variable réelle

Dans toute la suite, $I$ est un intervalle de $\mathbb R$ et $f$ est une fonction de $I$ dans $\mathbb R$.

On rappelle qu'une partie $E$ du plan $\mathbb R^2$ est convexe si, pour tout $A,B\in E$, le segment $[AB]$ est contenu dans $E.$

On dit que $f$ est convexe si, pour tous $x,y\in I$ et tout $\lambda\in [0,1]$, on a $$f(\lambda x+(1-\lambda)y)\leq \lambda f(x)+(1-\lambda )f(y).$$ Autrement dit, $f$ est convexe lorsque son épigraphe $E(f)$ est convexe, où $$E(f)=\{(x,y)\in\mathbb R^2;\ x\in I, y\geq f(x)\}$$ (il s'agit donc de la partie située au dessus de la courbe de $f$). Ceci signifie aussi que la courbe représentative de $f$ est en-dessous de l'une quelconque de ses cordes entre les deux extrémités de la corde.

La fonction $f$ est dite concave lorsque $-f$ est convexe, c'est-à-dire lorsque pour tous $x,y\in I$ et tout $t\in [0,1]$, on a $$f(tx+(1-t)y)\geq tf(x)+(1-t)f(y).$$ Dans la suite, nous ne formulerons les résultats que pour les fonctions convexes. Les énoncés pour les fonctions concaves s'en déduisent en remplaçant $\leq$ par $\geq$, croissant par décroissant, dessus par dessous.

La définition d'une fonction convexe dit que si l'on prend deux points $(x_0,f(x_0))$ et $(x_1,f(x_1))$ sur la courbe représentative de $f$, alors le segment joignant ces deux points est situé au-dessus de la courbe représentative de $f$. On peut préciser le comportement en comparant la position de la courbe représentative d'une fonction convexe et de ses sécantes.

Théorème (position du graphe d'une fonction convexe par rapport à ses sécantes) : Soit $f:I\to\mathbb R$ une fonction convexe, et $x_0<x_1$ dans $I$. Alors la courbe représentative de $f$ est située sous la sécante joignant $(x_0,f(x_0))$ et $(x_1,f(x_1))$ sur $[x_0,x_1]$, et au-dessus à l'extérieur de $[x_0,x_1]$.

Une autre façon de caractériser la convexité est d'utiliser la croissance des pentes des cordes.

Théorème (inégalité des pentes) : Soit $f:I\to\mathbb R$. Les assertions suivantes sont équivalentes :
  • $f$ est convexe sur $I$.
  • Pour tout $a\in I$, la fonction $\displaystyle x\mapsto \frac{f(x)-f(a)}{x-a}$ est croissante sur $I\backslash\{a\}$.
  • Pour tous $a,b,c\in I$ avec $a<b<c$, on a $$\frac{f(b)-f(a)}{b-a}\leq \frac{f(c)-f(a)}{c-a}\leq \frac{f(c)-f(b)}{c-b}.$$

La définition d'une fonction convexe compare l'image d'un barycentre de deux points et le barycentre des images de ces deux points. Par récurrence, on peut passer à $n$ points.

Théorème (inégalité de Jensen) : $f$ est convexe si et seulement si, pour tout $n\geq 2$, pour tous $x_1,\dots,x_n\in I$, pour tous réels $\lambda_1,\dots,\lambda_n$ de $[0,1]$ tels que $\sum_{i=1}^n\lambda_i=1$, alors $$f\left(\sum_{i=1}^n \lambda_i x_i\right)\leq \sum_{i=1}^n \lambda_i f(x_i).$$
Fonctions convexes dérivables, deux fois dérivables
  $I$ est un intervalle de $\mathbb R$ et $f$ est une fonction de $I$ dans $\mathbb R$.
Théorème : On suppose que $f$ est dérivable. Alors $f$ est convexe si et seulement si $f'$ est croissante.
Corollaire : On suppose que $f$ est deux fois dérivable. Alors $f$ est convexe si et seulement si $f''\geq 0$.
Corollaire : On suppose que $f$ est convexe et dérivable. Alors la courbe représentative de $f$ est située au-dessus de ses tangentes, c'est-à-dire que pour tous $x,a\in I$, on a $f(x)\geq f'(a)(x-a)+f(a)$;

De même, la courbe représentative d'une fonction concave est située en-dessous de ses tangentes.

A l'aide de cette propriété, on démontre de nombreuses inégalités comme $$\forall x\in\left[0,\frac\pi2\right],\ \frac{2}{\pi}x\leq\sin(x)\leq x$$ $$\forall x\in\mathbb R,\ \exp(x)\geq 1+x$$ $$\forall x>-1,\ \ln(1+x)\leq x.$$

Points d'inflexion

Une fonction n'est pas toujours convexe ou concave sur son ensemble de définition. Un point où la "convexité de la fonction" change s'appelle un point d'inflexion.

Soit $a$ un point intérieur à $I$. On dit que $a$ est un point d'inflexion de $f$ s'il existe $\veps>0$ tel que $f$ est convexe sur $]a-\veps,a[$ et concave sur $]a,a+\veps[$, ou inversement.

Lorsque $f$ est suffisamment régulière, on peut caractériser les points d'inflexion en termes de dérivées.

Théorème : Soit $a$ un point intérieur de $I$.
  • On suppose que $f$ est dérivable sur $I$. Alors $a$ est un point d'inflexion de $f$ si et seulement si la courbe représentative de $f$ traverse sa tangente en $(a,f(a))$.
  • On suppose que $f$ est deux fois dérivable sur $I$. Alors $a$ est un point d'inflexion de $f$ si et seulement si $f''$ s'annule en changeant de signe en $a$.