$$\newcommand{\mtn}{\mathbb{N}}\newcommand{\mtns}{\mathbb{N}^*}\newcommand{\mtz}{\mathbb{Z}}\newcommand{\mtr}{\mathbb{R}}\newcommand{\mtk}{\mathbb{K}}\newcommand{\mtq}{\mathbb{Q}}\newcommand{\mtc}{\mathbb{C}}\newcommand{\mch}{\mathcal{H}}\newcommand{\mcp}{\mathcal{P}}\newcommand{\mcb}{\mathcal{B}}\newcommand{\mcl}{\mathcal{L}} \newcommand{\mcm}{\mathcal{M}}\newcommand{\mcc}{\mathcal{C}} \newcommand{\mcmn}{\mathcal{M}}\newcommand{\mcmnr}{\mathcal{M}_n(\mtr)} \newcommand{\mcmnk}{\mathcal{M}_n(\mtk)}\newcommand{\mcsn}{\mathcal{S}_n} \newcommand{\mcs}{\mathcal{S}}\newcommand{\mcd}{\mathcal{D}} \newcommand{\mcsns}{\mathcal{S}_n^{++}}\newcommand{\glnk}{GL_n(\mtk)} \newcommand{\mnr}{\mathcal{M}_n(\mtr)}\DeclareMathOperator{\ch}{ch} \DeclareMathOperator{\sh}{sh}\DeclareMathOperator{\th}{th} \DeclareMathOperator{\vect}{vect}\DeclareMathOperator{\card}{card} \DeclareMathOperator{\comat}{comat}\DeclareMathOperator{\imv}{Im} \DeclareMathOperator{\rang}{rg}\DeclareMathOperator{\Fr}{Fr} \DeclareMathOperator{\diam}{diam}\DeclareMathOperator{\supp}{supp} \newcommand{\veps}{\varepsilon}\newcommand{\mcu}{\mathcal{U}} \newcommand{\mcun}{\mcu_n}\newcommand{\dis}{\displaystyle} \newcommand{\croouv}{[\![}\newcommand{\crofer}{]\!]} \newcommand{\rab}{\mathcal{R}(a,b)}\newcommand{\pss}[2]{\langle #1,#2\rangle} $$
Bibm@th

Résumé de cours : Fonctions convexes

Partie convexe d'un espace vectoriel réel

$E$ désigne un espace vectoriel sur $\mathbb R$.

Soit $u_1,\dots,u_n$ des vecteurs de $E$, et $\lambda_1,\dots,\lambda_n$ des réels tels que $\sum_{i=1}^n \lambda_i\neq 0$. On appelle barycentre des vecteurs $u_1,\dots,u_n$ affectés des poids $\lambda_1,\dots,\lambda_n$ le vecteur $v$ défini par $$v=\frac{1}{\sum_{i=1}^n \lambda_i}\sum_{i=1}^n \lambda_i u_i.$$

Dans le plan ou l'espace muni d'un repère de centre $O$, on identifie le point $M$ et le vecteur $\overrightarrow{OM}$. On définit alors le barycentre $G$ des points $A_1,\dots,A_n$ affectés des poids $\lambda_1,\dots,\lambda_n$ par le fait que le vecteur $\overrightarrow{OG}$ est le barycentre des vecteurs $\overrightarrow{OA_1},\dots,\overrightarrow{OA_n}$ affectés des poids $\lambda_1,\dots,\lambda_n$. Ceci ne dépend pas du choix du repère initial.

Proposition (associativité du barycentre) : si $v$ est le barycentre de $(u_1,\lambda_1),\dots,(u_n,\lambda_n)$, et si $$\mu_1=\sum_{i=1}^p \lambda_i\neq 0\textrm{ et }\mu_2=\sum_{i=p+1}^n \lambda_i\neq 0,$$ alors $v$ est aussi le barycentre de $(v_1,\mu_1)$ et de $(v_2,\mu_2)$, où $v_1$ est le barycentre de $(u_1,\lambda_1),\dots,(u_p,\lambda_p)$ et $v_2$ est le barycentre de $(u_{p+1},\lambda_{p+1}),\dots,(u_n,\lambda_n)$.

Une partie $C$ de $E$ est dite convexe si, pour tous $u,v\in C$ et tout $t\in [0,1]$, alors $tu+(1-t)v\in C$.

Proposition : Une partie $C$ de $E$ est convexe si et seulement si elle contient tous les barycentres de ses vecteurs affectés de coefficients positifs.
Fonctions convexes d'une variable réelle

Dans toute la suite, $I$ est un intervalle de $\mathbb R$ et $f$ est une fonction de $I$ dans $\mathbb R$.

On rappelle qu'une partie $E$ du plan $\mathbb R^2$ est convexe si, pour tout $A,B\in E$, le segment $[AB]$ est contenu dans $E.$

On dit que $f$ est convexe si, pour tous $x,y\in I$ et tout $\lambda\in [0,1]$, on a $$f(\lambda x+(1-\lambda)y)\leq \lambda f(x)+(1-\lambda )f(y).$$ Autrement dit, $f$ est convexe lorsque son épigraphe $E(f)$ est convexe, où $$E(f)=\{(x,y)\in\mathbb R^2;\ x\in I, y\geq f(x)\}$$ (il s'agit donc de la partie située au dessus de la courbe de $f$). Ceci signifie aussi que la courbe représentative de $f$ est en-dessous de l'une quelconque de ses cordes entre les deux extrémités de la corde.

La fonction $f$ est dite concave lorsque $-f$ est convexe, c'est-à-dire lorsque pour tous $x,y\in I$ et tout $t\in [0,1]$, on a $$f(tx+(1-t)y)\geq tf(x)+(1-t)f(y).$$ Dans la suite, nous ne formulerons les résultats que pour les fonctions convexes. Les énoncés pour les fonctions concaves s'en déduisent en remplaçant $\leq$ par $\geq$, croissant par décroissant, dessus par dessous.

La définition d'une fonction convexe dit que si l'on prend deux points $(x_0,f(x_0))$ et $(x_1,f(x_1))$ sur la courbe représentative de $f$, alors le segment joignant ces deux points est situé au-dessus de la courbe représentative de $f$. On peut préciser le comportement en comparant la position de la courbe représentative d'une fonction convexe et de ses sécantes.

Théorème (position du graphe d'une fonction convexe par rapport à ses sécantes) : Soit $f:I\to\mathbb R$ une fonction convexe, et $x_0<x_1$ dans $I$. Alors la courbe représentative de $f$ est située sous la sécante joignant $(x_0,f(x_0))$ et $(x_1,f(x_1))$ sur $[x_0,x_1]$, et au-dessus à l'extérieur de $[x_0,x_1]$.

Une autre façon de caractériser la convexité est d'utiliser la croissance des pentes des cordes.

Théorème (inégalité des pentes) : Soit $f:I\to\mathbb R$. Les assertions suivantes sont équivalentes :
  • $f$ est convexe sur $I$.
  • Pour tout $a\in I$, la fonction $\displaystyle x\mapsto \frac{f(x)-f(a)}{x-a}$ est croissante sur $I\backslash\{a\}$.
  • Pour tous $a,b,c\in I$ avec $a<b<c$, on a $$\frac{f(b)-f(a)}{b-a}\leq \frac{f(c)-f(a)}{c-a}\leq \frac{f(c)-f(b)}{c-b}.$$

La définition d'une fonction convexe compare l'image d'un barycentre de deux points et le barycentre des images de ces deux points. Par récurrence, on peut passer à $n$ points.

Théorème (inégalité de Jensen) : $f$ est convexe si et seulement si, pour tout $n\geq 2$, pour tous $x_1,\dots,x_n\in I$, pour tous réels $\lambda_1,\dots,\lambda_n$ de $[0,1]$ tels que $\sum_{i=1}^n\lambda_i=1$, alors $$f\left(\sum_{i=1}^n \lambda_i x_i\right)\leq \sum_{i=1}^n \lambda_i f(x_i).$$
Fonctions convexes dérivables, deux fois dérivables
  $I$ est un intervalle de $\mathbb R$ et $f$ est une fonction de $I$ dans $\mathbb R$.
Théorème : On suppose que $f$ est dérivable. Alors $f$ est convexe si et seulement si $f'$ est croissante.
Corollaire : On suppose que $f$ est deux fois dérivable. Alors $f$ est convexe si et seulement si $f''\geq 0$.
Corollaire : On suppose que $f$ est convexe et dérivable. Alors la courbe représentative de $f$ est située au-dessus de ses tangentes, c'est-à-dire que pour tous $x,a\in I$, on a $f(x)\geq f'(a)(x-a)+f(a)$;

De même, la courbe représentative d'une fonction concave est située en-dessous de ses tangentes.

A l'aide de cette propriété, on démontre de nombreuses inégalités comme $$\forall x\in\left[0,\frac\pi2\right],\ \frac{2}{\pi}x\leq\sin(x)\leq x$$ $$\forall x\in\mathbb R,\ \exp(x)\geq 1+x$$ $$\forall x>-1,\ \ln(1+x)\leq x.$$