$$\newcommand{\mtn}{\mathbb{N}}\newcommand{\mtns}{\mathbb{N}^*}\newcommand{\mtz}{\mathbb{Z}}\newcommand{\mtr}{\mathbb{R}}\newcommand{\mtk}{\mathbb{K}}\newcommand{\mtq}{\mathbb{Q}}\newcommand{\mtc}{\mathbb{C}}\newcommand{\mch}{\mathcal{H}}\newcommand{\mcp}{\mathcal{P}}\newcommand{\mcb}{\mathcal{B}}\newcommand{\mcl}{\mathcal{L}} \newcommand{\mcm}{\mathcal{M}}\newcommand{\mcc}{\mathcal{C}} \newcommand{\mcmn}{\mathcal{M}}\newcommand{\mcmnr}{\mathcal{M}_n(\mtr)} \newcommand{\mcmnk}{\mathcal{M}_n(\mtk)}\newcommand{\mcsn}{\mathcal{S}_n} \newcommand{\mcs}{\mathcal{S}}\newcommand{\mcd}{\mathcal{D}} \newcommand{\mcsns}{\mathcal{S}_n^{++}}\newcommand{\glnk}{GL_n(\mtk)} \newcommand{\mnr}{\mathcal{M}_n(\mtr)}\DeclareMathOperator{\ch}{ch} \DeclareMathOperator{\sh}{sh}\DeclareMathOperator{\th}{th} \DeclareMathOperator{\vect}{vect}\DeclareMathOperator{\card}{card} \DeclareMathOperator{\comat}{comat}\DeclareMathOperator{\imv}{Im} \DeclareMathOperator{\rang}{rg}\DeclareMathOperator{\Fr}{Fr} \DeclareMathOperator{\diam}{diam}\DeclareMathOperator{\supp}{supp} \newcommand{\veps}{\varepsilon}\newcommand{\mcu}{\mathcal{U}} \newcommand{\mcun}{\mcu_n}\newcommand{\dis}{\displaystyle} \newcommand{\croouv}{[\![}\newcommand{\crofer}{]\!]} \newcommand{\rab}{\mathcal{R}(a,b)}\newcommand{\pss}[2]{\langle #1,#2\rangle} $$
Bibm@th

Résumé de cours : Fonctions convexes

Partie convexe d'un espace vectoriel réel
  $E$ désigne un espace vectoriel sur $\mathbb R$.
  • Soit $u_1,\dots,u_n$ des vecteurs de $E$, et $\lambda_1,\dots,\lambda_n$ des réels tels que $\sum_{i=1}^n \lambda_i\neq 0$. On appelle barycentre des vecteurs $u_1,\dots,u_n$ affectés des poids $\lambda_1,\dots,\lambda_n$ le vecteur $v$ défini par $$v=\frac{1}{\sum_{i=1}^n \lambda_i}\sum_{i=1}^n \lambda_i u_i.$$
  • Dans le plan ou l'espace muni d'un repère de centre $O$, on identifie le point $M$ et le vecteur $\overrightarrow{OM}$. On définit alors le barycentre $G$ des points $A_1,\dots,A_n$ affectés des poids $\lambda_1,\dots,\lambda_n$ par le fait que le vecteur $\overrightarrow{OG}$ est le barycentre des vecteurs $\overrightarrow{OA_1},\dots,\overrightarrow{OA_n}$ affectés des poids $\lambda_1,\dots,\lambda_n$. Ceci ne dépend pas du choix du repère initial.
  • Proposition (associativité du barycentre) : si $v$ est le barycentre de $(u_1,\lambda_1),\dots,(u_n,\lambda_n)$, et si $$\mu_1=\sum_{i=1}^p \lambda_i\neq 0\textrm{ et }\mu_2=\sum_{i=p+1}^n \lambda_i\neq 0,$$ alors $v$ est aussi le barycentre de $(v_1,\mu_1)$ et de $(v_2,\mu_2)$, où $v_1$ est le barycentre de $(u_1,\lambda_1),\dots,(u_p,\lambda_p)$ et $v_2$ est le barycentre de $(u_{p+1},\lambda_{p+1}),\dots,(u_n,\lambda_n)$.
  • Une partie $C$ de $E$ est dite convexe si, pour tous $u,v\in E$ et tout $t\in [0,1]$, alors $tu+(1-t)v\in C$.
  • Proposition : Une partie $C$ de $E$ est convexe si et seulement si elle contient tous les barycentres de ses vecteurs affectés de coefficients positifs.
Fonctions convexes d'une variable réelle
  $I$ est un intervalle de $\mathbb R$ et $f$ est une fonction de $I$ dans $\mathbb R$.
  • On dit que $f$ est convexe si, pour tous $x,y\in I$ et tout $t\in [0,1]$, on a $$f(tx+(1-t)y)\leq tf(x)+(1-t)f(y).$$ Autrement dit, $f$ est convexe lorsque son épigraphe $E(f)$ est convexe, où $$E(f)=\{(x,y);\ y\geq f(x)\}$$ (il s'agit donc de la partie située au dessus de la courbe de $f$). Ceci signifie aussi que la courbe représentative de $f$ est en-dessous de ses cordes entre les deux extrémités de la corde.
  • Proposition : $f$ est convexe si et seulement si, pour tout $n\geq 2$, pour tous $x_1,\dots,x_n\in I$, pour tous réels $\lambda_1,\dots,\lambda_n$ de $[0,1]$ tels que $\sum_{i=1}^n\lambda_i=1$, alors $$f\left(\sum_{i=1}^n \lambda_i x_i\right)\leq \sum_{i=1}^n \lambda_i f(x_i).$$
  • Théorème (inégalité des pentes) : $f$ est convexe si et seulement si, pour tous $a,b,c\in I$ avec $a<b<c$, on a $$\frac{f(b)-f(a)}{b-a}\leq \frac{f(c)-f(a)}{c-a}\leq \frac{f(c)-f(b)}{c-b}.$$
  • Une fonction est dite concave lorsque $-f$ est convexe, c'est-à-dire lorsque pour tous $x,y\in I$ et tout $t\in [0,1]$, on a $$f(tx+(1-t)y)\geq tf(x)+(1-t)f(y).$$ Pour une fonction concave, l'inégalité des pentes est inversée.
Fonctions convexes dérivables, deux fois dérivables
  $I$ est un intervalle de $\mathbb R$ et $f$ est une fonction de $I$ dans $\mathbb R$.
  • Théorème : On suppose que $f$ est dérivable. Alors $f$ est convexe si et seulement si $f'$ est croissante.
  • Corollaire : On suppose que $f$ est deux fois dérivable. Alors $f$ est convexe si et seulement si $f''\geq 0$. $f$ est concave si et seulement si $f''\leq 0$.
  • En particulier, la courbe représentative d'une fonction convexe est située au-dessus de ses tangentes, c'est-à-dire que pour tout $x,a\in\mathbb R$, on a $f(x)\geq f'(a)(x-a)+f(a)$; de même, la courbe représentative d'une fonction concave est située en-dessous de ses tangentes.
  • A l'aide de cette propriété, on démontre de nombreuses inégalités comme $$\forall x>-1,\ \ln(1+x)\leq x.$$