Jensensche Ungleichung

Die jensensche Ungleichung ist eine elementare Ungleichung für konvexe und konkave Funktionen. Sie ist wegen ihrer Allgemeinheit Grundlage vieler bedeutender Ungleichungen, vor allem in der Analysis und Informationstheorie. Die Ungleichung ist nach dem dänischen Mathematiker Johan Ludwig Jensen benannt, der sie am 17. Januar 1905 bei einer Konferenz der Dänischen Mathematischen Gesellschaft präsentierte.[1] Unter etwas anderen Voraussetzungen findet sie sich bereits 1889 bei Otto Hölder.[2]

Die jensensche Ungleichung besagt, dass der Funktionswert einer konvexen Funktion an einer endlichen Konvexkombination von Stützstellen stets kleiner oder gleich einer endlichen Konvexkombination von den Funktionswerten der Stützstellen ist. Dies bedeutet insbesondere, dass das gewichtete arithmetische Mittel der Funktionswerte an n Stellen größer oder gleich dem Funktionswert am Mittel dieser n Stellen ist. Für lineare Funktionen gilt stets Gleichheit.

Satz

Für eine konvexe Funktion f {\displaystyle f\;} und für nichtnegative λ i {\displaystyle \lambda _{i}\;} mit i = 1 n λ i = 1 {\displaystyle \sum _{i=1}^{n}\lambda _{i}=1} gilt:

f ( i = 1 n λ i x i ) i = 1 n λ i f ( x i ) . {\displaystyle f\left(\sum _{i=1}^{n}\lambda _{i}x_{i}\right)\leq \sum _{i=1}^{n}\lambda _{i}f\left(x_{i}\right).}

Beweis per Induktion

Verwendet man die heute übliche Definition von konvex, dass

f ( λ x + ( 1 λ ) y ) λ f ( x ) + ( 1 λ ) f ( y ) {\displaystyle f(\lambda x+(1-\lambda )y)\leq \lambda f(x)+(1-\lambda )f(y)}

für alle reellen λ {\displaystyle \lambda } zwischen 0 und 1 gelte, so ergibt sich die jensensche Ungleichung durch vollständige Induktion über die Anzahl der Stützstellen.

Beweis von Hölder

Hölder verwendete den Begriff konvex noch nicht und zeigte, dass aus f 0 {\displaystyle f''\geq 0} bzw. f {\displaystyle f'\;} monoton steigend die Ungleichung

f ( i = 1 n a i x i i = 1 n a i ) i = 1 n a i f ( x i ) i = 1 n a i {\displaystyle f\left({\frac {\sum _{i=1}^{n}a_{i}x_{i}}{\sum _{i=1}^{n}a_{i}}}\right)\leq {\frac {\sum _{i=1}^{n}a_{i}f\left(x_{i}\right)}{\sum _{i=1}^{n}a_{i}}}}

für positive a i {\displaystyle a_{i}\;} folgt, wobei er dies im Wesentlichen mit dem Mittelwertsatz der Differentialrechnung bewies.[2]

Beweis von Jensen

Jensen ging von der schwächeren Definition

f ( x + y 2 ) f ( x ) + f ( y ) 2 {\displaystyle f\left({\frac {x+y}{2}}\right)\leq {\frac {f(x)+f(y)}{2}}}

aus und zeigte unter ausdrücklichem Verweis auf den cauchyschen Beweis der Ungleichung vom arithmetischen und geometrischen Mittel mit Vorwärts-Rückwärts-Induktion, dass daraus die Beziehung

f ( i = 1 n x i n ) i = 1 n f ( x i ) n {\displaystyle f\left({\frac {\sum _{i=1}^{n}x_{i}}{n}}\right)\leq {\frac {\sum _{i=1}^{n}f\left(x_{i}\right)}{n}}}

für beliebige natürliche Zahlen n {\displaystyle n\;} folgt. Daraus folgerte er dann weiter, dass

f ( i = 1 n k i x i i = 1 n k i ) i = 1 n k i f ( x i ) i = 1 n k i {\displaystyle f\left({\frac {\sum _{i=1}^{n}k_{i}x_{i}}{\sum _{i=1}^{n}k_{i}}}\right)\leq {\frac {\sum _{i=1}^{n}k_{i}f\left(x_{i}\right)}{\sum _{i=1}^{n}k_{i}}}}

für natürliche Zahlen k i {\displaystyle k_{i}\;} und somit

f ( i = 1 n λ i x i ) i = 1 n λ i f ( x i ) {\displaystyle f\left(\sum _{i=1}^{n}\lambda _{i}x_{i}\right)\leq \sum _{i=1}^{n}\lambda _{i}f\left(x_{i}\right)}

für beliebige rationale und, sofern f {\displaystyle f\;} stetig ist, auch reelle Zahlen λ i {\displaystyle \lambda _{i}\;} zwischen 0 und 1 mit i = 1 n λ i = 1 {\displaystyle \sum _{i=1}^{n}\lambda _{i}=1} gilt.[1]

Varianten

  • Da für konkave Funktionen f {\displaystyle f\;} die Funktion f {\displaystyle -f\;} konvex ist, gilt für konkave Funktionen die jensensche Ungleichung in umgekehrter Richtung, d. h., für jede konkave Funktion f {\displaystyle f\;} und für positive λ i {\displaystyle \lambda _{i}\;} mit i = 1 n λ i = 1 {\displaystyle \sum _{i=1}^{n}\lambda _{i}=1} gilt:
f ( i = 1 n λ i x i ) i = 1 n λ i f ( x i ) . {\displaystyle f\left(\sum _{i=1}^{n}\lambda _{i}x_{i}\right)\geq \sum _{i=1}^{n}\lambda _{i}f(x_{i}).}
  • Die stetige Variante der jensenschen Ungleichung für eine im Bild von y : [ a , b ] R {\displaystyle y\colon [a,b]\to \mathbb {R} } konvexe Funktion f {\displaystyle f\;} lautet
f ( 1 b a a b y ( x )   d x ) 1 b a a b f ( y ( x ) )   d x . {\displaystyle f\left({\frac {1}{b-a}}\int _{a}^{b}y(x)\ \mathrm {d} x\right)\leq {\frac {1}{b-a}}\int _{a}^{b}f\left(y(x)\right)\ \mathrm {d} x.}
  • Die stetige und die diskrete Variante lässt sich in der maßtheoretischen Variante zusammenfassen: Ist ( Ω , A , μ ) {\displaystyle \left(\Omega ,A,\mu \right)} Maßraum mit μ ( Ω ) = 1 {\displaystyle \mu (\Omega )=1\;} und ist y {\displaystyle y\;} eine μ-integrierbare reellwertige Funktion, so gilt für jede im Bild von y {\displaystyle y\;} konvexe Funktion f {\displaystyle f\;}
f ( Ω y   d μ ) Ω f y   d μ . {\displaystyle f\left(\int _{\Omega }y\ \mathrm {d} \mu \right)\leq \int _{\Omega }f\circ y\ \mathrm {d} \mu .}
  • Die jensensche Ungleichung ist z. B. für Erwartungswerte anwendbar. Ist f {\displaystyle f\;} konvex und X {\displaystyle X\;} eine integrierbare Zufallsvariable, dann gilt
f ( E ( X ) ) E ( f ( X ) ) . {\displaystyle f(\operatorname {E} (X))\leq \operatorname {E} (f(X)).}
Jensen's Ungleichung gilt auch für den bedingten Erwartungswert
f ( E [ X G ] ) E [ f ( X ) G ] . {\displaystyle f(\operatorname {E} [X\mid {\mathcal {G}}])\leq \operatorname {E} [f(X)\mid {\mathcal {G}}].}

Anwendungen

Die jensensche Ungleichung lässt sich beispielsweise zum Beweis der Ungleichung vom arithmetischen und geometrischen Mittel und der Ky-Fan-Ungleichung verwenden. Die Variante für Erwartungswerte dient in der Stochastik zur Abschätzung von bestimmten Zufallsgrößen.

Umkehrung

Die Aussage der maßtheoretischen Variante der jensenschen Ungleichung lässt sich im folgenden Sinne umkehren:[3]

Sei f : R R {\displaystyle f\colon \mathbb {R} \to \mathbb {R} } eine reelle Funktion derart, dass für jede beschränkte (Lebesgue-)messbare Funktion y : [ 0 , 1 ] R {\displaystyle y\colon [0,1]\to \mathbb {R} } gilt

f ( 0 1 y   d x ) 0 1 f y   d x {\displaystyle f\left(\int _{0}^{1}y\ \mathrm {d} x\right)\leq \int _{0}^{1}f\circ y\ \mathrm {d} x} ,

dann ist f {\displaystyle f} konvex.

Weblinks

Wikisource: Otto Hölder: Ueber einen Mittelwerthssatz (1889) – Quellen und Volltexte

Einzelnachweise

  1. a b Johan Ludwig William Valdemar Jensen: Sur les fonctions convexes et les inégalités entre les valeurs moyennes. In: Acta Math. Band 30, 1906, S. 175–193, doi:10.1007/BF02418571. 
  2. a b Otto Hölder: Ueber einen Mittelwerthssatz. In: Nachrichten von der Königl. Gesellschaft der Wissenschaften und der Georg-Augusts-Universität zu Göttingen. Aus dem Jahre 1889., Nr. 1-21. Dieterichsche Verlags-Buchhandlung, Göttingen 1889, S. 38 ff. (in Wikisource [abgerufen am 24. März 2012]). 
  3. Walter Rudin: Real and Complex Analysis. 3. Auflage. McGraw-Hill, New York 1987, S. 74 (englisch).