Jensenin epäyhtälö

Matematiikassa Jensenin epäyhtälöllä, nimetty tanskalaisen matemaatikko Johan Jensenin mukaan, voidaan arvioida konveksin funktion integraaleja.

Äärellinen muoto

Reaaliselle jatkuvalle konveksille funktiolle φ ja positiivisille painokertoimille ai on voimassa

φ ( a i x i a i ) a i φ ( x i ) a i {\displaystyle \varphi \left({\frac {\sum a_{i}x_{i}}{\sum a_{i}}}\right)\leq {\frac {\sum a_{i}\varphi (x_{i})}{\sum a_{i}}}}

Epäyhtälö on käännettävä jos φ on konkaavi.

Jos ai=1, on

φ ( x i n ) φ ( x i ) n {\displaystyle \varphi \left({\frac {\sum x_{i}}{n}}\right)\leq {\frac {\sum \varphi (x_{i})}{n}}}

Funktio log(x) on konkaavi, joten sijoittamalla φ(x) = log(x) saadaan aritmeettis-geometrinen epäyhtälö:

x 1 + x 2 + + x n n x 1 x 2 x n n . {\displaystyle {\frac {x_{1}+x_{2}+\cdots +x_{n}}{n}}\geq {\sqrt[{n}]{x_{1}x_{2}\cdots x_{n}}}.}

Yleinen väittämä

Epäyhtälö voidaan kirjoittaa myös yleisemmässä muodossa mittateorian avulla. Se voidaan ilmaista myös todennäköisyysteorian avulla. Nämä väittämät ovat yhtäpitäviä.

Mittateoreettinen muotoilu

Olkoon (Ω,A,μ) mitta-avaruus siten, että μ(Ω) = 1. Jos g on reaaliarvoinen μ-integroituva ja jos φ on konveksi joukossa g, on voimassa

φ ( Ω g d μ ) Ω φ g d μ . {\displaystyle \varphi \left(\int _{\Omega }g\,d\mu \right)\leq \int _{\Omega }\varphi \circ g\,d\mu .}

Todennäköisyysteoreettinen muotoilu

Todennäköisyysteorian terminologialla μ on todennäköisyysmitta. Funktio g korvataan reaaliarvoisella satunnaismuuttujalla X. Tällöin jokainen integraali Ω:ssa todennäköisyysmitan μ suhteen voidaan tulkita odotusarvoksi. Tällöin, jos φ on konveksi funktio, on

φ ( E { X } ) E { φ ( X ) } . {\displaystyle \varphi \left(\mathbb {E} \{X\}\right)\leq \mathbb {E} \{\varphi (X)\}.\,}

Todistus

Olkoon g μ-integroituva funktio mitta-avaruudessa Ω ja olkoon φ konveksi funktio g:n määrittelyjoukossa. Määritellään φ:n oikeanpuoleinen derivaatta x:ssä asettamalla

φ ( x ) := lim t 0 φ ( x + t ) φ ( x ) t {\displaystyle \varphi ^{\prime }(x):=\lim _{t\to 0^{-}}{\frac {\varphi (x+t)-\varphi (x)}{t}}}

Koska φ on konveksi, oikean puolen osamäärä on vähenevä kun t lähestyy nollaa oikealta. Osamäärä on myös alhaalta rajoitettu: sitä rajoittavat termit muotoa

φ ( x + t ) φ ( x ) t , {\displaystyle {\frac {\varphi (x+t)-\varphi (x)}{t}},}

missä t < 0. Siten raja-arvo on aina olemassa.

Asetetaan nyt seuraavat merkinnät:

x 0 := Ω g d μ , {\displaystyle x_{0}:=\int _{\Omega }g\,d\mu ,}
a := φ ( x 0 ) , {\displaystyle a:=\varphi ^{\prime }(x_{0}),}
b := φ ( x 0 ) x 0 φ ( x 0 ) . {\displaystyle b:=\varphi (x_{0})-x_{0}\varphi ^{\prime }(x_{0}).}

Tällöin kaikilla x on voimassa a x + b φ ( x ) {\displaystyle ax+b\leq \varphi (x)} . Tämä nähdään siitä, että jos x>x0 ja t = x − x0 > 0, on voimassa

φ ( x 0 ) φ ( x 0 + t ) φ ( x 0 ) t . {\displaystyle \varphi ^{\prime }(x_{0})\leq {\frac {\varphi (x_{0}+t)-\varphi (x_{0})}{t}}.}

Siten

φ ( x 0 ) ( x x 0 ) + φ ( x 0 ) φ ( x ) {\displaystyle \varphi ^{\prime }(x_{0})(x-x_{0})+\varphi (x_{0})\leq \varphi (x)}

kuten vaadittiin. Tapaus x < x0 todistetaan vastaavasti, kuten myös tapaus a x 0 + b = φ ( x 0 ) {\displaystyle ax_{0}+b=\varphi (x_{0})} .

φ(x0) voidaan siten kirjoittaa muodossa

a x 0 + b = a ( Ω g d μ ) + b . {\displaystyle ax_{0}+b=a\left(\int _{\Omega }g\,d\mu \right)+b.}

Mutta koska μ(Ω) = 1, on kaikilla reaaliluvuilla k voimassa

Ω k d μ = k . {\displaystyle \int _{\Omega }k\,d\mu =k.}

Erityisesti

a ( Ω g d μ ) + b = Ω ( a g + b ) d μ Ω φ g d μ . {\displaystyle a\left(\int _{\Omega }g\,d\mu \right)+b=\int _{\Omega }(ag+b)\,d\mu \leq \int _{\Omega }\varphi \circ g\,d\mu .}

Q.E.D.

Lähteet

  • Walter Rudin, Real and Complex Analysis
  • David Chandler, Introduction to Modern Statistical Mechanics

Aiheesta muualla