Teorema del valor medio

En matemáticas, el teorema de valor medio (de Lagrange), teorema de los incrementos finitos, teorema de Bonnet-Lagrange o teoría del punto medio es una propiedad de las funciones derivables en un intervalo. Algunos matemáticos consideran que este teorema es el más importante del cálculo (véase también el teorema fundamental del cálculo integral). El teorema de valor medio puede usarse para demostrar el teorema de Taylor y el teorema de Rolle, ya que ambos son un caso especial.

De manera precisa el teorema enuncia que si f {\displaystyle f} es una función continua en un intervalo cerrado [ a , b ] {\displaystyle [a,b]} y diferenciable en el intervalo abierto ( a , b ) {\displaystyle (a,b)} entonces existe un punto c {\displaystyle c} en ( a , b ) {\displaystyle (a,b)} tal que la recta tangente en el punto c {\displaystyle c} es paralela a la recta secante que pasa por los puntos ( a , f ( a ) ) {\displaystyle (a,f(a))} y ( b , f ( b ) ) {\displaystyle (b,f(b))} , esto es

c ( a , b ) / f ( c ) = f ( b ) f ( a ) b a {\displaystyle \exists c\in (a,b){\big /}f'(c)={\frac {f(b)-f(a)}{b-a}}}

Historia

Un caso especial de este teorema fue descrito por primera vez por Paramésuara (1370–1460), de la escuela de Kerala de astronomía y matemáticas en la India, en sus comentarios sobre Govindasvāmi y Bhaskara II.[1]​ Una forma restringida del teorema fue demostrada por Michel Rolle en 1691; el resultado fue lo que ahora se conoce como teorema de Rolle, y se demostró sólo para polinomios, sin las técnicas de cálculo. El teorema del valor medio en su forma moderna fue declarado y probado por Cauchy en 1823.[2]

Teorema

Para una función que cumpla la hipótesis de ser definida y continua en [ a , b ] {\displaystyle [a,b]} y derivable en el intervalo abierto ( a , b ) {\displaystyle (a,b)} entonces existe al menos algún punto c en el intervalo ( a , b ) {\displaystyle (a,b)} en que la pendiente de la curva es igual que la pendiente media de la curva en el intervalo cerrado [ a , b ] {\displaystyle [a,b]} .

Sea f : [ a , b ] R {\displaystyle f:[a,b]\to \mathbb {R} } una función continua en el intervalo cerrado [ a , b ] {\displaystyle [a,b]} y diferenciable en el intervalo abierto ( a , b ) {\displaystyle (a,b)} con a < b {\displaystyle a<b} entonces existe al menos algún punto c ( a , b ) {\displaystyle c\in (a,b)} tal que

f ( c ) = f ( b ) f ( a ) b a {\displaystyle f'(c)={\frac {f(b)-f(a)}{b-a}}}

El teorema del valor medio es una generalización del teorema de Rolle, las hipótesis son que si una función f : [ a , b ] R {\displaystyle f:[a,b]\to \mathbb {R} } es continua en [ a , b ] {\displaystyle [a,b]} y diferenciable en ( a , b ) {\displaystyle (a,b)} y toma valores iguales en los extremos del intervalo, esto es, f ( a ) = f ( b ) {\displaystyle f(a)=f(b)} entonces existe al menos algún punto c ( a , b ) {\displaystyle c\in (a,b)} tal que f ( c ) = 0 {\displaystyle f'(c)=0} , esto es, el lado derecho de la expresión anterior es cero.

Demostración

Demostración 1

Primero se consideran dos puntos ( a , f ( a ) ) {\displaystyle (a,f(a))} y ( b , f ( b ) ) {\displaystyle (b,f(b))} pertenecientes al gráfico de la función. La ecuación de la recta que pasa por estos dos puntos es:

y = f ( a ) + f ( b ) f ( a ) b a ( x a ) {\displaystyle y=f(a)+{\frac {f(b)-f(a)}{b-a}}(x-a)}

Se define una función auxiliar:

g ( x ) = f ( x ) y = f ( x ) [ f ( a ) + f ( b ) f ( a ) b a ( x a ) ] {\displaystyle {\begin{aligned}g(x)&=f(x)-y\\&=f(x)-\left[f(a)+{\frac {f(b)-f(a)}{b-a}}(x-a)\right]\end{aligned}}}

Dado que f {\displaystyle f} es continua en [ a , b ] {\displaystyle [a,b]} y diferenciable en ( a , b ) {\displaystyle (a,b)} entonces g {\displaystyle g} también lo es. Además g {\displaystyle g} satisface las condiciones del Teorema de Rolle en [ a , b ] {\displaystyle [a,b]} ya que:

g ( a ) = f ( a ) f ( a ) f ( b ) f ( a ) b a ( a a ) = 0 f ( b ) f ( a ) b a ( 0 ) = 0 g ( b ) = f ( b ) f ( a ) f ( b ) f ( a ) b a ( b a ) = f ( b ) f ( a ) f ( b ) + f ( a ) = 0 {\displaystyle {\begin{aligned}g(a)=f(a)-f(a)-{\frac {f(b)-f(a)}{b-a}}(a-a)=0-{\frac {f(b)-f(a)}{b-a}}(0)=0\\g(b)=f(b)-f(a)-{\frac {f(b)-f(a)}{b-a}}(b-a)=f(b)-f(a)-f(b)+f(a)=0\end{aligned}}}

Por el Teorema de Rolle, como g {\displaystyle g} es diferenciable en ( a , b ) {\displaystyle (a,b)} , y g ( a ) = g ( b ) {\displaystyle g(a)=g(b)} entonces existe un punto c ( a , b ) {\displaystyle c\in (a,b)} tal que g ( c ) = 0 {\displaystyle g'(c)=0} y por tanto:

0 = g ( c ) = f ( c ) f ( b ) f ( a ) b a {\displaystyle 0=g'(c)=f'(c)-{\frac {f(b)-f(a)}{b-a}}}

y así

f ( c ) = f ( b ) f ( a ) b a {\displaystyle f'(c)={\frac {f(b)-f(a)}{b-a}}}

que es lo que se quería demostrar.

Demostración 2

Sea m a b {\displaystyle m_{ab}} la pendiente de la recta secante entre [ a , b ] {\displaystyle [a,b]} , se define la ecuación punto-pendiente:

y = m a b x + c 1 {\displaystyle y=m_{ab}x+c_{1}}
m a b = f ( b ) f ( a ) b a {\displaystyle m_{ab}={\frac {f(b)-f(a)}{b-a}}}

o también,

m a b x + y = c 1 {\displaystyle -m_{ab}x+y=c_{1}}

De acuerdo al enunciado la función es derivable en ( a , b ) {\displaystyle (a,b)} , por lo que se puede escoger algún valor x = c {\displaystyle x=c} en dicho intervalo tal que f ( c ) {\displaystyle f'(c)} existe y es la pendiente de la recta tangente en dicho punto y por ende la recta tangente tiene la forma (punto-pendiente):

y = f ( c ) x + c 2 {\displaystyle y=f'(c)x+c_{2}}

o también,

f ( c ) x + y = c 2 {\displaystyle -f'(c)x+y=c_{2}}

Se observa que se llega a un sistema lineal de 2x2

{ m a b x + y = c 1 f ( c ) x + y = c 2 {\displaystyle \left\{{\begin{matrix}-m_{ab}x+y=c_{1}\\-f'(c)x+y=c_{2}\end{matrix}}\right.}

La matriz del sistema es:

A = ( m a b 1 f ( c ) 1 ) {\displaystyle \mathbb {A} =\;{\begin{pmatrix}-m_{ab}&1\\-f'(c)&1\\\end{pmatrix}}}

Y su determinante es:

det ( A ) = f ( c ) m a b {\displaystyle \det(A)=f'(c)-m_{ab}}

Para que el sistema no tenga solución se debe cumplir det(A)=0, por lo tanto las rectas son paraleas en x=c, es decir f'(c) = mab

Entonces, existe al menos un punto que no da solución al sistema y además la recta tangente al mismo es paralela a la recta entre a y b, es decir:

f ( c ) = m a b {\displaystyle f'(c)=m_{ab}}

o también,

f ( c ) = f ( b ) f ( a ) b a {\displaystyle f'(c)={\frac {f(b)-f(a)}{b-a}}}

Con ello queda demostrado el teorema del valor medio.

Teoremas del valor medio para integrales definidas

Primer teorema del valor medio para integrales definidas

Sea f : [ a , b ] R {\displaystyle f:[a,b]\to \mathbb {R} } una función continua en el intervalo [ a , b ] {\displaystyle [a,b]} entonces existe un valor c [ a , b ] {\displaystyle c\in [a,b]} tal que[3]

a b f ( x ) d x = f ( c ) ( b a ) {\displaystyle \int _{a}^{b}f(x)\,dx=f(c)(b-a)}

Dado que el valor medio de f {\displaystyle f} en [ a , b ] {\displaystyle [a,b]} está definido como

1 b a a b f ( x ) d x {\displaystyle {\frac {1}{b-a}}\int _{a}^{b}f(x)\;dx}

por lo que podemos interpretar que f {\displaystyle f} alcanza su punto medio en algún c ( a , b ) {\displaystyle c\in (a,b)} .

En general, si f : [ a , b ] R {\displaystyle f:[a,b]\to \mathbb {R} } es continua y g {\displaystyle g} es una función integrable que no cambia signo en [ a , b ] {\displaystyle [a,b]} entonces existe c ( a , b ) {\displaystyle c\in (a,b)} tal que

a b f ( x ) g ( x ) d x = f ( c ) a b g ( x ) d x {\displaystyle \int _{a}^{b}f(x)g(x)\;dx=f(c)\int _{a}^{b}g(x)\;dx}

Demostración 1

Supóngase que f : [ a , b ] R {\displaystyle f:[a,b]\to \mathbb {R} } es continua y que g {\displaystyle g} es una función integrable no negativa en [ a , b ] {\displaystyle [a,b]} , por el teorema del valor extremo existen m {\displaystyle m} y M {\displaystyle M} tal que para x [ a , b ] {\displaystyle x\in [a,b]} m f ( x ) M {\displaystyle m\leq f(x)\leq M} y f [ a , b ] = [ m , M ] {\displaystyle f[a,b]=[m,M]} , como g {\displaystyle g} es no negativa entonces

m a b g ( x ) d x a b f ( x ) g ( x ) d x M a b g ( x ) d x {\displaystyle m\int _{a}^{b}g(x)dx\leq \int _{a}^{b}f(x)g(x)dx\leq M\int _{a}^{b}g(x)dx}

Sea

I := a b g ( x ) d x {\displaystyle I:=\int _{a}^{b}g(x)dx}

si I = 0 {\displaystyle I=0} entonces ya terminamos pues

0 a b f ( x ) g ( x ) d x 0 {\displaystyle 0\leq \int _{a}^{b}f(x)g(x)dx\leq 0}

esto es

a b f ( x ) g ( x ) d x = 0 {\displaystyle \int _{a}^{b}f(x)g(x)dx=0}

por lo que para todo c ( a , b ) {\displaystyle c\in (a,b)}

a b f ( x ) g ( x ) d x = f ( c ) I = 0 {\displaystyle \int _{a}^{b}f(x)g(x)dx=f(c)I=0}

Si I 0 {\displaystyle I\neq 0} entonces

m 1 I a b f ( x ) g ( x ) d x M {\displaystyle m\leq {\frac {1}{I}}\int _{a}^{b}f(x)g(x)dx\leq M}

por el teorema del valor intermedio, existe al menos un c [ a , b ] {\displaystyle c\in [a,b]} tal que

f ( c ) = 1 I a b f ( x ) g ( x ) d x {\displaystyle f(c)={\frac {1}{I}}\int _{a}^{b}f(x)g(x)dx}

esto es

a b f ( x ) g ( x ) d x = f ( c ) a b g ( x ) d x {\displaystyle \int _{a}^{b}f(x)g(x)dx=f(c)\int _{a}^{b}g(x)dx}

Finalmente, si g {\displaystyle g} es negativa en [ a , b ] {\displaystyle [a,b]} entonces

M a b g ( x ) d x a b f ( x ) g ( x ) d x m a b g ( x ) d x {\displaystyle M\int _{a}^{b}g(x)dx\leq \int _{a}^{b}f(x)g(x)dx\leq m\int _{a}^{b}g(x)dx}

y seguiremos obteniendo el mismo resultado que antes.

Demostración 2

Aplicando la integración de Riemann

a b f ( x ) d x = lim n b a n i = 1 n f ( x i ) {\displaystyle \int _{a}^{b}f(x)dx=\lim _{n\to \infty }{\frac {b-a}{n}}\sum _{i=1}^{n}f(x_{i})}

La suma aloja todos los x i {\displaystyle x_{i}} dentro del intervalo [ a , b ] {\displaystyle [a,b]} , por lo que procederemos a escoger un x i = c {\displaystyle x_{i}=c} fijo de dicho intervalo y que por ende hace que f ( x i ) = f ( c ) {\displaystyle f(x_{i})=f(c)}

Al reemplazar, la integral queda de la siguiente manera:

a b f ( x ) d x = lim n b a n i = 1 n f ( c ) {\displaystyle \int _{a}^{b}f(x)dx=\lim _{n\to \infty }{\frac {b-a}{n}}\sum _{i=1}^{n}f(c)}

como f ( c ) {\displaystyle f(c)} es constante respecto a la suma entonces

i = 1 n f ( c ) = f ( c ) i = 1 n 1 = n f ( c ) {\displaystyle \sum _{i=1}^{n}f(c)=f(c)\sum _{i=1}^{n}1=nf(c)}

Reemplazando

a b f ( x ) d x = lim n b a n n f ( c ) {\displaystyle \int _{a}^{b}f(x)dx=\lim _{n\to \infty }{\frac {b-a}{n}}\;nf(c)}

Simplificando

a b f ( x ) d x = lim n ( b a ) f ( c ) {\displaystyle \int _{a}^{b}f(x)dx=\lim _{n\to \infty }(b-a)f(c)}

Como b a {\displaystyle b-a} y f ( c ) {\displaystyle f(c)} no son afectados por el límite ya que son constantes entonces

a b f ( x ) d x = ( b a ) f ( c ) {\displaystyle \int _{a}^{b}f(x)dx=(b-a)f(c)}

Despejando f ( c ) {\displaystyle f(c)}

f ( c ) = 1 b a a b f ( x ) d x {\displaystyle f(c)={\frac {1}{b-a}}\int _{a}^{b}f(x)dx}

Por lo tanto, queda verificado la existencia de c [ a , b ] {\displaystyle c\in [a,b]} en donde la función evaluada en él, toma el valor de 1 ( b a ) a b f ( x ) {\textstyle {\frac {1}{(b-a)}}\int _{a}^{b}f(x)} , es decir,

c [ a , b ] : f ( c ) = 1 b a a b f ( x ) d x {\displaystyle \exists \;c\in [a,b]:\quad f(c)={\frac {1}{b-a}}\int _{a}^{b}f(x)dx}

Y así, queda demostrado el teorema del valor medio para integrales.

Teorema del valor medio en varias variables

El teorema del valor medio se puede generalizar para funciones reales de argumento vectorial. Esto se puede hacer parametrizando a la función y usando el teorema del valor medio de una variable.

Sea G {\displaystyle G} un subconjunto abierto y convexo de R n {\displaystyle \mathbb {R} ^{n}} y sea f : G R {\displaystyle f:G\to \mathbb {R} } una función diferenciable. Sean x , y G {\displaystyle x,y\in G} y definamos g ( t ) = f ( ( 1 t ) x + t y ) {\displaystyle g(t)=f{\Big (}(1-t)x+ty{\Big )}} . Como g {\displaystyle g} es una función diferenciable de una variable, el teorema del valor medio nos da:

g ( 1 ) g ( 0 ) = g ( c ) {\displaystyle g(1)-g(0)=g'(c)}

para algún c {\displaystyle c} entre 0 y 1. Pero aparte tenemos g ( 1 ) = f ( y ) {\displaystyle g(1)=f(y)} y g ( 0 ) = f ( x ) {\displaystyle g(0)=f(x)} , calculando g ( c ) {\displaystyle g'(c)} tenemos, explícitamente:

f ( y ) f ( x ) = f ( ( 1 c ) x + c y ) ( y x ) {\displaystyle f(y)-f(x)=\nabla f{\Big (}(1-c)x+cy{\Big )}\cdot (y-x)}

donde {\displaystyle \nabla } denota al gradiente y {\displaystyle \cdot } al producto interno. Esto es un análogo exacto del teorema del valor medio en una variable (en el caso n = 1 {\displaystyle n=1} éste es de hecho el teorema en una variable). Por la desigualdad de Cauchy–Schwarz, la ecuación nos da la estimación:

| f ( y ) f ( x ) | | f ( ( 1 c ) x + c y ) |   | y x | . {\displaystyle {\Bigg |}f(y)-f(x){\Bigg |}\leq {\Bigg |}\nabla f{\Big (}(1-c)x+cy{\Big )}{\Bigg |}\ {\Big |}y-x{\Big |}.}

En particular, cuando las derivadas parciales de f {\displaystyle f} están acotadas, f {\displaystyle f} es Lipschitz continua (y por lo tanto uniformemente continua). Cabe mencionar que no requerimos que f {\displaystyle f} sea continuamente diferenciable o continua en la cerradura de G {\displaystyle G} . Sin embargo, para calcular g {\displaystyle g'} usando la regla de la cadena, necesitamos que f {\displaystyle f} sea diferenciable en G {\displaystyle G} ; la existencia de las derivadas parciales con respecto a x {\displaystyle x} y y {\displaystyle y} no es por sí misma una condición suficiente para garantizar la validez del teorema.

Como una aplicación directa del teorema, podemos demostrar que f {\displaystyle f} es constante si G {\displaystyle G} es abierto, conexo y toda derivada parcial de f {\displaystyle f} es 0. Sea un punto arbitrario x 0 G {\displaystyle x_{0}\in G} , y sea g ( x ) = f ( x ) f ( x 0 ) {\displaystyle g(x)=f(x)-f(x_{0})} . Queremos demostrar que g ( x ) = 0 {\displaystyle g(x)=0} para todo x G {\displaystyle x\in G} . Sea ahora E = { x G : g ( x ) = 0 } {\displaystyle E=\{x\in G:g(x)=0\}} . EntoncesE es cerrado y no vacío.

| g ( y ) | = | g ( y ) g ( x ) | ( 0 ) | y x | = 0 {\displaystyle {\Big |}g(y){\Big |}={\Bigg |}g(y)-g(x){\Bigg |}\leq (0){\Big |}y-x{\Big |}=0}

para cada y {\displaystyle y} en alguna vecindad de x {\displaystyle x} . (En este paso es muy importante que x {\displaystyle x} y y {\displaystyle y} estén suficientemente cerca.) Como G {\displaystyle G} es conexo, concluimos que E = G {\displaystyle E=G} .

Los argumentos anteriores no dependen de nuestro sistema de coordenadas; por lo tanto se pueden generalizar en caso de que G {\displaystyle G} sea un subconjunto de un espacio de Banach.

Generalizaciones

No existe un análogo estricto del teorema de valor medio para aplicaciones f : A R n {\displaystyle \mathbf {f} :A\longrightarrow \mathbb {R} ^{n}} . En este caso, sólo es posible establecer la siguiente desigualdad en términos de la norma:

f ( b ) f ( a ) ( D f ( c ) ) ( b a ) D f ( c ) ( b a ) {\displaystyle \|\mathbf {f} (\mathbf {b} )-\mathbf {f} (\mathbf {a} )\|\leq \|\left(D\mathbf {f} (\mathbf {c} )\right)(\mathbf {b} -\mathbf {a} )\|\leq \|D\mathbf {f} (\mathbf {c} )\|\|(\mathbf {b} -\mathbf {a} )\|}

Demostración

Teniendo en cuenta que dada una función f : A R n R m {\displaystyle \mathbf {f} :A\subset \mathbb {R} ^{n}\longrightarrow \mathbb {R} ^{m}}

  0 1 f ( t ) d t 0 1 f ( t ) d t {\displaystyle \ \|\int _{0}^{1}f(t)\,dt\|\leq \int _{0}^{1}\|f(t)\|\,dt}

se tiene que si

  I [ x , y ] {\displaystyle \ I[x,y]}

es el segmento formado por   x , y A {\displaystyle \ x,y\in A} (siendo A conexo y abierto), es I [ x , y ] A {\displaystyle I[x,y]\subset A} y entonces

  f ( y ) f ( x ) = 0 1 d f ( x ( 1 t ) + t y ) ( y x ) d t 0 1 d f ( x ( 1 t ) + t y ) ( y x ) d t {\displaystyle \ \|f(y)-f(x)\|=\|\int _{0}^{1}df(x(1-t)+ty)(y-x)\,dt\|\leq \int _{0}^{1}\|df(x(1-t)+ty)(y-x)\|\,dt}

de donde se tiene que como

  d f ( x ( 1 t ) + t y ) ( y x ) d f ( x ( 1 t ) + t y ) y x {\displaystyle \ \|df(x(1-t)+ty)(y-x)\|\leq \|df(x(1-t)+ty)\|\|y-x\|}   t [ 0 , 1 ] {\displaystyle \ \forall t\in [0,1]}

es

  f ( y ) f ( x ) d f ( c ) y x {\displaystyle \ \|f(y)-f(x)\|\leq \|df(c)\|\|y-x\|} para algún c I ( x , y ) {\displaystyle c\in I(x,y)}

Para ver [1] basta tener en cuenta que si L = 0 1 f ( t ) d t {\textstyle L=\int _{0}^{1}f(t)\,dt}

  L 2 = 0 1 f ( t ) d t 2 =< L , 0 1 f ( t ) d t >= 0 1 < L , f ( t ) > d t 0 1 L f ( t ) d t = L 0 1 f ( t ) d t {\displaystyle \ \|L\|^{2}=\|\int _{0}^{1}f(t)\,dt\|^{2}=<L,\int _{0}^{1}f(t)\,dt>=\int _{0}^{1}<L,f(t)>\,dt\leq \int _{0}^{1}\|L\|\|f(t)\|dt=\|L\|\int _{0}^{1}\|f(t)\|dt}

y se tiene que

  0 1 f ( t ) d t 0 1 f ( t ) d t {\displaystyle \ \|\int _{0}^{1}f(t)\,dt\|\leq \int _{0}^{1}\|f(t)\|\,dt}

Corolario

Sea la función h tal que

  • es continua sobre un intervalo finito o infinito ya que...
  • tiene derivada nula en cualquier punto de este intervalo, salvo un conjunto finito de puntos del intervalo

entonces esta función es constante sobre este intervalo.[4]

Véase también

Referencias

  1. J. J. O'Connor and E. F. Robertson (2000). Paramesvara, MacTutor History of Mathematics archive.
  2. A. Besenyei, Historical development of the mean value theorem, http://abesenyei.web.elte.hu/publications/meanvalue.pdf
  3. Ver "Introducción al cálculo y al análisis matemático Vol. I". R. Courant & J. Fritz. Ed. Limusa. p. 163.
  4. L. D. Kudriátsev: Curso de análisis matemático 1 . Editorial Mir, Moscú (1983), traducido del ruso por V. Fernández
  • Bombal, Marin & Vera: Problemas de Análisis matemático: Cálculo Diferencial, 1988, ed. AC, ISBN 84-7288-101-6.

Enlaces externos

Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q189136
  • Commonscat Multimedia: Mean value theorem / Q189136

  • Identificadores
  • LCCN: sh85082689
  • NLI: 987007558280505171
  • Diccionarios y enciclopedias
  • Britannica: url
  • Wd Datos: Q189136
  • Commonscat Multimedia: Mean value theorem / Q189136