ヘルダー平均

ヘルダー平均(ヘルダーへいきん、英語: Hölder mean)、またはべき平均(べきへいきん)、一般化平均(いっぱんかへいきん、英語: generalized mean)、[1]とは、数の集合を集計する関数の族である。特別な場合としてピタゴラス平均算術平均幾何平均調和平均)を含む。名称はオットー・ヘルダーにちなむ。

定義

p を0でない実数とする。正の実数 x1, ... , xn に対して指数 p のヘルダー平均は次で定義される[2]

M p ( x 1 , , x n ) := ( 1 n i = 1 n x i p ) 1 / p {\displaystyle M_{p}(x_{1},\dots ,x_{n}):=\left({\frac {1}{n}}\sum _{i=1}^{n}x_{i}^{p}\right)^{1/p}}
p-ノルム」も参照

p = 0 のときは、幾何平均(指数が0に向かうときの極限)で定義する。

M 0 ( x 1 , , x n ) := i = 1 n x i n {\displaystyle M_{0}(x_{1},\dots ,x_{n}):={\sqrt[{n}]{\prod _{i=1}^{n}x_{i}}}}

さらに、重み wi (正の数のセット。ただし w i = 1 {\displaystyle \sum w_{i}=1} )に対して重み付きヘルダー平均は次で定義される:

M p ( x 1 , , x n ) := ( i = 1 n w i x i p ) 1 / p M 0 ( x 1 , , x n ) := i = 1 n x i w i {\displaystyle {\begin{aligned}M_{p}(x_{1},\dots ,x_{n})&:=\left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)^{1/p}\\M_{0}(x_{1},\dots ,x_{n})&:=\prod _{i=1}^{n}x_{i}^{w_{i}}\end{aligned}}}

重みを考えない平均は、すべての重みを wi = 1/n としたものに相当する。

特別な場合

n = 2a = x1 = M, b = x2 = M−∞の場合の図示。
  調和平均、H = M−1(a, b),
  幾何平均、G = M0(a, b)
  算術平均、A = M1(a, b)
  二乗平均、Q = M2(a, b)

いくつかの特定の p の値に対しては、特別の名前が付けられている[3]

最小値
M ( x 1 , , x n ) lim p M p ( x 1 , , x n ) = min { x 1 , , x n } {\displaystyle M_{-\infty }(x_{1},\dots ,x_{n})\equiv \lim _{p\to -\infty }M_{p}(x_{1},\dots ,x_{n})=\min\{x_{1},\dots ,x_{n}\}}
調和平均
M 1 ( x 1 , , x n ) = n 1 x 1 + + 1 x n {\displaystyle M_{-1}(x_{1},\dots ,x_{n})={\frac {n}{{\frac {1}{x_{1}}}+\dots +{\frac {1}{x_{n}}}}}}
幾何平均
M 0 ( x 1 , , x n ) lim p 0 M p ( x 1 , , x n ) = x 1 x n n {\displaystyle M_{0}(x_{1},\dots ,x_{n})\equiv \lim _{p\to 0}M_{p}(x_{1},\dots ,x_{n})={\sqrt[{n}]{x_{1}\dots x_{n}}}}
算術平均
M 1 ( x 1 , , x n ) = x 1 + + x n n {\displaystyle M_{1}(x_{1},\dots ,x_{n})={\frac {x_{1}+\dots +x_{n}}{n}}}
二乗平均平方根
M 2 ( x 1 , , x n ) = x 1 2 + + x n 2 n {\displaystyle M_{2}(x_{1},\dots ,x_{n})={\sqrt {\frac {x_{1}^{2}+\dots +x_{n}^{2}}{n}}}}
立方平均
M 3 ( x 1 , , x n ) = x 1 3 + + x n 3 n 3 {\displaystyle M_{3}(x_{1},\dots ,x_{n})={\sqrt[{3}]{\frac {x_{1}^{3}+\dots +x_{n}^{3}}{n}}}}
最大値
M + ( x 1 , , x n ) lim p M p ( x 1 , , x n ) = max { x 1 , , x n } {\displaystyle M_{+\infty }(x_{1},\dots ,x_{n})\equiv \lim _{p\to \infty }M_{p}(x_{1},\dots ,x_{n})=\max\{x_{1},\dots ,x_{n}\}}
lim p 0 M p = M 0 {\displaystyle \textstyle \lim _{p\to 0}M_{p}=M_{0}} の証明 (幾何平均)

指数関数を使ってMp の定義式を書き変える。

M p ( x 1 , , x n ) = exp ( ln [ ( i = 1 n w i x i p ) 1 / p ] ) = exp ( ln ( i = 1 n w i x i p ) p ) {\displaystyle M_{p}(x_{1},\dots ,x_{n})=\exp {\left(\ln {\left[\left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)^{1/p}\right]}\right)}=\exp {\left({\frac {\ln {\left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)}}{p}}\right)}}

p → 0 の極限で指数関数の引数にロピタルの定理を適用する。分子と分母をそれぞれ p で微分することで

lim p 0 ln ( i = 1 n w i x i p ) p = lim p 0 i = 1 n w i x i p ln x i j = 1 n w j x j p 1 = lim p 0 i = 1 n w i x i p ln x i j = 1 n w j x j p = i = 1 n w i ln x i lim p 0 j = 1 n w j ( x j x i ) p = i = 1 n w i ln x i = ln ( i = 1 n x i w i ) {\displaystyle \lim _{p\to 0}{\frac {\ln {\left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)}}{p}}=\lim _{p\to 0}{\frac {\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}\ln {x_{i}}}{\sum _{j=1}^{n}w_{j}x_{j}^{p}}}{1}}=\lim _{p\to 0}{\frac {\sum _{i=1}^{n}w_{i}x_{i}^{p}\ln {x_{i}}}{\sum _{j=1}^{n}w_{j}x_{j}^{p}}}=\sum _{i=1}^{n}{\frac {w_{i}\ln {x_{i}}}{\lim _{p\to 0}\sum _{j=1}^{n}w_{j}\left({\frac {x_{j}}{x_{i}}}\right)^{p}}}=\sum _{i=1}^{n}w_{i}\ln {x_{i}}=\ln {\left(\prod _{i=1}^{n}x_{i}^{w_{i}}\right)}}

を得る。指数関数の連続性により上の関係を代入し直して

lim p 0 M p ( x 1 , , x n ) = exp ( ln ( i = 1 n x i w i ) ) = i = 1 n x i w i = M 0 ( x 1 , , x n ) {\displaystyle \lim _{p\to 0}M_{p}(x_{1},\dots ,x_{n})=\exp {\left(\ln {\left(\prod _{i=1}^{n}x_{i}^{w_{i}}\right)}\right)}=\prod _{i=1}^{n}x_{i}^{w_{i}}=M_{0}(x_{1},\dots ,x_{n})}

を得る[2]

lim p M p = M {\displaystyle \textstyle \lim _{p\to \infty }M_{p}=M_{\infty }} および lim p M p = M {\displaystyle \textstyle \lim _{p\to -\infty }M_{p}=M_{-\infty }} の証明

(必要なら添え字を付けなおすなどして) x 1 x n {\displaystyle x_{1}\geq \dots \geq x_{n}} と仮定する。すると

lim p M p ( x 1 , , x n ) = lim p ( i = 1 n w i x i p ) 1 / p = x 1 lim p ( i = 1 n w i ( x i x 1 ) p ) 1 / p = x 1 = M ( x 1 , , x n ) {\displaystyle \lim _{p\to \infty }M_{p}(x_{1},\dots ,x_{n})=\lim _{p\to \infty }\left(\sum _{i=1}^{n}w_{i}x_{i}^{p}\right)^{1/p}=x_{1}\lim _{p\to \infty }\left(\sum _{i=1}^{n}w_{i}\left({\frac {x_{i}}{x_{1}}}\right)^{p}\right)^{1/p}=x_{1}=M_{\infty }(x_{1},\dots ,x_{n})}

を得る。 M {\displaystyle M_{-\infty }} については M ( x 1 , , x n ) = 1 M ( 1 / x 1 , , 1 / x n ) {\displaystyle M_{-\infty }(x_{1},\dots ,x_{n})={\frac {1}{M_{\infty }(1/x_{1},\dots ,1/x_{n})}}} より導出できる。

性質

ヘルダー平均は次の性質をもつ[1]

  • 引数 x1, ... , xn の最小値と最大値の間にある。
    min ( x 1 , , x n ) M p ( x 1 , , x n ) max ( x 1 , , x n ) {\displaystyle \min(x_{1},\dots ,x_{n})\leq M_{p}(x_{1},\dots ,x_{n})\leq \max(x_{1},\dots ,x_{n})}
  • 引数に対して対称である。つまり引数を並べ替えてもその値を変えない。引数の置換演算子を P とすると次式で表される:
    M p ( x 1 , , x n ) = M p ( P ( x 1 , , x n ) ) {\displaystyle M_{p}(x_{1},\dots ,x_{n})=M_{p}(P(x_{1},\dots ,x_{n}))}
  • 他の平均と同様、引数 x1, ... , xn に対して斉次である。つまり b を正の実数として次式が成り立つ:
    M p ( b x 1 , , b x n ) = b M p ( x 1 , , x n ) {\displaystyle M_{p}(bx_{1},\dots ,bx_{n})=bM_{p}(x_{1},\dots ,x_{n})}
  • 準算術平均(英語版)と同様に、平均の計算は同じサイズのサブブロックの計算に分割できる。これにより、必要に応じて分割統治法を使用して平均を計算できる。
    M p ( x 1 , , x n k ) = M p [ M p ( x 1 , , x k ) , M p ( x k + 1 , , x 2 k ) , , M p ( x ( n 1 ) k + 1 , , x n k ) ] {\displaystyle M_{p}(x_{1},\dots ,x_{nk})=M_{p}\left[M_{p}(x_{1},\dots ,x_{k}),M_{p}(x_{k+1},\dots ,x_{2k}),\dots ,M_{p}(x_{(n-1)k+1},\dots ,x_{nk})\right]}

異なるヘルダー平均の間に成り立つ不等式

一般に -∞ ≤ p < q ≤ +∞ ならば

M p ( x 1 , , x n ) M q ( x 1 , , x n ) {\displaystyle M_{p}(x_{1},\dots ,x_{n})\leq M_{q}(x_{1},\dots ,x_{n})}

である。また2つの平均が等しいのは x1 = x2 = ⋯ = xnとき、かつそのときに限る。これはイェンセンの不等式より、任意の実数 p に対して

p M p ( x 1 , , x n ) 0 {\displaystyle {\frac {\partial }{\partial p}}M_{p}(x_{1},\dots ,x_{n})\geq 0}

が成り立つためである。

特に p = -1, 0, 1 の場合を考えると、この不等式は調和平均 ≤ 幾何平均 ≤ 相加平均

n 1 x 1 + 1 x 2 + 1 x n x 1 x 2 x n n x 1 + x 2 + + x n n {\displaystyle {\frac {n}{{\frac {1}{x_{1}}}+{\frac {1}{x_{2}}}+\cdots {\frac {1}{x_{n}}}}}\leq {\sqrt[{n}]{x_{1}x_{2}\cdots {}x_{n}}}\leq {\frac {x_{1}+x_{2}+\cdots +x_{n}}{n}}}

を意味する。

応用

信号処理

ヘルダー平均より非線形移動平均が導かれる。これは小さい p の場合には小さい信号値を強調し、大きい p の場合は大きい信号値を強調する。移動算術平均の効率的な実装である smooth が使えるならば、次のHaskellコードに従って移動ヘルダー平均を実装できる。

 powerSmooth :: Floating a => ([a] -> [a]) -> a -> [a] -> [a]
 powerSmooth smooth p = map (** recip p) . smooth . map (**p)

一般化 f-平均

ヘルダー平均はさらに一般化 f-平均(英語版)に一般化できる。

M f ( x 1 , , x n ) = f 1 ( 1 n i = 1 n f ( x i ) ) {\displaystyle M_{f}(x_{1},\dots ,x_{n})=f^{-1}\left({{\frac {1}{n}}\sum _{i=1}^{n}{f(x_{i})}}\right)}

この式は f(x) = log x とすれば、極限を使うことなく幾何平均も表すことができる。ヘルダー平均は f(x) = xp とすることで得られる。

脚注

  1. ^ a b Sýkora, Stanislav (2009). Mathematical means and averages: basic properties. 3. Stan’s Library: Castano Primo, Italy. doi:10.3247/SL3Math09.001 
  2. ^ a b P. S. Bullen: Handbook of Means and Their Inequalities. Dordrecht, Netherlands: Kluwer, 2003, pp. 175-177
  3. ^ Weisstein, Eric W. "Power Mean". mathworld.wolfram.com (英語). (retrieved 2019-08-17)

関連項目

外部リンク

  • Power mean at MathWorld
  • Examples of Generalized Mean
  • A proof of the Generalized Mean on PlanetMath