今回の数学エッセーでは, 確率分布の不偏推定量について,
分散と標準偏差の例を扱います.
独立確率変数 X_1, ・・・, X_n が同一の分布 F に従い,
分布 F は 2次のモーメントまでを持つとします.
μ を F の平均, V を F の分散とします.
つまり, X を F に従う確率変数とした時,
μ = E(X), V = E( ( X - μ )^2 ) = E( X^2 ) - μ^2
となります.
今,
Y = ( X_1 + ・・・+ X_n ) / n,
Z = ( ( n-1 )^{-1} )・Σ_{ k=1 }^{n} ( X_k - Y )^2
と置きます.
よく知られたように,
Y は μの, Z は V の不偏推定量になります.
すなわち, 期待値の簡単な計算からもわかりますが,
E(Y) = μ
E(Z) = V
となります.
ここで, 次の問題を考えます:
問題: √Z が F の標準偏差 σ = √V の不偏推定量になるためには,
X_1, ・・・, X_n に対して, どんな条件が必要か?
答え: (Ω, P, S) を問題の確率空間とする.
つまり, Ω は全事象, S は Ω 上の σ-algebra,
P は S 上の完全加法的非負集合関数で,
P(Ω) = 1 なるとする.
このとき,
もし, E(√Z) = √V ならば,
確率 1 で Z(ω) = V となる.
つまり,
P( { ω ∈ Ω | Z(ω) = V } ) = 1
となる.
証明:
ヘルダーの不等式より,
E( | (√Z) - σ | ) ≦ E( ( (√Z) - σ )^2 )^{1/2}
で,
E( ( (√Z) - σ )^2)
= 2σ^2 - 2σE(√Z)
= 2σ(σ - E(√Z))
= 0
となるからである.
証明終わり.
したがって, 確率 1 で Z(ω) = V とならない限り,
確率変数 √Z は σ の不偏推定量とはならないのである.
例えば, Ω = R^n, f_k は標準正規分布の確率密度関数 ,
μ_k は R 上のルベーグ測度 (1≦k≦n),
P を k が 1から n まで動くときの, 測度 f_k・μ_k の積,
確率変数 X_k ; Ω → R は,
X_k ( x_1, ・・・, x_n ) = x_k
とする.
そうすると, n>1 のとき,
各 X_k は標準正規分布 F に従い,
X_1, ・・・, X_n は独立確率変数列である.
今,
g(x_1, ・・・, x_n)
= ( (n-1)^{-1} )・Σ_{k=1}^{n} ( x_k - ( ( x_1+・・・+x_n ) / n ) )^2
と置くと,
もし, 確率 1 で g( x_1,・・・, x_n ) = 1 ならば,
ある集合 A⊆R^n が存在し,
P(A) = 1 かつ
g( x_1, ・・・, x_n ) = 1 for ( x_1,・・・, x_n ) ∈ A.
今, R^n - A は内点を持たないから,
g の R^n 上での連続性より,
g( x_1,・・・, x_n ) = 1 for all ( x_1,・・・, x_n ) ∈ R^n
g は x_1, ・・・, x_n の多公式だから,
x_1, ・・・, x_n の多項式として, g=1.
しかるに, 多項式 g は, 定数項を持たない.
これは矛盾.
よって, 上記確率変数 X_1, ・・・, X_n
に対しての √Z は, F (標準正規分布) の
文責: Dr. Kazuyoshi Katogi