kazz の数学旅行記

数学の話題を中心に, 日々の知的活動の旅路を紹介します.

統計的検定の考え方 〜統計ユーザーの立場で〜

ここでは、行動科学をはじめとする社会科学でよく使われる

統計的検定の、入門的な考え方を述べます。

医学・看護学でも、同様です。

 

統計用語を用いた学術的な説明を理解するための、第一歩です。

統計学の教科書と、読み比べてみてください。

 

では、そもそも、検定とは、何か?

 

1)ある仮説(H(0)で表す。) を認めるか認めないか、

  その決断を迫られた場合、検定という方法を使います。

 

例えば、H(0) : 学業成績への遺伝的影響は、ない。

と言うように設定します。

(数式で表すと、x = y の形の等式で表されます。)

 

ここで、H(0) に対して、対立仮説 H(1) を次のように設定します。

H(1) : H(0) でない。即ち、学業成績への遺伝的影響は、ある。

(数式で表すと、 x≠y や x < y の不等式で表されます。)

 

基本的には、H(0) は等式、H(1) は不等式です。

これは、統計の技術的理由ですから、

そういう決まりごとだと思ってください。

 

ここで一つ、注意です。

 

通常、数学理論では、H(0) を自分が立証したい仮説と見做しますが、

社会科学や医学理論などの統計ユーザーの立場では、

H(1) のほうを自分が立証したい仮説と見做します。

 

つまり、統計ユーザーの立場では、H(1) を認めることとH(0) を認めないことは

同じだから、(後で理由を書くように)より便利な方法を使おうと言うわけです。

 

統計理論の慣習として、H(0) を帰無仮説、H(1) を対立仮説と呼びます。

 

2) 検定は、次のようなルールに基づいて行います。

 

3)そのルールとは、

 

3.1あらかじめ、棄却域と言う区間を、数直線上に設けておきます。

棄却域は、通常、一つか二つの区間の合併です。

 

また、採集したデータから、検定に必要な平均値なり分散なりを

計算しておきます。

その計算によって得られた数値を統計量と呼びます。

 

3.2 その統計量が、その棄却域に入れば、H(1) を認めます。

棄却域に入らなければ、H(0) を認めます。

 

3.3 H(1) を認めるか、H(0) を認めるかは、いったん棄却域を定めたあとは、

3.2 の方法で、機械的に判定されます。

(もちろん、この判定は、3.1 による棄却域の定め方には依存します。

棄却域の定め方の考え方の部分については、 4.3 の有意水準

項を参照してください。

 

3.4 ここまで、統計的検定は、あくまで、現場での決断のための、

方法論の一つです。

 

(数学的に厳密な立場にこだわる読者にために、

誤解のないように言っておきますが、統計的検定に基づく「決断」は、

あくまで「決断」であって、「証明」ではありません。

統計的検定に基づく「決断」が「論理的に証明できた」ことを保証するような、

論理的根拠は、何一つ、ありません。

「決断」は、あくまで「決断」に過ぎないのです。

「現場での決断のための方法論」とは、まさしく、こういう意味なのです。

だからこそ、統計学に関する文献は、統計をツールとして使うことに徹するような

文献が大量に流通しているのです。)

 

話を元に戻しまして、論理的な立場で言えば、

H(0) と H(1) のどちらが本当に「正しい」のか、

(つまり、どちらが社会科学の理論体系内部で、統計的検定を使わずに

専ら論理的推論のみによって証明可能か)、そのことと検定結果とは、

無関係です。むしろ、統計的検定は、これまでの社会科学の理論体系に、

新しい「公理」を追加する際、H(0) か H(1) か、どちらにするかを決定する

手段だと考えられるでしょう。

 

つまり、「統計的に証明可能」とは、論理的な立場では「新しく公理を認めた」

という意味になるのですが、自然界を視点に考えると、公理や定理の区別は

本質的ではないと思われますので、統計ユーザーの立場では、安心して

統計的検定を使用できると考えてください。

 

 

 

4)統計的有意・無意についてのルール

 

4.1 

 

3.2 で、統計量が棄却域に入らなかった場合。

 

このとき、その統計量は無意と呼ばれます。

このときは、仮説 H(0) が採択されていることに注意しましょう。

 

本当に H(0) が正しいときは、データに偏りがなければ、

通常は、統計量は、棄却域に入りません。

 

統計的検定の技術的理由で、H(0), H(1), および棄却域

の設定の仕方が、そういう風になっていると思って結構です。

 

このときの検定の結果、「無意」については、

 

          仮説 H(0) が成り立つと決断したのだから、

         この「棄却域に入らない」という結果は当たり前。 

 

と言う風に捉えてください。つまり、無意と言うのは、

当たり前の結果が出ただけで、何も情報量のある結果が

出たわけではないという意味です。言い方を変えると、

統計量が無意の場合は、そのときのデータは何も語らない。

データは無に帰せられる。そういう意味で、H(0) は「帰無仮説

と呼ばれます。

 

4.2 

 

3.2 で、統計量が棄却域に入った場合。

このとき、その統計量は有意と呼ばれます。

良く言われる内容として、有意に H(1) が成り立つと言います。

このときは、仮説 H(1) が採択されていることに注意しましょう。

 

ここで、有意と言う意味は、

 

     H(1) を否定するためには、(社会科学の理論的に)

      特別な説明・証拠が必要。

 

と言う意味だと捉えてください。

 

そもそも、

 

「統計量が棄却域に入っているにも係わらず、H(0) が正しい」

 

と言う現象は、通常は、統計データにものすごい偏りがなければ

ありえないことです。つまり、

 

          「統計量が棄却域に入る」

                ↓

       「データに偏りがなければ、H(1) を認めざるを得ない。」

 

と言う構図です。

 

ちなみに、データの偏りの大きさは、有意水準(%)と言う数字で測られます。

それについては、4.3 で解説します。

 

「有意」と言うのは、それだけ、情報量の多い内容を言っています。

むしろ積極的に仮説 H(1) を認めないと、おかしい、と言う意味です。

「無意」のときと違って、今度は、当たり前の結果が出たわけではありません。

 

だからこそ、統計ユーザーの立場では、自分が立証したい仮説 として

H(1)を設定するのです。H(1) が認められれば、それだけ強いことが

言えるわけですから。

 

そういう意味での H(0) の役割は、始めからこの仮説を認めないと言う

予定調和の意味で、「無に帰させる」わけだから、「帰無仮説」と呼ぶ、

そういう言う解釈もあります。

 

4.3

有意水準と棄却域の定め方について。

 

統計の教科書には、有意水準 5% とか、1% とかの記述があると思います。

ここで、有意水準 5% といったら、

 

4.3.1 もし H(0) が正しいならば、統計量が棄却域に落ちる確率

(H(0) を棄却し、H(1) を採択する確率)は 5% である。

 

と言う意味に捉えてください。1% とか 10% についても、同様です。

統計の教科書では、有意水準のことを「第一種の誤りを犯す確率」

と、説明していると思います。(第一種の誤りとは、4.3.1 にあるように、

H(0) が正しいときに、H(1) を採択してしまうことです。)

 5% が 1% になれば、より、有意の精度が上がります。

(また、棄却域の定め方が、統計のルールとして、そもそも、

この 4.3.1 の条件を満たすようになっています。)

 

有意水準を比べてみましょう。

 

      検定の結果、仮説 H(1) が採択されたとします。このとき、

    「H(1) は有意水準 5% で(有意に)成り立つ。」と言うのと、

    「H(1) は有意水準 1% で(有意に)成り立つ。」と言うのでは、

      後者のほうが強いことを言っています。

 

通俗的な言い方で大まかに言うと、前者と後者はそれぞれ、

「H(1) を正しいと決断しましたが、その決断は、5% の確率で間違いますよ。」

「H(1) を正しいと決断しましたが、その決断は、1% の確率で間違いますよ。」

と言う意味です。(ここでの「間違い」の意味は、上記の第一種の誤り

の意味です。)

 

統計量が棄却域に落ちている状態で、もし H(0) を正しいと

仮定するならば、有意水準が 5% よりも 1% のほうがデータの偏りが

大きいと考えられるわけです。従ってこのときは、5% よりも  1% のほう    

が、より積極的にH(1) を採択する理由が大きくなるわけです。

 

つまり、

 

有意水準の数字が小さくなるほど、その検定の精度・信頼性は高い。

 

と、考えてください。

 

参考までに、社会科学では 10% くらい、統計学の講義では 5% くらい、

医療、自然科学の世界では、1% くらいの有意水準で検定が行われます。

 

このあたりになってくると、具体例は数式を出して説明する必要が

出てきます。

 

統計の教科書を見たほうが早いでしょう。

 

以上が、統計ユーザーの立場での、統計の考え方です。

 

最後に、数理統計学の文献をひとつだけ、挙げておきます。

 

P.G. ホーエル「入門数理統計学

 

 

 

 

 

 

文責: Dr. Kazuyoshi Katogi (加藤木 一好)

 

(Yahoo! ブログの廃止に伴い、こちら、はてなブログへと引っ越してきています。)