統計学などを学んでいる人は多くないでしょうが、実はほとんどの人は統計を利用しています。
例えば、ある商品の強度を計測するために落下テストをする場合を考えます。
同じ商品を100個用意して、それぞれ10回の落下テストを実施して、何回目で壊れるかというデータをとった場合、ただ全てのデータを元にして「何回の落下で壊れるか」を導き出すことは危険なので、通常は極端なデータを捨てることになります。
このやり方は統計学の「有意水準」に基づいたやり方です。
それでは、「有意水準」とはどういう意味なのでしょうか。
同じような文脈で使われる「帰無仮説」とはどう違うのでしょうか。
この記事では、「有意水準」と「帰無仮説」の違いを分かりやすく説明していきます。
「有意水準」とは?
「有意水準」とは、統計学用語で、「データを分析するときの偶然や誤差の範囲」を表す言葉です。
確率で言えば1%や5%が「有意水準」と考えられています。
例えば、サイコロを100回振って15回6が出たとすると、統計学的には「有意水準」1%に対して6%なので有意であると言えます。
英語では「significance level」です。
「帰無仮説」とは?
「帰無仮説(きむかせつ)」とは統計学において頻繁に使用される言葉で、「否定されることを前提に立てられる仮説」のことです。
同時に反対の意味を持つ「対立仮説」が立てられるので、「帰無仮説」が否定されることによって「対立仮説」が正しいことが証明されます。
英語では、「null hypothesis」と言いいます。
「null」は「無」であり、「hypothesis」は「仮説」という意味です。
「有意水準」と「帰無仮説」の違い
「有意水準」と「帰無仮説」の違いを、分かりやすく解説します。
この2つの言葉は、統計学のデータ分析で使用されるものです。
2つの言葉を結びつける一番簡単な説明としては、「帰無仮説」を捨てるための基準が「有意水準」であるということです。
序文で例に出した落下テストで、100個の製品のうち、1個だけが2回目に破壊され、残りの99個は9回目か10回目に破壊されたとすると、通常は1%を「有意水準」と考えるので、データを分析する上では、「この製品は2回目の落下で破壊される」という「帰無仮説」を捨てる(棄却する)ことになり、対立仮説である「この製品は2回の落下に耐える」を証明することになるわけです。
「有意水準」の例文
「有意水準」の例文は以下のようになります。
・『一般的には有意水準を1%あるいは5%と見ることができます』
・『有意水準以下のデータは通常は偶然であると考えられます』
「帰無仮説」の例文
「帰無仮説」の例文は以下のようになります。
・『帰無仮説は、対立仮説と対になって使用される概念です』
・『帰無仮説は統計学上ではHで表されます』
まとめ
この記事では、「有意水準」と「帰無仮説」の違いを、解説してきました。
これらの言葉自体は、日常生活ではほとんど使うことがない言葉ですが、実はさまざまな場面で利用されているということは序文で述べたとおりです。
このように、統計学というと難しい学問のように思えますが、実は生活に根付いているということを改めて認識することによって、より的確な分析ができる場合があります。
仕事でよく利用している表計算ソフトの関数のヘルプを見てみると、普段は使うことはないが便利そうなものがたくさんあります。
例えば、TDISTという関数は「t分布」のパーセンテージを返す関数です。
これらを使うことによって新しい分析方法を学ぶこともできます。