シックスシグマ「Analyze(分析)」統計的仮説検定の考え方
皆さんこんにちは! 今日もどこかでカイゼンサポート、Kusunoko-CIです。
さて今回は、シックスシグマの「Analyze(分析)」段階で使われることも多い、統計的仮説検定の考え方です。
理解すればかなり使える統計的手法ですが、その理解までがちょっと難しいのが現実です。
そんなわけで今回は、この統計的仮説検定の考え方を、シックスシグマと合わせてじっくりゆっくり、分かりやすくまとめていきたいと思います。
統計的仮説検定(hypothesis testing)とは
以前もお話ししましたが、推測統計はサンプルから、その母集団に関する推論を引き出すために使われます。
推論統計には2つのタイプがあって、
- 推定:サンプルから母集団統計を予測
- 仮説検定:サンプルを評価し、それを仮説と比較
です。
今回はこの仮説検定(hypothesis testing)のほうですね。サンプルの統計値から、母集団の姿を推測するという意味では、目指すべきところは推定と同じです。
ではなぜこの仮説検定が「Analyze(分析)」という、データ分析をメインとした段階で使われるのか。
この「Analyze」の一つ前、「Measure(計測)」ではデータの正確性に配慮しながら、改善のターゲットとなる製品やサービスのデータを集めています。
それを推定や、今回のこの検定にかけることで、本当にその製品やサービスに重大な問題があると言えるのかを統計的に判断することができるのです。
実際に検定にかけてみて、「問題があるとは言えない」となれば、行動を起こす前に、限られたリソースを割くムダを避けることができます。
逆に問題があるのであれば、統計的根拠をもって遂行に当たれるわけですから、心強いですよね。
統計的仮説検定の考え方
基本的には否定したいことを「帰無仮説(null hypothesis)」として置きます。
この帰無仮説はH0という書き方をしますが、通常「効果がない」とか、または「違いがない」というステートメントで表されるものです。
たいていは否定したいことがここに来ます。「無に帰ってほしい」ので帰無仮説。
これに対して「対立仮説(alternative hypothesis)はH1と書かれて、この帰無仮説の反対、「違いがある」ということが書き表されます。
例えば今、同じ製品を作るラインAとラインBで、出来上がった製品の平均やバラツキに違いがあるのかないのか、生データからはよくわからない。もしAとBで大きな違いがあるようであれば、改善しなくてはいけない対象となる、そういうシチュエーションだったとします。
「Analyze(分析)」の段階で言えば、統計的な計算をして、この両者に違いがないようであれば、このラインの改善に力を注ぐ必要はない、ということになりますね。
なので、ざっくりこの二つの仮説を書き表すと
- H0:ラインAとラインBの平均(あるいはバラツキ)に違いはない
- H1:ラインAとラインBの平均(あるいはバラツキ)に違いがある
といった感じになります。
これらの仮説をまず立てて、統計的な計算をする。出てきた統計量から違いのある・なしを統計的に確認する、というのが手順です。
またこの仮説検定(推定もですが)、「Analyze(分析)」の次、「Improve(実行)」段階で、実際に行った改善案に効果があったかないかを確認したいときにも、もちろん使います。
むしろそっちの使い方の方がオーソドックス。
一生懸命改善の施策を打って、結果はどうだったのか。やるからには、きちんと問題に対してインパクトがあってほしいですよね。
それを確認できるのが、この仮説検定の優れた点になります。
つまり先述の例で言えば、AラインとBラインの平均のズレやバラツキをなくすような改善策を取った後、実際に効果があったのかどうかを見るため、
- H0:ラインAとラインBの平均(あるいはバラツキ)に違いはない
- H1:ラインAとラインBの平均(あるいはバラツキ)に違いがある
という確認作業に入るわけです。
この場合も、帰無仮説は正しくないと判断されてほしいわけですね(棄却といいます)。やったからには。
いわゆる薬の効果があったとか、医療関係ではこの仮説検定は必須の考え方です。なのでこの効果の確認などが、仮説検定の実例で多く紹介されているのも当然のことといえるでしょう。
仮説検定のやり方
ではここで仮説検定のやり方を、簡単に見てみましょう。
とても機械的な作業になります。
- 調べたい母集団の特徴について,帰無仮説と対立仮説を作る。
- 帰無仮説が正しいと仮定して,検定の対象となる統計量を求める。
- 有意水準 (significance level)αを決める(5%、または1%が一般的)。
- 2の検定統計量の分布において,棄却域 (rejection region)を設定し,統計表から臨界値を求める。
- 標本から検定統計量の値を計算し,この値が棄却域に入れば帰無仮説を棄却し, 入らなければ帰無仮説を棄却しない。
です。
ちょっと難しくなってきましたが、絵で見るとざっくりとしたイメージがわくはずです。
こちらの絵は「有意水準 α 5%の両側検定の場合」を想定しています。
計算で求めた統計検定量が、帰無仮説(「違いがない」方)を仮定して計算すると,棄却域(端っこ)に入った。こんなに端っこに来るなんてかなりレアだ。つまり帰無仮説は間違いだ!(帰無仮説を棄却,対立仮説を採択する)。
この場合、「違いがない」とは言えないので、改善アクションを取るべきだし、改善後であれば取ったアクションに効果があったと言えます。
おめでとうございます。
あるいは、帰無仮説を仮定して計算してみたけれど、統計量は棄却域に入らなかった。結構ありがちな確率だとわかってしまった。「帰無仮説がまちがいだ」とは言えない。なので、この仮説を棄却できず、どうやら「違いがある」とは言えないようだ。
残念でした。
この問題は、今緊急にやらなければいけないものではない。あるいは取った改善アクションには効果がなかった、となりますから、気を取り直して次のアクションを考えましょう。
「カイゼンは巧遅拙速」、どんどん新たな案を試してみる気概を忘れないでください。
いずれにせよ、こうした違いが科学的に判断できますから、「それ根拠あるの?」といわれるようなことはなくなりますし、当然勘や思い込みでやるより精度は上がっていきます。
これが統計的手法を使う、大きな意味になってきますね。
両側検定・片側検定
両側検定
先ほど図にもありますが、棄却域が両側の端っこにあるものが両側検定です。
例えば、先ほどのA・Bラインの例で言うと、これら2つの工程に何らかの差がある、ということを確かめたいのであれば両側検定を使うことになります。
片側検定とは?
棄却域を左右どちらか片側の端っこにのみ置く場合を、片側検定といいます。
例えば改善の施策により、結果として減少の効果があると確信を持っているのであれば、片側検定の左側(数直線的に小さい方)検定になります(H1が“小さい”という記述の対立仮説)。
その逆で、改善施策により結果が大きくなるという確信に基づく検定ならば、片側検定の右側(数直線的に大きい方)の検定を使うということです(H1が“大きい”という記述の対立仮説)。
この片側検定の棄却域は、右左それぞれ下の絵のようになります。
ちなみに、片側検定と両側検定のどちらにするのかは、必ず検定の前に決めなくてはいけません。
よくありがちなのは、結果が出てから、「こっちの検定なら有意になるから、こっちに変えよう」などとしてしまう間違い。
どちらの検定にするかは、目的によって決まってきますので、当然といえば当然ですね。
検定における誤り
今回の最後に、「検定における誤り」についても軽く触れておきます。
判断の精度を上げる統計学ですが、もちろん100%確実というわけではありません。間違える可能性も当然あるわけで、その中身を知っておくことはとても大事です。
この検定における誤りには以下の二つのケースが考えられます。
・第1種の誤り:帰無仮説が正しいのに棄却してしまう誤り
ラインの例で言えば、実際には違いはないのに、違いがあったと判断してしまう間違いです。
・第2種の誤り:帰無仮説が間違いなのに棄却できない誤り
こちらは、違いがあったのに、ないと判断してしまう(対立仮説を棄却する)ケース。
というわけで科学的といえども間違いを犯す確率を、ゼロにすることはできません。
ちなみに第1種の誤りであれば、本当に正しいのは帰無仮説で、間違って棄却域に入ってると判断してしまっているわけですから、棄却域を小さくすれば防げますよね。
あるいは逆に第2種の誤りの場合であれば、対立仮説が正しいのに採択域に入っていると判断してしまっているわけですから、棄却域を大きくすればこうした間違いを減らすことができます。
お分かりだと思うのですが、両者は「あちらを立てればこちらが立たず」みたいな相反する間柄にあるわけですね。
絶対の正解というのはなく、「バランスをうまく取る必要がある(統計WEB)」のだそうです。このへんが限界なんでしょうかね。妙味を感じてしまいますが(笑)
まとめ
いかがでしたでしょうか。
今回は、シックスシグマの「Analyze(分析)」段階で使われることも多い、統計的仮説検定の考え方のご紹介でした。
この辺りを調べようとすると、どうしても数式が避けられず、なかなか他のサイトでは理解しがたいことも多いのではと思います。
「(統計において)数式を使わない説明は、何も説明していないのと同じこと」という偉い先生のお言葉を見かけたこともありますが、ここでは何とか、イメージでこの仮説検定を理解できるように努力してみました。
まずはこうした仕組みをイメージを掴んだうえで、統計ソフトなどを使い実務でいろいろ試してみるというのも一つの方法ではないかと思っています。
そのあとで、きっちりとした数理的な部分の理解を試みる。
実務で使っている分、数学的な部分がわかりやすくなることも、あるのではないでしょうか
PCの仕組みがわからなくても、パワポやネットを使えているのと同じように、まずは結果を出してしまうこと。個人的には、ビジネスなので、そういうスピード感重視のやり方もあっていいと思います。
意味のある改善に着手し、改善に意味のあったことを統計に裏打ちしてもらう。
あなたのシックスシグマ改善を有意義なものにしてください。
今日も読んでいただきまして、ありがとうございました。
ではまた!
確率を扱わないユニークな方法で、統計を説明した本