統計的検定 1 サンプルの分散の検定(DMAIC)
皆さんこんにちは! 今日もどこかでカイゼンサポート、Kusunoko-CIです。
「統計的検定」シリーズ、今回は「1 サンプルの分散」です。またMinitabを使って、検定のやり方確認エントリーになります。
1つ母集団からサンプルを取り出し、分散が目標値と比較してどういう状態なのか判断する手法です。
改善活動がどんどん進むと、こういうテストも必要になってきますので、ぜひ覚えておきたいところです。
1 サンプルの分散の検定とは
1 サンプルの分散の検定とは、1つのサンプルの分散を使用して、その母集団の分散を推定し、その値が目標値と比較してどういう状態にあるのかを判断したいときに使われる検定です。
たとえば、冷凍ピザ工場。
製造している冷凍ピザの重さの分散が、目標値と比べてどうなのかを判断したいときなど、この1サンプルの分散検定を使うことになります。
1サンプルtテストに似ていますね。
あちらは平均を使った検定でしたが、この1サンプルの分散検定は、分散(標準偏差)に着目して、いずれの場合も設定した目標値と比較して判断するための手法になります。
ちなみに母集団から取り出したサンプルの、いわゆる「不偏分散」が従う分布が「カイ二分布」と呼ばれるもので、この分散の検定は「カイ二分布」を使用し判断を行っています。
またMinitabでは、どの連続分布でも有効なボネット(Bonett)法による検定結果も併記してくれます。Bonett法に関しては驚くほど情報が少ないですが、こちらの方ですね(Bonett D. G. 2006. Robust Confidence Interval for a Ratio of Standard Deviations. Applied Psychological Measurements)。
1分散のデータで気をつけたいこと
正しい結果を得るためには、以下のような点に注意しておく必要があります。
サンプルデータはランダムに選択
統計では必ず無作為(ランダム)にサンプルを得てから、母集団を推測します。これは基本中の基本ですので、この検定に限らずですが、留意しておく必要があります。
サンプルデータの正規性とサンプルサイズ
先にも述べましたが、Minitabでは1 サンプルの分散検定に、カイ二乗検定とボネット(Bonett)とを使用します。
ただしカイ二乗検定は、抽出したサンプルが正規分布に従っていないと使うことはできません。
一方ボネット(Bonett)法では、サンプルサイズが40以上であれば、データに多少の偏りがあってもきちんと検定してくれるようです。
ただしサンプルサイズが40以下の場合は、データをグラフで視覚化して、ゆがみや異常な観測値がないかを確認しておく作業が必要とのこと(Minitab ヘルプ)。
Minitabの場合は、どちらの結果も表示されますので、両方の検定結果がどうなったのかを比較しながら判断を下すのが良いとされています(後述)。
正規性の確認
カイ二乗に限らず、ほとんどの検定の条件は正規性にあります。
まずはこの正規性を確認しておかないと、結果の信頼性は損なわれてしまいますので、必ず事前に確認しておきたいところです。
以下、今回のエントリーで使う「納入リードタイム」サンプルデータの正規性を、Minitabで確認してみました。
今回選んだのはAnderson Darling検定。p値が「0.633」で0.05より大きいので、正規分布していると判断しています。
これもMinitabだと一瞬なので、本当に便利です。
1 サンプルの分散の検定 with Minitab
ではここで、Minitabを使って1 サンプルの分散の検定を実際に行ってみます。
ある会社での部品発注に関わる事例です。発注から納入まで、平均納期が7日、標準偏差が2.5日とするようにと社内規定で決められています。
現在状況は深刻で、納入に大きなばらつきが生まれてきました。そこでこのばらつき削減のため改善Projectが行われた、というのが背景です。
一連の問題解決活動を経て、改善後の納入リードタイム(LT)データ20件を集めています。
実際に改善されたかどうかを確認するため、改善後のやり方が導入されてからの納入LTのばらつきについて、1 サンプルの分散の検定を行います。
いつものように、信頼水準は95%に設定したいと思います。
検定のための仮説を設定しましょう。
- 帰無仮説H0: s = 2.5(改善後も変わっていない)
- 対立仮説Ha: s < 2.5(改善で短くなった)
このH0が棄却されてほしい(変わってないことはないと言いたい)わけですね。
「統計」→「基本統計」→「1 サンプルの分散」を選択します。
出てきたポップアップに調べたい列のデータ(納入LT)を、また目標値となっている標準偏差「2.5日」を記入。
オプションをクリックして、信頼水準を95.0に設定。また対立仮説は目標値である2.5より小さくなっていてほしいので、「標準偏差<仮説標準偏差」を選択します。
OKをクリックすると以下のような、カイ二乗とBonett、両方の結果を得ることができました。
いつものように、p値を確認しますが、今回は残念ながら、両検定とも「0.05」を大幅に超えてしまっていますね。
帰無仮説を棄却できない、つまり改善Projectで行ったアクションは効果がなかったことになります。
目標となっている標準偏差2.5日よりばらつきを小さくするためには、また他の施策を検討・実行しなくてはいけないことがわかりました。
改善は「巧緻拙速」です。こういうこともあります。めげずにどんどん小さなPDCAを回していきましょう。
トライ&エラーの精神です、と次を考えられるのも、こうした統計的手法で科学的に効果の検証ができているからですよね。
根拠あるの? とは言われなくなりますよ(笑)
カイ二乗とBonettの結果
さて二つ出てくる検定結果の見方に関してです。
二つ出てきてどっちを信用すればいいの? という疑問がわきませんでしたか? 私は気になって気になって仕方がなかったのですが(笑)
こちらきちんとした手順を踏んでいれば、ほぼ同じ結果(p値に対して)が得られるようです、と私のメンター(マスターブラックベルト)より。
例えばデータの正規性が確認されているとか、サンプルが十分かつランダムに取れていた、というのが「きちんとした」手順になるわけですが。
ただ時折、両者の結果がp値に対して異なっていることもあります。あるいは両者の結果共に、「0.05」というボーダーぎりぎりにある場合もあるでしょう。
そのような時は、「もう少し様子を見ましょう」です。
サンプルが少ないのか、データにゆがみが出ているのか、いずれにせよ、早急な判断はできない状態になっています。
当然状況によって取れるアクションは変わってくるとは思いますが、現状ではまだグレーゾーンですので、プランBを考えておくことをお勧めします。
PDPC法的な感じの思考で、次に備えておくといいかもしれませんね。
まとめ
いかがでしたでしょうか?
今回は、「統計的検定」シリーズの「1 サンプルの分散」でした。
1つ母集団からサンプルを取り出し、分散が目標値と比較してどういう状態なのか判断する手法でしたね。
とはいえ、改善初期の段階では、この「1 サンプルの分散」を使った検定を使用することはあまりないかもしれません。
というのも、1サンプルt同様、すでに目標値が設定されていることが前提になるからですね。そしてこの場合は「分散」。
統計的品質管理の入り口から、この分散で工程を管理しているというのはあまりイメージがわかないのではと思います。
改善を進めていく中で、検定などの手法を取り入れていった結果、様々な統計量を使った管理というものも発生してくる。そうすると必然的に、この「1 サンプルの分散」検定も使用される機会が出てくることになります。
いずれ改善活動がどんどん進むと、こういうテストも絶対必要になってきますので、ぜひ覚えておいてくださいね。
今日も読んでいただきましてありがとうございました。
ではまた!
このシリーズは、説明も平易で分かりやすいです。