シックスシグマ「Analyze」 推定の考え方
皆さんこんにちは! 今日もどこかでカイゼンサポート、Kusunoko-CIです。
シックスシグマの各ステップの手法を、自分の理解確認も含めて記述していくシリーズ。今回は「Analyze(分析)」の段階で使うことも多い、「推定」という考え方です。
改善のProjectをやるにあたり、「今回のテーマは何となく『ここ』って決めました」というのでは、ちょっといただけないですよね。
データにきちんと基づいた問題解決でなくてはならない。
手元にデータを集め、分析(Analyze)して、本当にそこに手を付けるべきかを判断するというのはとても大切なプロセスになります。
説得力も違うし、何より組織への貢献度がまるで違ってきます。
そんなわけで今回は、シックスシグマ「Analyze」における推定です。この問題は果たして、今手を付ける価値のあるものなのだろうか、ということを統計的に推定してみましょう。
統計の手法自体にはあんまり触れませんが、なぜこうした作業が必要になるのかの理解に役立つ内容になっております。
「Analyze(分析)」における推定とは?
「推定(estimation)」というのは、いわゆる「記述統計」と、「推測統計」の二本柱からなる統計学の、この「推測統計」に当たる部分の手法です。
推測統計学の中には「推定」と「検定」とさらに二つの要素があるのですが、そこから今回は推定のお話。
推定とは、
「ある母集団から標本を抽出した時に、母集団を特徴づける母数(パラメーター:平均など)を統計学的に推測すること」(統計WEB)
とされています。
工場などで、製品の品質を確認するとき、すべての製品を検査するというのは、なかなかできることではありませんよね(出来るものもあるとは思いますが)。
こうした中で、得られたサンプルのデータから、その母集団である製品全体が、今品質的にどのような状態にあるのかを、統計学的に推定して判断する。
ざっくり言うと、これが「Analyze(分析)」の段階での推定の考え方になります。
このひとつ前、「Measure(計測)」で取ったデータ(サンプル)から母集団の状態を推測するわけですね。
そして後述するいくつかのパラメーターごとの手法を使って、母集団の今ある姿を推測したとき、本当に今この経営資源(人手・時間とか)を使ってProjectとしてやっていいものなのかどうかの判断をすることになります。
データを取ってみたけれど、確認すると「母集団は規格内でOKそうだった」ということも当然ありうるわけですよね。そうであるならば、これは今回優先して手を付けるべきところではない、ということもわかりますし、限られたリソースを有効に使うためにとても有益な手法になるのが御理解いただけると思います。
推定の種類
それではここで、シックスシグマProjectで使われそうな、推定の種類を確認してみることにしましょう。
- 母平均の推定
– 母分散がわかっている場合と、母分散がわからない場合
- 母分散の推定
- 母比率の推定
です。
Minitab 基本統計グラフ要約
まずはさっそく統計ソフト「Minitab」を使った、グラフによる要約から見ていきます。
今ある工程で、以下のような部品Aの重さののデータが取れたとします。
これをMinitabの、「基本統計グラフ要約」という機能にかけてあげると、以下のようなものができました。
これをもとに話を進めましょう。
母平均の推定
これには
- 母分散がわかっている場合
- 母分散がわからない場合
の二種類がありますが、実務において「母平均がわからないのに、分散だけわかっている」という状況ってあんまりないような気がします。なので基本的には、母平均も母分散もわからないというケースが一般的でしょう。
母分散がわからない時に、取られたサンプルから母平均を推定する。
そうすることで、この(製品の)母集団の平均がある一定の信頼度(95%信頼区間など。後述)で把握されます。この場合ですと、母平均の95%信頼区間は、「98.96g~101.10g」ということがわかりました。
母分散の推定
母分散の推定も同様に、母集団(作られている製品全体)の分散(バラツキの幅)が現状どのくらいにあるのか確認するためのものです。
製品には、必ず規格というものがあって、上に振れるのはここまでOKで下限はここ、という幅が存在します。
今取られたサンプルをもとに、母集団製品のバラツキ具合を推定する。
100回やったら、95回はここにおさまるだろう(95%信頼区間)という分散の範囲を確認し、規格と比べてどうなのかを判断しています。
この分散のレンジが、規格幅から外れてしまっているならば、これはすぐに手を打たないとまずいことになりますよね。
あるいは逆に、悪さしてそうだと思ったのに、母分散推定の結果OKだったということもあるかもしれません。
いずれにせよ、感覚や思いではなく、きちんとしたデータ解析で、次の一手を決めていくのが大切ですよね。この例の場合の標準偏差の95%信頼区間は「1.03g~2.72g」ということがわかりました。
母比率の推定
母比率の推定というのは、データの種類がYes・Noのような二者択一的な場面で使われるものです。
例えば製品に傷があったらそれはNO、すなわち不良として判断する、という場面になりますね。
A工程の製品をランダム200個に選択し、傷などの不良が5つを見つかったとします。この良品の95%信頼区間を確認して、今工程はOKな状態なのか、はたまたすぐに手を打たなくはいけないのかを判断するといった感じです。
こちらの例で言うと、94.26%から99.18%が、この良品の95%信頼区間ということになります。
信頼区間の簡単な説明
母集団の値を実際に取得できる唯一の方法は、母集団のすべてを測定することです。
これがとても難しいことはすぐにわかると思います。例えそれが可能であったとしても、莫大な時間とお金がかかるでしょう(例:母集団=日本人男性全員)。
こうした手間や時間を省くために、抽出されたサンプルを使用して、母集団の値が含まれる「可能性が高い範囲」を計算することが、統計的に可能なことがわかっています。
先人たちの努力の結晶です。これを使わない手はない。
ここで言う「可能性が高い」とは、通常「95%の確率」で語られることが多く、その範囲は「95%信頼区間」と呼ばれています。「母集団からサンプルを取ってきて、その平均から95%信頼区間を求める、という作業を100回やったときに、95回はその区間の中に母平均が含まれる」というのが、この95%信頼区間の意味になります。
残りの5%は、はなから捨てる覚悟が求められるわけですね。とはいえ、95%(別に99%に設定することも可能ではありますが)の確率で「確からしい」と言えるということは、何の根拠もない主張よりも圧倒的に信頼度が増すことは言うまでもないですよね。
まとめ
というわけで今回は、シックスシグマ「Analyze」段階における、「推定」の考え方についてお伝えしました。
このように集めたデータが、科学的に「異常」を示している、ということが言えれば、自信をもってProjectを進めていくこともできますし、また本当の意味での問題解決になりますよね。
改善やいわゆるQC活動を推し進めていくと、とにかく活動するんだ、という気持ちから闇雲に「問題解決」してしまうこともあるようです。
そうした活動は、「活動のための活動」などと呼ばれる状態に陥りやすく、カイゼン活動の本来の意味が失われてしまいがちです。
手段と目的が入れ替わっているというやつですね。
こうした状態を防ぐためにも、方針管理などにおけるいわゆる重点目標の確認やデータによる妥当性で、やって意味ある事象のカイゼン活動に、皆さんの貴重な時間や努力を注ぐようにしていきましょう。
考え方さえ分かっていれば、Minitabなどの統計ソフトが、私たちの代わりに難しい部分の計算を数秒でやってくれます。実務で手っ取り早く結果を出すには、まずはそこからでも始めてみることかなと思います。
ただ長期的には、こうした背景にある統計的な考え方をきちんと理解しておくのが望ましいことは、言うまでもありません。ぜひ短期長期目線でこうした手法を、学んで実務に取り入れてください。
簡単ではないですが、学べば実りの多いのもこの統計やデータ解析の分野になりますので、努力のしがいもありまよ。
今回も読んでいただきまして、ありがとうございました!
ではまた。
こちらは比較的分かりやすく、読みやすい本です。