ヒストグラム(QC7つ道具)の分析とアクション
皆さんこんにちは! 今日もどこかで改善サポート、Kusunoko-CIです。
今回はQC7つ道具から、ヒストグラムを取り上げてみたいと思います。
こちらも統計学の初歩的なグラフツールであり、データ分布の状態(バラツキ)を見える化するのに役立つ道具になります。
さまざまな種類のヒストグラムの見方や、プロジェクトでどう使われるのか、分析とアクションについても一緒に確認していきましょう。
ヒストグラムとは
ヒストグラムとは、データの出現度数の分布をグラフ化したものです。
現代統計学の創始者であるカール・ピアソンにより開発された、統計ツールの一つになります。
集めたデータをいくつかの区間に分け、縦軸にその区間に含まれるデータの数(人数、個数などの度数)を、横軸にデータの区間をとります。これにより一見棒グラフのようなグラフが出来上がりますが、
- データのバラツキの様子
- 分布の状態や形状
- 規格値に対してどのような状態なのか
を確認することができます。
第二次大戦後日本では、統計的品質管理手法が推進されました。
当初エドワード・デミング博士らによって指導された統計的手法は、実験計画法や仮説検証法など、より高度な手法も含まれていて、今のようにパソコンなどがない時代には、現場での使用がたいへん難しかった。
そのため製造業では、よりシンプルに図式化されたものを実務に活すべく、このヒストグラム含むQC7つ道具が開発され、広まっていきました。
ヒストグラム含むQC7つ道具は、立派な品質統計のツールになります。
ヒストグラムの作り方
ヒストグラムの作り方ですが、エクセルでの作り方に関しては、こちら総務省統計局のページが非常に丁寧に説明してくれていますので、そちらを参照していただくのが良いかと思います。エクセルへの「データ分析」機能の導入から、スタージェンスの公式まで、とても分かりやすく記載されていますね。
ここでは、私たちがよく使っているMinitabというソフトウェアでのやり方を簡単に見てみましょう。
こちらの例は、Minitabサポートページからですが、
シャンプーボトルのキャップが正しく締め付けられているかを確認する必要があります。キャップの締め付けトルクの目標値は18です。無作為に68本のサンプルを集め、トルク量の試験を行います。
という状況であったとします。
集められたデータは以下のようになりました。
ちなみにモノの本によれば、ヒストグラム作成におけるサンプルサイズは100ほど欲しいと書かれてますが、Minitabでは20あればなんとかなる(サンプルサイズ)ようです。
そうしましたら上の「グラフ」から、「ヒストグラム」を選択して、
今は「単純」を選択します。ちなみに適合、グループ、適合およびグループには分布の曲線を加えたり、グループごとの分布を確認できたりします(ここでは機械の1と2)。
そうすると、変数を選択するポップアップが出てきますので、今確認したいデータである「トルク」を選び、OKをクリックすると
あっという間に区間も最適化されたヒストグラムが描かれます。
ここから
- ほとんどのキャップは14~24のトルクで締められていた
- しまりのゆるいキャップは1つ、トルクは11未満
- 分布は正(右)の方向に裾が広がっている
- 目標値(18)の約2倍にあたる33を超えるものも5つある
ということが見えてまいります。
目標値である18に近づける(バラツキをなくす)改善が必要なのがよくわかりますね。
ちなみにシックスシグマのプロジェクトに活用する場合は、このヒストグラムのまま使用することはまれで、同じデータを使い、「記述統計グラフ要約」という機能を選択して、以下のような結果を得ることが多いです。
こちらだと、正規性検定も一度に行えますし、平均や標準偏差、95%信頼区間における検定も同時に行えてたいへん便利です。
正規性が確認できれば検定方法も、どれを使えばいいのか分かりますし、何より改善後との比較も様々な統計量でより行いやすくなりますね。
いろいろなヒストグラム
では次に、様々な形のヒストグラムから、読み取れる情報をそれぞれ考えてみましょう。
ヒストグラムの分布の型には以下のようなものがあります
一般系
山の中央が一番が高く、両端に行くほど度数が小さくなる。左右対称に近い。
工程は良く管理されている状態のはずです。ただ裾の広がりには注意したいところ。
ふた山
明らかに山が二つあり、中央のデータが少なくなっています。
平均値の異なるデータが混ざってしまっていると考えられますので、層別が必要です。
はなれ小島
山が2つになって離れています。
はなれている小島のデータは異常値、あるいは異種のデータ混入の可能性があります。はなれている小島のデータをみて原因を調べましょう。
絶壁
山が右端(ないしは左端)で切れています。
規格外のサンプルを取り除いたデータから作成したなど、測定におかしいところがないか調べます。
櫛歯
一つおきの区間で度数が少なくなって、山がでこぼこになっています。
測定器・測定者におかしな点はないか、確認が必要です(MSA、ゲージR&R)。あるいはエクセルなどを使用しているのであれば、「級」の幅の決め方がおかしい可能性もあります。
ヒストグラムからのアクション
異なるグループのヒストグラム、例えば今回の機械1と2のようなデータがあって、それらを比較したいときには、以下の方法を取ります。
平均の差
異なるグループの平均間の差が、統計的に有意かどうかを判断するには、
- 2グループ:2サンプルt検定
- 3つ以上のグループ:一元配置分散分析(ANOVA)
分散の差
分散(広がり)の間の差が、統計的に有意かどうかを判断するには、次のいずれか行ってください。
- 2グループ:2サンプルの分散検定
- 3つ以上のグループ:等分散の検定
これらの検定を行うことによって、グループ間で本当に差異があるのかを、統計的に判断することができます。シックスシグマのプロジェクトであれば、Analyze(分析)段階や、Improve(実行)での改善施策実行前後の比較の際に行うべき確認です。
例えば機械1と2で、異常が出ている方を何とかしなくてはいけないという場合。
統計的に差異があると判断することで、例えば「なんとなくおかしい」という勘や経験即にのっとっていたものを、データで判断することができます。
こうすることで、「本当に異常が出ているもの」を判定し、大事なリソースを投入するか否かを確認することができるわけです。
あるいは、行った改善施策に効果があったかどうかを、数値で確かめることも可能になります。
ヒストグラムはそうした判断の第一歩にもなっていきますね。
まとめ
いかがでしたでしょうか?
今回は、QC7つ道具から、「ヒストグラム」についてまとめてみました。
使ってみると、思った以上にいろいろな情報を教えてくれるグラフであることがわかります。統計の基礎的なツールであることがお分かりいただけたのではないでしょうか。
これらの理解から、より高度な統計の考え方(正規分布や、工程能力、検定)につなげていくことができますので、きちんと使用できるようになっておきたいものですね。
今日も読んでいただきましてありがとうございました。
ではまた!
基本的なことは網羅されています。