グラフでデータを分析しよう!「散布図」 シックスシグマ「Analyze」

皆さんこんにちは! 今日もどこかで改善サポート、Kusunoko-CIです。

さてこの「シックスシグマDMAICでやることシリーズ」も、今回から「DMAIC」の「A」、「Analyze(分析)」の段階に入ります。

ということでまず分析段階の手始めは、「グラフでデータを分析しよう!」です。

グラフという「図」の形で表示されたデータは、単なる数字の羅列よりも、より感覚的でかつ素早い理解を我々に与えてくれます。

この1個前、「Measure(測定)」では、大量のデータを集めます。そうした データを整理し、意味のある「情報」にするには、グラフによる理解と表現がとても便利です。

シリーズで、シックスシグマで使われがちなグラフを確認していきたいと思います。今回はまず「散布図」から。

散布図

QC(品質管理)7つ道具」の1つでもあるこの散布図は、英語で「Scatter plot」といいます。

あるデータを元にして縦軸と横軸の2つの項目で量を計測し、分布を表現するために使うグラフのことです。縦軸と横軸のメモリを元に、データが該当する場所に点をプロット(打点)することでグラフに情報を書き込んでいきます。

2つの要素からなるデータがあるとします。例えば、ある学校の数学のテストの点数と物理の点数などですね。

散布図はこうした2つの要素の関係を、グラフの上に点を打って(Plot)、視覚化したものです。Plot(打点)してるから「Scatter plot」。

こうすると、1つ目の要素(数学のテスト)と、2つ目の要素(物理)がどう変化しているのかが、とても分かりやすく見えてきます。情報の「見える化」ですね。

これら2つの要素間に、何かしら関係が見いだせるとき、データ間に「相関関係」があるといいます。

因果関係」ではないので注意してくださいね。

相関関係と因果関係の違い

こちらの「相関関係」と「因果関係」の違いについては、多くのサイトでも説明されていますね。

英語で、相関関係は「correlation」、因果関係は「causation」

さて両者の違いですが、簡単に言うと、

  • 相関関係:2つの要素間に、何かしらの関連性があること
  • 因果関係:片方の要因が「原因」となって、もう片方の値を決定させていること

です。

例えばです。

うちの父のふるーいタブレットが、おかしくなった時のお話。

ある日私の息子が、おじいちゃんのタブレットでYouTubeを開こうとしますが、起動しなくなりました。

だけでなく、タブレットもフリーズしてしまう、という現象が続きます。

おじいちゃんは、「孫君、なんかおかしなことしてる? 孫君が触るとタブレットが固まるよ」とちょっと文句(?)。

そのたびに、「やばい弁償か?」とおののきながら、再起動したり色々するのは私だったんですが、You Tube だけでなく、いくつかのアプリがアップデート不能になっていることに気が付きました。

結局もう何をやってもダメで、最終的に販売店に相談したのですが、原因はこのタブレットが低スペックすぎて、アンドロイドを更新できないところにあるとのこと。

要は古いバージョンのアンドロイドでは、You Tube始めどんどん新しくなっていくアプリ自体を受け入れることが出来なくなっていたわけですね。

先程の相関と因果の関係で言えば、うちの息子(孫)が触ることと、タブレットがフリーズすることに「相関関係」はあるけれど、うちの息子が原因ではないので、そこに「因果関係」はないわけですね。

そんなわけで原因結果の「因果」は、「タブレットが低スペックすぎること」にあるということがわかりました。息子のせいではなかった。

パパちょっとビビったよ(笑)。

このように「相関」と「因果」に違いをはっきり認識して使わないと、データというのは読み間違えてしまうんですね。

この辺メディアでもいろいろな間違いがあると思うので(いくつかは意図的な情報操作なのか?)、この「因果関係」の取り扱いには十分注意しましょう。

相関関係はどのくらい?

ちなみにエクセルでもこの「散布図」を書くことができますね。

例えばですが、下のように2要素間のデータを表にして、

グラフから散布図を選ぶだけです。

そしてその2要素間の相関の強さというのも、簡単に計算して出してくれます。これを「相関係数(correlation coefficient)」といいまして、「r=」で書き表します。

相関の度合いを出したいセルに、上の数式バーで「CORREL」を選んで、それぞれ2要素のん範囲を指定すればいいだけです。

ちなみに出てきた数字ですが、以下の表を目安にするといいと思います(諸説あるようですが)。相関があると言うには、だいたい±0.7を目安にしておくいいでしょう。

こちらの例ですと「r=0.9811…」ということで、非常に強い相関であると言うことができますね。

相関係数

それぞれの相関がある散布図は、以下のようになります。

まとめ

いかがでしたでしょうか?

今回は「グラフでデータを分析しよう!」ということで、シックスシグマで使われがちなグラフ、まずは「散布図」を確認してみました。

2要素間の「相関」具合を視認化するのに役立つグラフです。強い相関があることが情報として分かれば、要因をコントロールしてバラツキを押さえる、効果的なアクションが取れます。

大事なことですが、「データ」と「情報」は違います。

「データ」というのはただの数字の羅列です。そして「情報」は、そのデータをもとに、「だからどうすればいいの?」がわかるように解釈されているものです。天気図と天気予報のようなものですね。

データを上手に情報へと解釈して、効果的なカイゼンProjectにしていってください。

今日も読んでいただきまして、ありがとうございました。

ではまた!

Follow me!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA