データ分析の基本的なやり方

 

「データ分析」という言葉を知らないという人はほとんどいないと思いますが、では具体的にどのようなことをすることなのか説明してくれと言われると、意外と困ったりはしないでしょうか。

 

統計学の基礎では、平均・分散・分布などのデータの特徴を把握するための手法を学びますが、これらはどちらかというとデータ分析そのものではなく、データ分析を行うための手助けとなるものではないかと思います。

 

データ分析を行う場面は多種多様なので、人によって、あるいは状況や背景によって、やり方や内容も異なるから簡単には説明できないよと感じる人などもいるかもしれません。

 

ということで、今回は「データ分析」のやり方について私なりの理解と説明にチャレンジしてみようと思います。

 

分析を行うときには大きく分けて3つのステップがあると思われます。それは、着目する、分解する、比較するというものです。

 

例えば、あるファストフードチェーンのA店の店長が売上の推移データを見て「先月と今月のうちの店の売上が下がっている。。。なぜだろう?」と困っているとします。そこで対策を打つために、売上減少の原因を調べることを目的として、データ分析を行います。

 

1.着目する

 

まずは、何を分析するのか、対象を定めます。売上減少の原因は何か仮説を立てた上で、それを検証するために何を調べれば良いのか分析の対象を絞り込みます。

 

例えば、近くに進出してきた競合店に客をとられているのでは?という仮説を立てたとすると、「競合店の進出時期」と「客数の変動」の関連性に着目することになります。

 

 

2.分解する

 

次にその関連性を詳しく詳しく調べるために、客数データを分解する切り口を定めます。ここでは競合影響を調べることが目的なので、日別に分解してみます。競合店が進出した時期が分かれば、その前後で自店の客数に影響が出ていると思われるからです。

 

なお、客数を分解する切り口は、常連客かどうか、近隣客かどうか、ランチ目的なのかディナー目的なのかどうか、価格帯別、購入商品別、性年代別などたくさんありますが、分析する対象が定まっていないまま、いきなりデータを見ることからはじめると、大きな回り道をしたり迷走したりすることが多いのであまりお勧めしません。

 

客数を日別に分解すると、客数の減少が始まった辺りはちょうど競合店の進出前後の時期と重なり、客数もおおよそ競合店進出前が100人/日、進出後が80人/日という状況でした。

 

 

3.比較する

 

競合店進出前と進出後を比べると、日別の客数が減少しています。よって、A店は競合店に客を取られたと判断できます。

 

 

実はこの判断は必ずしも正しくはありません。単純に競合店進出前後の時期を比較すると確かに日別の客数は減少しているかもしれませんが、それが競合店の影響によるものかどうかはこれだけではわからないからです。時期的な理由や天候が悪かったからなど別の要因も考えられます。

 

もしこのお店と似たような規模・客層で周りに競合店のないB店があったとします。(チェーンなのでそうした類似店は1軒くらいはあるでしょう)

 

同時期のB店の客数データも調べてみたところ、A店とほぼ同じような変動であった場合、B店は競合の影響を受けていないにも関わらずA店と同様の客数の変動をしていたということになります。

 

つまりA店の客数の変動は、競合店の進出とは関係ないということになります。

 

そうなるとまた別の仮説を検証することになるのですが、ここで重要なポイントは、「何と比較するか」です。

 

最初は、単純にA店の競合店進出時期前後の客数を比較していましたが、それでは不十分でした。その後行ったA店とB店の比較の方が競合店と客数の因果関係を調べる上でより最もらしい比較となります。*1

 

もし比較する対象を誤ってしまうと、分析そのものがおかしな結果になってしまい、それを元にした判断も不確かなものになってしまいがちです。適切な対象と比較することによって、その違いから正しい意味を見出すことが分析の役割となります。

 

 

以上が分析を行うときの3つのステップとなります。

 

1つ目の「着目」は、きちんと分析対象を定めないと、その後の作業が行き当たりばったりになったり手戻りが発生してばかりになってしまいます。2つ目の「分解」は詳細なデータが収集できていないとそもそも分解できないので、ここで行き詰ってしまうことも多々あります。行き詰ってしまうならまだしも、分析対象が未定なままだと、ありもののデータをこねくり回すことに尽力して、労多くして功少なしに陥ってしまう可能性もあります。1つ目と2つ目を通過しても、3つ目の「比較」において、比較対象の選定を間違えてしまうと最後で分析結果も誤ったものになってしまいます。なお、この比較対象の選定の誤りは気を付けていないと意外とよくやってしまいがちです。

 

分析を行うときには各ステップで何をすべきかなるべく意識して気を付けたいものです。

 

 以下続きです。

custle.hatenablog.com

*1:実はこれもベストとは言い切れないのですが、ここではよりベターなやり方としての紹介となります