逆説的データ分析手法

データアナリストは通常「必要と思われたデータ」を抽出・整理してその結果を読み解きます。


必要と思われたデータとは、クライアントから依頼されたデータそのものであったり、アナリスト自身がこのデータを見れば仮説が検証できるかもしれないと判断したデータなどです。


しかし前者であればともかく、後者のように必要と思われるデータが明確でない場合は、試行錯誤の繰り返しになってしまう可能性もあります。


そうした努力を重ねて求めるデータが見つかるならまだしも、結局は労力をかけても成果が上がらなかったということもよくあります。


このあたりはデータアナリスト当人の仮説立案力に問題がある場合もありますが、肝心のデータが十分に蓄積・整備されていないケースもあるため、必ずしも熟練アナリストになれば避けられるとも限りません。


例えば、今度発売する新商品について特別プロモーションを行うために、その商品を購入してくれそうな顧客をリストアップしてメールを送りたいという場合を考えてみましょう。


購入してくれそうな人物像の仮説としては例えば以下などが考えられると思います。


・同カテゴリの商品を購入したことがある
・同ブランドの商品を購入したことがある
・類似商品を購入したことがある
・類似商品と併売されやすい商品を購入したことがある
・自社のヘビーユーザ
・新商品が出るたびに購入することが多い
・前回購入から商品サイクル的に購入しそうな時期に当たる
・割引きやインセンティブによく反応する
・etc


しかし、当然ながら上記は過去の購買履歴データが取得できていないと判別ができません。また商品に関しても、カテゴリ、ブランド、類似かどうか、併売状況、新商品かどうか、購入サイクル、割引情報なども、データとしてきちんと整備されていないと同じく判別は難しいでしょう。


データが不十分な場合、ありもののデータだけを使っても目的のデータを導き出せるかというと熟練アナリストでも厳しいでしょう。


こうした場合に、逆説的なデータ分析手法を行うことで少しでも目的に近づけることができるかもしれません。


それは「購入してくれそうな顧客」を探すのではなく、「明らかに購入しないであろう顧客」を見極めてそのセグメントを除外するというやり方です。(消去法ともいうかも。。。)


長期間取引のない休眠顧客、商品のターゲットとは明らかに異なる顧客、メールを開封しない顧客、などなど。


※休眠顧客は休眠期間、商品のターゲットと異なる顧客は代理購買にはご注意下さい


高い精度とはいえないかもしれませんが、無作為にリストアップするよりは効果が期待できると思います。


また履歴データが十分にない新規顧客はとりあえずすべてリストアップ対象(または非対象)とし、履歴データが十分にある既存顧客で絞り込みを行うという考え方などもあるでしょう。


仮説が思いつかなかったり、仮説を実証できるデータが入手できない場合は、こうしたアプローチをしてみるのも良いかもしれません。


それほど突飛なやり方ではありませんが、しばらく悩んでいる状態が続くと視野が狭まって意外とこうしたアプローチすら思いつかないことも多々あります。


目的のデータが得られなかったとしても、安易に諦めず視点を変えてトライしてみれば多少なりとも道が開けるかもしれませんね。