NECの新人データサイエンティストの方々が、野菜の値動きに関して分析されていました。
オープンデータを使って、野菜の値動きと相関の高い指数は何か?を色々調べられています。
単に相関状況はこうでした、で終わるのではなく、なぜそのようなデータになったのかについても考察を入れられていたのは素晴らしいと思います。
ただ、「なぜこのようなデータを分析したのか?」「そこから何が言えるのか?」「この分析を行うと何が良いのか?何につながるのか?」といった点なども検討され、そのためのシナリオが練りこまれていると、もっと良い分析になるだろうな、とも感じました。
例えばですが、冒頭の分析にあるように、野菜の値動きは需要と供給の関係からも「流通量」の影響を大きく受けていることがわかります。
特にトマトやほうれんそうは流通量の逆数との相関が高いとのことでした。(一方キャベツやじゃがいもは値段が安定していて流通量との相関は低い)
とすると、
「流通量は何によって決まってくるのか?」
「キャベツやじゃがいもの値動きはなぜ流通量の影響をあまり受けていないのか?」
「今後の流通量(値動き)はどうなるのか?」
「流通量が下がる(上がる)時期はどのような対策をとれば良いのか?」
「流通を安定させるにはどうすれば良いのか?」
なども分析によって見えてくると、色々と提言ができたり意味のある分析になりやすいのではないかと思われます。
データを出して終わり、見て終わりではなく、データがなぜこうなっているのか、何が言えるのか、どんな意味があるのか、次にどうすべきか、どうあるべきかなど、どんどん考察を進めていけるような人はデータ分析との相性は高いと思われます。
私が昔事業会社にて、若手のデータアナリストにワークショップに取り組んでもらった際もこうした観点でのレビューをよくやっていました。
うん百人、うん千人というほどサンプルがいるわけではありませんが、それでも、何らかのデータを分析⇒結果を説明&解釈、次は別のデータでそれを繰り返すといった人より、こういう意図でこういうデータを見てみた⇒結果こうだから次にこう考えてこういったデータを見た、などどんどん論理的に考察・検討を進めていけるような人ほど成長速度も速く、有用なアウトプットが多かった気がします。
データを見れば答えがわかるとか、データが答えを教えてくれると思い込んでいる人だと、データ分析の設計やシナリオを考えて考察を進めていくといったやり方ではなく、一回一回データ分析=答え探し(答え合わせ)をしては、もし答えが得られなかったら失敗(次はまた他のデータを探す/手法を試す)、といった感じで都度データを調べてその結果の報告を繰り返すというやり方をとりがちです。
その際どのようなデータを調べるかに関しては、結局はその人の勘と経験で当たりをつけているようなものなので、従来の勘と経験に頼るやり方とあまり変わらない気がします。
データ分析結果を役立てたいとか、意味のある展開につなげたいと考えるならば、分析結果だけでなく、その分析を行う意味、進め方、シナリオなどからきちんと論理的に言語化して説明できる必要があります。
こうした考え方を理解してデータ分析を行う際にも意識できている人は、アウトプットに関して周りから参考になるフィードバックも得られやすくなり、経験を積むことで一層こうしたスキルも洗練されてくるので、成長見込みは高いのではないかと思ってます。
最後に宣伝ですが、もしこうしたデータ分析思考をもっと磨きたいという方は、是非拙講座(↓)もご利用いただけるとうれしいです。(;^_^A
問い合わせフォームからご連絡頂ければ最安クーポンも提供させていただいてます。