分析に必要なデータの集め方

人事の領域における代表的なデータ活用に「離職者予測」があります。


各種データから辞めてしまう可能性の高い社員を見つけ出すことです。


離職者予測はそれほど難しいものでもなく、よくある人事・勤務データや面談記録のデータ、定期的に実施されるアンケートデータなどがあれば結構高い精度を出せます。


なんとなく想像できると思いますが、辞めてしまう人間は現職に対してやる気をなくしていたり、ストレスや不満を感じているため以下の傾向が見られることがよくあります。


・面談で現状維持やネガティブな発言が多い
・周りとの関係が良くなく、評判が悪い
・長時間残業が恒常化している
・休みが増えた、残業が減った
・評価が高くない
・評価は高いが給料が低い、役職が低いまま
・転勤など環境に大きな変化があった
・社内イベント、研修などに参加しなくなった
・節目の勤続年数を迎えている
・などなど


もし退職して欲しくない社員の退職可能性のスコアが高い場合は、その影響要因を取り除くように上長等がフォローするなどが行われます。


例えば人間関係であれば部署異動や配置転換、単純なものなら席替えなど。


例えば待遇や給料に不満があるのであれば、昇格や昇給など。


例えばキャリアに関するものならば、彼らの望む経験やスキルが身につく仕事のアサインなど。


こうした対策をとることで離職率を下げることに成功している企業もあるようです。



さて、先ほど離職者予測は難しくないと述べましたが、それは離職要因に関するデータが最近は結構そろってきているからに他なりません。


とはいえ面談などのデータなどはテキストのままで残されていたりするため、構造化するための前処理が結構大変だったりしますけどね。


昨今の風潮からも社員の満足度調査や360度サーベイ、各種研修などを通して、社員の勤務状況や価値観等に関するデータの収集が進んできています。


こうしたデータは人事異動や組織変更などの参考にするという明確な目的をもって収集されているので、離職者予測などにも活用しやすいものが多く含まれています。


できれば分析で利用しやすいようにフリーテキストではなく、選択肢形式等で構造化しておいて欲しいところですが。。。


すなわち、目的を設定 → そのために必要なデータ収集 → 分析 となっています。


これが、とりあえずデータ収集 → データの使いみち(目的)を検討 → 分析 となっていると後で必要なデータが足りないとかデータがなくて分析できないということに陥りやすくなります。


このご時世データは各種業務システム等から取得されていてたくさんあるから、そのありもののデータで十分分析に足ると信じて疑わない人が何故かよくいるのですが、そろそろそんなことはないと認めて欲しいところです。


例えば、材木を適当に集めてきてここにある材料で何か我々が喜ぶ建物を建ててくださいと言っても大工さんも困ってしまうことでしょう。


とりあえず建物を建てるだけならひょっとしたらなんとかなるかもしれませんが、クライアントのニーズに合うものかどうかは博打になってしまいます。それにそもそも材木しかないのに欲しいのは鉄筋コンクリートの建物だったと言われたらどうしようもありません。


データ分析においても、まず最初にそもそも目的は何かを確認するのはほぼ鉄則となっていますが、ざっくりとした目的だけでなくそれを達成するために明らかにしなければいけないことは何で、そのためにどのようなデータが必要で、現状使用できるデータと足りないデータが何で、足りないデータはどうするかといったことも、クライアントと具体的に詰めておくべきです。


特に必要と思われるが取得できてないデータがある場合は、新たに取得するためにシステム改修を行うか、手運用等で収集を行うか、あきらめるかといった判断も必要になります。


手運用でやるとなると、最初の離職者予測の事例のときのように顧客等の対象者に定期的にアンケートや面談などのインタビューを実施したり、あるいは業務ログ等のデータに目検で新たなタグ付けを行ったりするなどのやり方で収集することが考えられます。


一時的にだけ必要とかデータ収集の頻度が低いといった場合は手運用でも事足りるかもしれませんが、それなりの頻度で定期的に収集が必要となればやはりシステム化など自動的に収集できる仕組みやその運用が必要になります。


また最近はデータバンクやオープンデータなど外部からデータを集められるようにもなってきていますが、おそらく業務目的で使えるデータは社内の基幹システムから取得できるログデータがまだまだ主流かとは思いますので、まずは社内システムから目を向けることになるでしょう。


とはいえ新たなシステム導入や既存のシステム改修などは気軽にできるものではないのと、改修してすぐはデータが貯まっていないので分析できるようになるまでさらに時間がかかることも考えられます。そのためできればシステム開発や機能改修等が計画されているなどのタイミングで、業務で再活用するために必要なログの取得も検討項目に入れるよう働きかけるなどはおすすめです。


そもそもデータ活用、データ分析といった言葉の「データ」とは今手元にあるありもののデータのみに限定した言葉ではないはずです。


データアナリストとしては、新たに必要なデータは何か、どうやって取得できるか、その運用をどうするかといった視点も合わせて考えたいですね。