データ分析をどこまで行うかのケーススタディ

データ分析は正解がありそうで、実はそうでもない業務です。


データの集計や統計処理に限れば、正解といえるものはあります。


しかし、どのデータをどの手法を使ってどのように分析するかは、人によります。


データの解釈も何と比較するかで変わってくる可能性があります。


どこまで分析を深堀りして行うかも、担当の人次第です。


例えば、以下の題材について、皆さんならどのような分析を行うでしょうか?(どこまで分析を行うでしょうか?)


なお、批判したいわけではないので出典を述べるのは避けます。(少し内容は改変してます)

ある県で既婚女性の就業率について調べたところ、


20代後半⇒30代前半にかけて、大きく落ち込んでいることがわかった。


これはいったん就労した女性が、20代後半から30代の出産・子育て期に離職することが原因と考えられている。


(その後40代前半くらいにはまた回復してくる)


これを問題として、データ分析を実施。


全国平均と比べてもこの落ち込みはやや大きくなっているので、いくつかの仮説を持って複数の分析手法を使い、全国との違いを調べた。


結果、この県では全国平均と比べて以下が低いことがわかった。


保育所定員比率(保育所定員数の対象年齢人口に対する割合)
・女性正規雇用者割合


そこで以下の施策を予算化して実施することになった


・科学技術などの専門分野に携わる女性を増やすための応援事業
・女性が正規雇用者として働き続けることができるよう企業トップに働きかける事業


いかがでしょうか?


個人的には腑に落ちない点や分析が足りないのではないかという点がいくつか見受けられます。


まず、なぜ全国平均と比べたのか?


ちょっとこれは意図がわかりませんでした。


ギャップを調べたいならば、30代既婚女性の就業率の高い地域と比較した方が差が顕著に出るでしょう。


また全国平均だと明らかに環境の異なる都道府県も含まれるので、その後の対策を考える上でも宜しくない場合が多いです。


都会と田舎、世帯人数の少ない地域と多い地域、女性就業支援にかける予算規模が大幅に異なる地域などは、ギャップを埋めるのが非常に難しく、比べてもあまり意味ない可能性も考えられます。


なるべく環境の近い都道府県と比較する方が、施策の実現性が高くなると思いますので、そうしたところをベンチマークにするやり方もあるかと思います。


上記の施策内容は果たして効果的なのかどうか?


保育所定員比率や女性正規雇用者割合がなぜ低いのかまでは分析がされていないので、施策との関連性が不明に思われました。


直接的には保育所定員を増やす施策が考えられますが、それは実施されていないようです。


上記の施策による効果が本当に見込めるのかどうか、やってみて効果検証されるのかは気になるところです。


もし自分ならば、どうだろうか。。。


保育所定員比率について


保育所定員比率が高くて30代既婚女性就業率も高い地域の状況を分析してみると思います。


そうした地域がなぜ保育所定員比率が高いのか原因を探ってみたいですね。


保育所にかける予算割合が高いのか?(予算を増やすべきか?)


・保母さん/保父さんの割合はどうか?(彼らの人数を増やすべきか?)


またもし過去には保育所定員比率が低かった地域があれば、どのようにして高くできたのかも気になるところですね。


参考にしたり模倣したりできるかもしれないので、具体的なアクション候補を探るという意味ではありではないかと思います。


ついでに、保育所定員比率が高いが30代女性就業率は低い地域も調べて、何か落とし穴や注意点などないかも調べておけるとベターかもしれません。


女性正規雇用者割合について


こちらはちょっと要注意の指標です。


もともと30代既婚女性の就業率が落ち込んでいるのは以下の原因が想定されていました。

これはいったん就労した女性が、20代後半から30代の出産・子育て期に離職することが原因と考えられている。


彼女らは出産・子育てのために離職しているので、それによって正規雇用者割合が下がった可能性が考えられます。


まさか正規雇用者割合を上げるために、彼女らに離職させないようにすることはないでしょうから、単純にそのまま改善すべき指標かどうかは疑問です。


もちろん正規雇用率を上げること自体は反対ではありませんが、これを上げたとしても本来の目的である30代既婚女性の就業率アップに効果的かどうかはわからないのでは?と思います。


そもそも元々の就業率は働いている人の割合なので、非正規も含まれているのではないでしょうか。


なので、非正規⇒正規を増やしたとしても、就業人数そのものは変わらないなんていう可能性もあります。


よって、非就業の30代既婚女性の方に目を向けて、彼女らがどのような方なのか?


彼女たちは就業を希望しているのか?


就業を希望しているのにかなわないのであれば、その原因は何か?


といったところまで調べる必要がありそうです。


最初の保育所定員比率については、保育所の定員がいっぱいで子供を預けられなければ、仕事に復帰したくてもできないという女性がいて、就業率が下がるのは理解できます。


また30代女性だと子供もまだ小さいと思いますので、時短勤務が可能とか有給休暇がとりやすい仕事でないと就業できないということならば、そうしたことが可能になるよう企業に助成金など働きかけることも考えられます。


さらに、子供はいないが就業できていない女性が多いのならば、その対策も必要となるでしょう。


就業支援もそうですが、セーフティネットの強化などが優先になるかもしれません。


いずれにせよ、自分なら30代既婚女性の就業率が低い原因が何かをもっとはっきりさせたいと思うでしょう。


この辺りどこまで分析するかは、やはり人によって違いが出てくるところでしょうね。


データ分析を深堀りしていくことで、適切な施策を見極め、施策の成功率を高められる可能性はありますが、一方で「えいや」と見切り実施した施策が当たるということもあります。


どこまでやれば正解、とまでは言い切れないので難しいところです。


まあデータがなくてここまでの分析しかできない、ということもあったりはします。


ただ、少なくともこの分析におかしいところはないか?


未確認や不足してる部分はないか?


論理が飛躍していないか?


などは自分の中ではなるべくこだわっていきたいと思う部分だったりします。


他者の分析をレビューする際は鬱陶しいと思われたりしてるかもですけどね。