データ分析しないけど、データサイエンティストな人たち

f:id:custle:20190304153713j:plain


データサイエンティストという職業に色んな意味で注目が集まるようになりました。


ただ、新しい仕事でもあり具体的なロールモデルもまだあまりいないので、その業務内容や守備範囲を明確に定義するのは難しく、現状は豪華なスキル要件のみ整理されているようです。そうした状況では特に資格なども不要であるため、データサイエンティストと名乗る人も増えてきました。そしてその関係者もたくさん誕生してきました。


自称データサイエンティストの中には、スキルや経験をごまかしてなんちゃっての人もいるようなのでそうした方は別として、データ分析界隈にて様々な関連職種の人が増えていること自体は業界の発展のため、個人的には非常にWelcomeだと思ってます。


ただ、実際にデータ分析をしないけど、データサイエンティストと名乗る人たちも時々見かけます。データサイエンティストの仕事は、データ分析をする、あるいは機械学習のモデルをつくるだけではないですし、関連のタスクも多々あるのでそうしたいわゆるデータサイエンティストワークをする機会が少なくても別に不思議な話ではないのですが、

データサイエンティスト=データ分析をする人 

という認識の人から見るといらぬ誤解や混乱を招いたり、期待値とのアンマッチに困ることも多々あるようです。(注目をひくため確信犯的にデータサイエンティストと名乗る場合もあるようですが)


そこで表題のような人たちはどんな人たちなのか、私の見てきた人たちを紹介してみようと思います。(一応こんな人たちもいた!ということで全ての方がこうというわけではありません。とはいえ、統計学は深くやりたくないけどデータサイエンティストやその関連職になりたい!等の方々にはひょっとするとキャリアの参考になるかも!?)



★エンジニアなデータサイエンティスト


分析システムや環境の開発・構築・運用を担う人たちです。元々ITエンジニアであることがほとんどで、エンジニアとしてのスキルや経験を備えつつ、プラス分析システム開発に必要なスキルを持っています。


インフラ系では分析環境の構築や運用を主として行います。合わせて分析環境を利用する分析者のためにデータを整備する業務も行います。場合によってはデータサイエンティスト向けにデータを抽出するところまで行うこともあります。


アプリケーション系では、自ら機械学習モデルを開発しそれを機能として組み込んだアプリの開発を行います。機械学習モデルの開発部分に特化する場合は、機械学習エンジニアと名乗る人たちもよく見ます。


元々エンジニアとしてのバックボーンがあるので、ジョブチェンジしたというよりはエンジニアとしての付加価値をさらに高めるために、データ分析領域の技術を身に着けている方が多いように感じます。



コンサルタントなデータサイエンティスト


基本的には自社事業に対してではなく、他社にサービスとして販売・デリバリーします。


そのためクライアントの課題に応じてやることが色々で、人材育成面、業務プロセス面、ビジネスモデル面など色々な領域の課題に対応します。ただやはり投資額が多くアウトプットが形になりやすいシステム面で活躍する人が多いようで、そうした人たちは分析業務を請け負うというよりは、分析業務を行う環境を整える(分析システムやツールを導入する)のがまずもってのゴールとなるため、システム導入前は診断や提案、導入決定後はシステムの要件定義や導入プロジェクトの管理などを行います。


分析業務を請け負う場合は、そもそも何をするのか、アウトプットや成果が事前にしっかり見積れるものでないとなかなかそれなりのお金を出してくれるクライアントも多くはないので、サービスメニューを整えるとか事前にしっかり落としどころを決めるとか、分析業務よりもその前の顧客の期待値コントロールの方が大変だという案件も多いようです。



エバンジェリストなデータサイエンティスト


コンサルや分析ツールなどを販売する企業であれば、それら、あるいは企業ブランディングのための啓蒙活動を行う人です。


プレゼンが得意で、書籍やWeb記事書いてる人も多いですね。メインの仕事が分析ではないため、分析はデモンストレーション等で行う程度のようです。ただ、話に説得力も必要なので、元々データ分析経験はあるという人もいます。中には著名な方もいて、ロールモデルとして紹介されていることも。


他に、現役でデータ分析もやってるけど個人ブランディングや分析業界に貢献したい、人材募集のため、他社がどうやっているのか知りたいなどの目的で自ら積極的に色々な情報をアウトプットする人たちも増えてきています。



★ベンダー管理なデータサイエンティスト


事業会社のIT部門には、ITシステムの開発・構築・運用業務などは全て外部のITベンダーにアウトソースし、当人はベンダー管理やベンダーとの窓口業務を行うといった人がいます。


もちろんそうした管理業務が得意で、コミュニケーションスキルやマネジメントスキルに優れた優秀な方も多々いますが、ITスキル自体は過去に経験はあったとしても長年そうした業務からは離れているので、果たしてエンジニアと呼んでいいのだろうかと疑問に思うものの、職種としては、SE(システムエンジニア)と呼ばれていたりする人たちは非常にたくさんいます。


分析系でも同様に、分析業務を外部のコンサル会社や分析サービスを提供する会社の人間に業務委託で依頼し、彼らの管理を主業務とし、分析業務自体は行わないという人もよく見かけます。元々データサイエンス系の仕事をしていなかったのに、会社から急にデータ活用しろ!AI化を進めろ!データ分析先進企業を目指せ!と言われて、どうすれば良いか困った人たちが外部の専門企業に人材を求めるという風潮なのが原因でしょうか。


こうした立場になると、新たに学びながらデータサイエンティストとしてのスキルアップを目指す人もいますが、なかなか新たに専門スキルを習得するも厳しいので、知識は浅く広く学んでIT業界と同じように分析業務はベンダーに丸投げして管理に特化するという人も多いようです。データサイエンティストを上手く活用して成果を出すためには、この辺りの人たちの管理や企画、調整の力がキーになるような気もします。



★トレーナーなデータサイエンティスト


教育サービスを提供している講師の人たちです。


もちろんデータ分析経験者の方もいますが、そうした方はまだ現役で活躍されてることが多いので、実務としてのデータ分析経験はほとんどない人も今のところは多いようです。それでも教育内容が経験者によってしっかり定型化されていれば、おそらく仕事自体は問題ないのでしょう。ただそうした事情を反映してか、提供される講義やコースも入門編がほとんどで、発展編や実践編といったものはまだあまりない模様です。


しかし今後実務経験者が増えればこの領域にもたくさん人が流入してきて、実践的な講義メニューも充実しさらに新たなデータサイエンティストを育成して総数が増えるという良い循環が期待できます。この分野のサービスが充実してきたら分析界隈の人材や業務も成熟してきたといえるような指標になるのかもしれません。




最初に書きましたが、データサイエンティストの業務はまだふわっとしているので、「分析を行う人に限る」とか「機械学習モデルを作る人に限る」とか限定されているわけではないはず(多分)と思っています。


とはいえ、定義がふわっとしたままだとデータサイエンティストに何かお願いしたい人とお願いされるデータサイエンティストができることにアンマッチや誤解が生じたり、データサイエンティストになりたい人がどのようなスキルを身に付ければ良いのか困ってしまうという問題も起こります。


そのため役割に応じた別のタイトル(機械学習エンジニア、AIリサーチャー、データアナリスト、アナリティクスディレクターなど)を使用する人たちもよく見るようになってきています。


今後はさらにデータサイエンティストの区別を明確にするための定義の整理が進められたり新たなジョブタイトルが増えていったりしていくのかもしれませんが、個人的には分析界隈の中の人たちの間で、変な差別意識や選民意識などあまりない形で、色々活躍する人が増えて業界が発展することを期待したいと思ってます。