データサイエンティストと現実。なったほうがいいの?
1.データサイエンティストって何?おいしいの?
2.私がデータサイエンティストではなくコンサルタントである理由
3.楽しことと辛いこと
4.まとめ。21世紀市場最もセクシーなデータサイエンティストになろう!
1.データサイエンティストって何?おいしいの?
データっている抽象的なワードにサイエンスが融合している点に違和感を感じる人が多いんじゃないでしょうか。かく言う私もその一人。
おそらくこのサイトをご覧になられている方はAIとかビッグデータに興味をお持ちの方で、その中でデータサイエンスないしデータサイエンティストという単語を耳に入れたんじゃないかと思います。いったいどんな仕事なんでしょう?
私は外資系コンサルファームに所属しており、その中でデータサイエンティストとして働いています。
今日はそんな私が思う『データサイエンスってなんなん?』という話をしていこうかと思います。
他のサイトなんか見ているとデータサイエンティストは「ビッグデータのスペシャリスト」みたいな紹介をされています。
表向きはその通りなのですが、私が実際にやってる仕事は必ずしもビッグなデータばかりではなく、限られたデータで何か得られるものはないか、とにらめっこすることも多いです。
ビッグデータだけを扱うという考え方は現実と乖離するので改めたほうが良いかもしれません。
差し当たってデータをサイエンスする業務を実業務ベースでお答えすると、
・大きなデータから新しいデータを作る
・少ないデータから新しいデータを作る
以上の2つに大別される、個人的には思ってます。
勉強された方であれば後半は推計統計に当たるのでは、と思われたのではないでしょうか。
そのとおりであり、統計学まで含めてデータサイエンスの領域と考えるべきでしょう。
データサイエンスの目指すゴールはビジネスに直結するアウトプットを出すことであり、そのためにはどちらの知識も求められるケースが多いですね。
じゃあデータアナリストとの違いは?といった話もありますが、データ探索やデータビジュアライゼーション(要はグラフかきかき)とかがメインなのかなと。
この辺は個人の感覚に依存する、ということで…
しかし大事なのは、どちらも分析業務であることに変わりなく、そしてどちらの分析も『仮説を検証するためのプロセス』の一環に過ぎない、ということです。
データサイエンスはただそのプロセスにおいて統計や機械学習など一見複雑そうに見えるツールを使う、ということになります。
さらに言えば、ビッグデータを管理するためには大規模でコストのかからない管理先が必要になります。
そのデータベースを作る技術も必要ですし、そのデータベースから効率的にデータを抽出・加工する技術も必要になります。
以上、まとめになります。
- データサイエンスはビッグデータ(機械学習)だけでなく少ないデータでデータ加工する(統計)ことも多い
- データサイエンティストは仮説検証プロセスとして機械学習や統計を使用する人
- データベースに関する知識も必要
2.私がデータサイエンティストではなくコンサルタントである理由
先ほどの紹介したとおり、私は転職して現在コンサルファームにいます。といっても、転職活動時はコンサルになりたいとは毛頭思っておらず、データサイエンティストになりたいと思ってました。
じゃあなぜコンサルなのかという話ですが、結論、20代の私がデータサイエンスをやるにはコンサルぐらいしかなかったわけです。
確かに求人情報にはデータサイエンティスト募集と書いてあるものがありますが、経験3年以上だったり、面接までこぎつけていざ話し手を聞いてみると「まだデータもない、データベースをこれから作るところなんだよね〜」というケースが大半なのです。
特に後半のケースは多かったです。
AIだなんだと騒がれている時代ですが、その実源泉となるデータ(特にビッグデータ)の扱いを熟知している企業などほとんどないんだ…と転職活動をして痛感しました。
そんな中未経験者でデータサイエンティスト募集となると、海外からの最新情報提供があり、インプットすることに時間を使うことを許容してくれる外資系コンサルファームぐらいしかなかった、というわけです。
ちなみに私は英語は全くしゃべれず、今も大苦戦中だったりします。笑
コンサルというと高いフィーを企業に要求し、そのフィーに応じて提供するレポートの範囲が決まります(これをスコープといいます)。
達成可能な範囲で分析スコープが決まり、そこから最適な分析手法を決めるため、その範疇で結果を出すことにおいて、はコンサルファームのデータサイエンティストは最強なんじゃないでしょうか。
またプロジェクト単位で何回も同じことをやってるわけなので、説明の難しい機械学手法なんかを経営陣に伝えるスキルなんかも高く、結果としてコンサルにデータサイエンス業務を委託するニーズが高いというのもありますね。
3.楽しことと辛いこと
私がまだ新卒だったころ、上司から言われたことの一つにこんなものがあります。
「いいか、若いうちは何かビジネスアイデアを言っても誰も聞いてくれない。唯一上司である俺がお前に期待するアウトプットは、数字それだけだ。」
厳しい上司でしたが、その通りだと思いましたし、今もそう信じています。
ビジネスにおいてどう舵を取るか経営層なんかは頭を悩ませているわけで、そのかじ取りを決断するためにはどうあがいても数字から読み解くしかないのです。
先に説明した通りデータサイエンスは新要素を科学的に導き出すプロセスの一つです。
使用する統計学であったり機械学習を構成する数学を理解することは中々骨が折れる、というか文系にはハードル高すぎるわけなんですが、データからワオ!と言いたくなる結果が出てくるのは非常にエキサイティングです!
それが経営層に刺さりビジネスにつながったりすると、冥利に尽きるというものです。
また文系には厳しい、みたいな書き方をしてしまいましたが、必ずしもそうではありません。
かく言う私もバリバリの文系出身ですし、おおよその素養は社会人になってから身に着けた人間です。
今の時代書籍にサイト、Youtubeなど様々な方法で勉強することもできる前提はとてもありがたく、ある程度まで数学やプログラミンが理解できれば誰でもデータサイエンティストになれる、と私は信じています。(文系がデータサイエンティストになるための方法は後日掲載したいと思います)
そして一番肝心なのはお給料。
結論ですが、基本高いです。
正しくは給料の高い職種の中にデータサイエンティストが存在することが多いために高くなっているというのが事実でしょう。(コンサルや大手エンジニア)
そしてこれから需給のバランス上どんどん給料が高くなっていくと思います。
つまりは経営陣からの需要は高まるものの、教育体制が不十分なため寡占が始まるものと考えられます。
一方、良いことばかりではなく、大変なこともあります。
大変なことの数だけで言えば良いことよりおおいですね笑
網羅的に書いちゃうと、
- データ分析を行うまでの泥臭い作業が多い(分析定義、データ収集、データクレンジングなど)
- データが十分にそろうことが少なく、多くの方法は断念せざるを得ない
- 分析自体が一度で終わることはほとんどなく、何度も繰り返し分析する必要がある
- せっかく出た結果が上司からの納得が得られず、お蔵入りになるリスクがある
などなど。
まあどの仕事でも同じことですが、たくさんある大変なことよりも良いことを大きいと感じる人が向いているでしょう。
私なんかは不確実性の高い営業の数字で頭を悩ませるくらいなら分析結果に悩む方がずっとマシだと感じます笑
文理は問いませんが、データを読み解くことに楽しさを持てるかが最も大事であり、その過程で存在する少なくない工数を楽しめるかが決め手だと思います。
4.まとめ
統計学や機械学習の歴史自体は長いですが、データサイエンティストが世に普及しだしてからまだ年月が過ぎてはいません。
AIブームの影響が大きいとはいえ、この短期間でここまで注目された職種もそうないんじゃないでしょうか。
データサイエンティストは21世紀市場最もセクシーな職種である、とどこかのお偉いさんが言ったそうな。
是非是非若い人たちはチャレンジしてみてはいかがでしょう。