St_Hakky’s blog

Data Science / Human Resources / Web Applicationについて書きます

データサイエンティストとは何か今一度考える - 1

こんにちは。

サンディエゴに来ていろいろ刺激になり、勉強することも多いわけなんですが、正直いつも海外に行くと課題ばかり見つかって帰るような気がします。今日は、こっちに来て2週間が経ってから、悶々と考えていることについてまとめます。

○このままでいいのか。

こっちに来てからいわゆる単刀直入に聞く、みたいな感じのものが多いんですよね。英語独特かもしれませんが、「何をするの?」とかそういう感じです。んで、残り2週間を切った時にこっちでプロジェクトやってるPMから「君は何を勉強できたんだい?」と聞かれて、まぁそりゃあいっぱい勉強しましたよと答えたんですね。

将来はデータサイエンティスト職についていろいろ活躍したいなぁ(長くなるので割愛)、と思っているわけなんだけど、今までやってきたこととかをこの質問でミーティングの最中におもむろに振り返ってしまって、なんでもそこそこできるけど何にも深めにできない病になってるなぁと。

これはまずいと正直思うわけなんです。なぜなら、普通はチームで行動とかをすると思うんですが、その時に専門性がないと、君は何のためにいるのかとなるし、専門性が高いチーム編成になればなるほど、何でも屋は浮いてしまう。そりゃー繋ぎみたいな存在は必要かもだけど、ある程度専門性は持っておきたいわけなんです。

とまぁ、ここまで来てこのままでいいのか的なことを考えてしまう。専門性が必須だなぁと。

○どうするのか。

これは割と重要な問題ですし、今後の就職活動にも関わってくるなぁと。データサイエンティストってそもそも曖昧な存在だし、名乗っている人によってなんか違うしみたいな笑(これはどれもそうか)。会社に入ったらそれこそ部署ややることによって変わってくる部分もあると思いますが、、、。

ビジネスを僕はしたいタイプなので余計にややこしいんですが、そのタイプのデータサイエンティストでよく言われるスキルは大きく分けて3つあると思っています。

【主要3大スキル】
・統計/人工知能系の知識とその現場への応用
・ビジネスへの興味、知識
・ITエンジニアのスキル

これと似たようなことは、以下でも言及されています。

qiita.com

qiita.com

うん、まぁ普通に考えると、こんなスーパーサイヤ人はどう考えてもひょいひょいイネーゾ、と。これほどまでのスキルセットはなかなかいないんじゃないかなぁと思います笑。

僕も似たようなことを考えて、学生時代はスキルを身につけたつもり&結果的にそうなっていたのですが、実際専業たちには勝てないなぁと。なので、最近の結論は「まずは1分野を徹底的に鍛えて他分野もそこそこ伸ばす」というのがいいのかなと。まず1つこれだと言えるものが欲しいんすよね。

○何に重きをおくのか

個人的には、ITエンジニアのスキルに重きを置いて
・データの前処理
・モデルを利用して、プログラムやシステムの設計
・データ可視化
あたりを身に付けたいな、と。

これでも範囲は広いなと実感するわけなんですが、統計屋として数学のロジックを0から組むことはできないけれど(つまり、証明ガリガリして作っちゃうみたいな)、ある程度その内容を理解、アルゴリズムちっくに組み立てることはすることができるようになって、それを実際にビジネスシーンに適用できるように理解して、そこからプログラムを実装してシステムに持って行くスキルセットを持てばいい、と考えています。

そうすると、人工知能/機械学習/統計/自然言語処理などのいわゆるシステムが深く関わる分野を理解できるようにしつつ、またデータの対象への理解(ビジネスへの理解)をして、実装やフレームワークなどを追えばいいとなるわけです。

とりあえず、今日はこの辺で。