This page is intended for users in Singapore. Go to the page for users in United States.

そもそも、データサイエンティストの定義とは何か?~ホットリンクVer.~

本日は、R&D部部長榊による『ホットリンクにおけるデータサイエンティストの定義と求められるべきスキルセット』についてお伝えしたいと思います。

はじめに

当社は、「データとAIで意思決定をサポートする」を事業ミッションとして掲げており、特に去年から人工知能技術(※)に長じた人材、言い方を変えればデータサイエンティストの採用と育成に力を入れてきました。しかし、特に社内で「データサイエンティストとは何か」の定義などを作ることもなく、当社に必要な人材のスキルを列挙し、そちらを募集要項に書くことで満足していました。そんな中で、某強面の役員から、ある日
「そもそもうちのデータサイエンティストの定義ってどうなってるんだ?(言外の圧力:まさかないなんてことはないだろうな)」
という有言のプレッシャーを受けるという事態に陥り、「優秀な人を採用するにも社内のエンジニアをスキルアップを図るにも、明確なデータサイエンティストの定義は必要である」ということに去年の後半になってから気づきました。

そんなわけで、当社においてデータサイエンティストに期待される役割を定義し、わかりやすい形でデータサイエンティストの定義を作成しましたので、今日のブログではそちらをご紹介したいと思います。
※ここでの「人工知能技術」とは「機械学習・統計学をはじめとするデータ分析技術の総称」くらいの、いわゆる弱いAIとお考え下さい。

当社におけるデータサイエンティストの定義

前提
当社の主たるビジネスは、「Saasシステムを開発すること」になります。なので、今回整理したデータサイエンティストの定義は「Saasシステムを開発する」ことを目的としたものになります。また、2017年10月時点の技術的な環境を前提としたものになります。

スキルセットとそのスキルレベル
当社でのデータ分析に関わる役割をコンサルタント、リサーチャ、エンジニアの3つに分類し、それぞれに必要なスキルをビジネススキル、リサーチスキル、エンジニアリングスキルと名付けました。また、各スキル達成段階を6段階に分けました。見やすいように各達成段階を1文で表した表が簡易表記、厳密に定義するために各達成段階を詳細に記述した表が詳細表記となります。なお、それぞれのスキルセットの1番下のスキルは「読むスキル」、それより上のスキルは「書くスキル」となっています。さらにそれらのスキルレベルの達成度合いによって、4タイプのデータサイエンティストを定義しました。
このデータサイエンティストの定義を1枚で表現すると下記のような図になります。


【図】データサイエンティストの定義

スキルセット
・ビジネススキル:課題背景を理解した上で、ビジネス課題を整理し、解決する力
・リサーチスキル:機械学習、統計学などの情報科学系の知恵を理解し、使う力
・エンジニアリングスキル:サービス・システムを実装し、運用する力

スキルセット(簡易表記)

スキルセット(詳細表記)


当社において、現在~将来的に必要とされる職業

先に定義した3つのスキルセットのうち2つ以上にまたがったスキルを持つものをデータサイエンティストとして定義します。その上で、それぞれの得意分野によって4つのタイプの職業を定義しました。

フルスタックデータサイエンティスト
3つのスキルセットを高いレベルで保有し、一人でビジネス要件の定義、用いる手法の選定・適用・評価、システムの実装までできるプロフェッショナル(※※)
※※こんな人はレアポケモンくらい見つからないよ


ビジネス系データサイエンティスト(ビジネスデータアナリスト)
ビジネス・経営に関する幅広い知識を有しており、顧客のビジネスを理解し、課題を抽出した上で、リサーチャにデータ分析を依頼し、その分析結果に基づいてソリューションが提案できるプロフェッショナル


リサーチ系データサイエンティスト(Machine Learningエンジニア)
統計/機械学習の知識に熟達し、顧客課題を解決する機能を実現するために適切な手法の選定・デモレベルでの実装および妥当な評価を行うことができるプロフェッショナル


エンジニア系データサイエンティスト(リサーチプログラマ)
システムの実装・開発の豊富な経験を持ち、顧客課題を解決する機能を実現するために必要な環境・計算資源を選定し、サービス要件を充足するように実装できるプロフェッショナル

最後に

今回、役員の鶴の一声ビジネス上の必要性から、データサイエンティストの定義を作ってみました。既存の資料を調査する上で気づいたのは、世間で言われるデータサイエンティストの定義が多様すぎる・曖昧すぎるのは皆さんが指摘する通りなのですが、そもそも「自社のビジネス・組織の現状にフィットする定義」を社外に求めることが間違っていたのだと気づかされました。残念ながら、どんなに適切にかつ汎用的に定義されていても自社にフィットする定義を見つけることは難しいと思います。それよりは、既存の資料を参考にしつつ、自社にとっての「データサイエンティスト」を定義していくことが、自社の求める人材やそれに期待する役割を明確にする上で重要なのではないかと思います。(※※※)※※※まあ、データサイエンティストに限らない話なのではありますが。

余談

なお、この話題は年明け早いうちにブログにしようと思いつつ、うだうだしているうちに、TJOさんの「データサイエンティスト&機械学習(人工知能)エンジニアのスキル要件と、過熱する人工知能ブームが生み出す狂騒曲と(2018年2月版)という記事がバズってしまい、「乗り遅れたから、書くのやめるかー」と思いましたが、むしろ「乗るしかないこのビッグウェーブに」と思い直したのと、TJOさんからも書いてみてはいかがですか的なお言葉もいただきましたので、書くこととしました。

【参考とした既存の定義・整理方法】
データサイエンティストの定義について、下記の既存の3つの定義・整理方法を参考にしています。いずれの定義・整理方法もかなりよく出来ていますが、当社にうまく当てはまらない部分もあるので、既存の定義・整理方法の優れている点をピックアップし、当社のデータサイエンティストの定義を作成しました。
データサイエンティストの定義・スキルセット・スキルレベル(データサイエンティスト協会)
そろそろデータサイエンティストの定義とスキルセットについて本気で考えてみる
データサイエンティストもしくは機械学習エンジニアになるためのスキル要件とは(2017年夏版)

参照元:R&D部部長が語る、ホットリンクにおける「データサイエンティスト定義と求められるスキル」の話

株式会社ホットリンク's job postings
4 Likes
4 Likes

Weekly ranking

Show other rankings