データサイエンティスト レベル表

プログラマレベルというページがとても面白かったのでデータサイエンティスト版つくってみました。データサイエンティストの定義は[twitter:@TJO_datasci]さんのQuantitative analystに準拠しつつ技術面に焦点をあててレベル分けしています。


レベル0

このレベルの人はデータ分析をしたことがありません。最近テレビでよく目にするビッグデータについては何だが凄そうというイメージは持っています。そしてデータサイエンティストという言葉を知らない人が大半です。


ありがちな発言
ビッグデータってすごいらしいね」

レベル1

レベル1の人達は仕事や大学等の課題でExcelを用いた集計や簡単な相関分析などを実施したことがあります。ただし分析にあまり興味を持っておらずデータをニヤニヤしながら眺めている上位レベルの人達を変人だと思っています。彼らにとってビッグデータやデータサイエンティストなんてものは別の世界のお話です。


ありがちな発言
「分析ってなにが面白いの?」

レベル2

レベル2の人達は集計分析に加えて、最低限の機械学習統計学の手法を知っています。SVMやランダムフォレストなどのメジャーな手法を覚え、データ分析が面白くなってくる頃です。しかしながらRやSPSSなどの専用ソフトを常にデフォルト設定のパラメータで分析していたり、特徴量選択や前処理の重要性を甘く見る傾向があります。
近いうちに現実のデータはirisのように甘くないことを知ることになるでしょう。


ありがちな発言
「ランダムフォレスト最強」

レベル3

このレベルの人達は一定のデータ分析の経験を持っており、機械学習統計学の理論についての基本的な部分はある程度理解しています。また欠損データや不均衡データを意識した前処理や目的に応じて利用する手法をある程度使い分けることができます。

同時にデータ分析の世界も奥が深い事を認識し始めます。そしてさらに上のレベルに到達するには数学の知識や学術的な知識が必要だということを知り、機械学習や統計解析の専門書を購入して本格的に勉強を始めます。

また、自分がまだまだ未熟だと理解しているのでデータサイエンティストと自称はしません。ただし大人の事情が絡んでいる場合はその限りではありません。


ありがちな発言
PRML読めるようになりたい」

レベル4

このレベルの人達は教科書に掲載されている一般的な機械学習や統計解析の手法に加えて学術論文を読みこなして実務適用することができます。また本人にとって未経験の課題でも調査をしながら対処できる実力があります。またビジネスの課題を見極めて複雑な手法を使うべき場面とそうでない場面を区別出来るようになります。

このレベルの特徴はパターン認識機械学習が得意なタイプとと統計解析が得意なタイプが混在していることです。また数学的な知識が足りていない部分もあり、ある程度自分の分析力に自信を持ちつつも、本人はまだまだであると認識しています。データサイエンティストとして自称しても問題ないレベルですが、やはり自らをデータサイエンティストと名乗ることはありません。


ありがちな発言
「まだまだプロフェッショナルとは言えないよ」

レベル5

このレベルの人達は分析のエキスパートとマネージャに別れます。エキスパートは博士号取得者が多く既存の論文を応用するだけでなく必要に応じてアルゴリズム開発することができます。ただし全ての分野についてこのレベルを保つことは大変難しく大抵は1つか2の分野についての専門家です。

マネージャはレベル5以下の分析者をまとめてプロジェクトを運営できる人達です。エキスパートほどの知識はありませんが技術的な知識とマネージメント力の両方が必要とされます。一般的にデータ分析大好き人間はマネージメントをするよりも分析をしていたい人間が多いので両方の能力が高くかつマネージャという立場を引き受けてくれる点で大変貴重です。またエキスパートよりもコンサルティング力を求められます。
なおマネージャになるには必ずしもレベル4を通過するとは限らずレベル3から飛び級で昇格することもあります。


ありがちな発言
「大事なのはビジネス理解なんだ」


レベル6

いわゆるゴッド。あるいはデータ分析業界のツチノココンサルティング力、エンジニアリング力、分析力の全てをトップレベルで兼ね備えた真のデータサイエンティストです。しかしながらその存在を確認したものはいなく、業界ではイデア的な存在として扱われています。


ありがちな発言
不明

レベル7

このレベルの人達は世界にイベーションを起こします。常識を超越した彼らにとってはもはや複雑なデータ分析は必要ありません。重要なのは革新的なアイディアと尽きることのない情熱なのです。
彼らは現状改善の延長線上にはない新しい世界を我々に提供してくれます。


ありがちな発言
「Stay hungry, stay foolish」