SNSの何気ないつぶやきから、社会や経済のさまざまな情報まで、いまこの瞬間も膨大なデータ、いわゆるビッグデータが蓄積されつづけています。ビッグデータには社会や地域、企業の課題解決に役立つヒントが眠っていることもあり、これからの時代、データサイエンスへの期待はますます高まっていくと考えられます。
本記事ではそんなデータサイエンスのスペシャリスト「データサイエンティスト」に興味のある学生さんに向けて、有益な情報をお伝えしていきたいと思います。
データサイエンティストとは?
データサイエンティストを目指す学生さんなら、すでにどんな仕事か理解しているかもしれませんが、改めて業務内容や必須スキルを確認しておきます。
データサイエンティストは、ビッグデータを分析し、課題解決や効率化、新商品の開発などに活用していく仕事です。大まかな業務フローは以下の通りです。
1.現状での課題を洗い出し、その原因について仮説を立てる
2.プログラミングでデータの分析を進める
3.分析結果をもとに仮説を検証し、ビジネス課題の原因を探る
4.課題を解決する方法を、具体的に考えていく
厚生労働省の「職業情報提供サイト(日本版O-NET)」によると、「令和元年賃金構造基本統計調査」にもとに算出したデータサイエンティストの平均年収は666.9万円です。日本人の平均年収436万円を大きく上回っています。冒頭でも述べた通り、ビッグデータを活用した地域や社会、企業の課題解決が注目されており、データサイエンティストは将来性のある仕事であると考えられます。
需要が高まっている一方で、データサイエンス学部を設置している大学は、横浜市立大学、滋賀大学、武蔵野大学の3校のみです(2021年4月現在)。とはいえ、学科やコースの設置数は増加傾向にあるので、既存の学部でもデータサイエンスを学習しやすい環境は整いつつあるといえます。
データサイエンティストして世界的に有名なのは、アメリカの統計学者であるネイト・シルバーです。メジャーリーグの選手のパフォーマンスから成績を予測するシステム「PECOTA」の開発や、大統領選挙の勝者予想で一躍有名になった人物です。2009年には、TIME誌が毎年発表している「世界で最も影響力のある100人」にも選ばれました。現在もその能力を活かし、経営コンサルタントや政治アナリストとして活動しています。
データサイエンティストに求められる素養
データサイエンティストに必要なのは、次のようなスキルです。
- データ分析
- プログラミング
- 機械学習(ディープラーニング、テキストマイニング、パターン認識など)
- データ視覚化
- ビジネスや市場についての広い知見
一般社団法人データサイエンティスト協会によれば、次のようにスキルが定義されています。ビジネス(business problem solving)力、データサイエンス(data science)力、データエンジニアリング(data engineering)力。「スキルチェックリスト ver.4」はダウンロードが可能です。
そしてこのようなスキルの基礎となるのが、数学や統計学、情報学です。すでに学習している方もいれば、全く知識がない方もいるかと思います。
具体的には、微分積分や線形代数、確率・統計などの分野です。 実際にデータサイエンスを活用する際には、最低限でも大学初級レベルの解析学や線形代数学を理解していることが必要とされています。次章からは理系と文系に分けて、データサイエンティストになる方法をご紹介します。
理系からデータサイエンティストになる方法
理系なら数学や統計学、情報学を専攻しており、データサイエンスに明るいという方も少なくないでしょう。就職活動においても、データサイエンティストを目指す上では理系のほうが有利かもしれません。
しかし、それはあくまで学問領域から見た話であり、全く知識がなければ理系も文系も変わらないと判断されかねません。下記の診断結果ごとに、大学時代にやっておくべきことを確認してみてください。
□ 数学や統計学、情報学などを専攻している
□ 機械学習やプログラミングを学んだ
□ ある程度、データサイエンスの知識や技術がある
いずれか1つでも該当する→(A)の項目をご覧ください
すべてに該当しない→(B)の項目をご覧ください
(A)ハッカソンに参加する
データサイエンスに関連する分野を学んでいるのであれば、学生限定ハッカソンに挑戦してみてはいかがでしょうか。
データサイエンスは注目を集めていることもあり、協賛企業に有名企業が名を連ねたり、最前線で活躍するデータサイエンティストがメンターを務めたりと、すばらしい環境で切磋琢磨することができます。
他者から刺激を受けるだけでなく、社会に出てからも情報交換のできる仲間に出会えるかもしれません。
ハッカソンは学びの場として優れているだけでなく、就職活動までに箔をつけるという意味でも役に立ちます。たとえ賞や優勝を獲得できなかったとしても、課外活動に取り組んだことでデータサイエンスに対する意欲をアピールすることができますよ。
(B)Python(パイソン)とRを学ぶ
「理系でもデータサイエンスの知識がない」という方はまず、プログラミング言語の習得からはじめるのがよいでしょう。
データ分析で多く用いられてきたのはSAS、SPSSですが、オープンソースのプログラミング言語であるPythonの需要は日々高まっています。もともとSASやSPSSを利用していたクライアントも、Pythonに移行していく流れがあるようです。
Pythonはアプリケーション制作に特化しており、機械学習や人工知能(AI)に強い言語です。Pythonと相互補完的な関係にあるRと一緒にに使われることも多いです。Rは顧客の行動パターンを予測するほか、なぜそうなるのかを説明・理解するための分析に用いられます。
Progate
以下では、Pythonを習得するのにもってこいのサービスを2つ紹介します。
まず1つ目のProgateは、ゲーム感覚でプログラミングを学べるサービスです。基礎コースなら無料で取り組める上、感覚的にプログラミングを学ぶことができますよ。
Tech Academy
Tech Academyはテキストをオンライン上で進めていきます。1人ひとりに学習をサポートしてくれるメンターがつき、1章を終えるごとに理解度を確認するテストのようなものも用意されています。
自分のペースと継続しやすさを両立しているのが、このサービスの最大の特長です。ちなみに、Pythonコースだけでなくデータサイエンスコースも用意されています。
学生さんは社会人より安く受講できるチャンスです。 本気でデータサイエンティストの道を志すのであれば視野に入れてもよいのではないでしょうか。まずは無料体験から始めるのがおすすめです。
(B)統計学を学ぶ
プログラミング言語を学ぶうちに、統計学の勉強も欠かせなくなってきます。統計学に対して、なんとなくとっつきにくい印象を抱いていませんか。
いきなり書籍を購入しても、投げ出してしまっては意味がありません。まずは、Webで基礎固めをしていくのがよいと思います。
以下にリンクを貼っている「統計Web」では、超初歩的なところから統計学を学ぶことができます。筋金入りの文系である筆者でも理解できたので、とてもおすすめしたいサイトです。
市場調査を行っている社会情報サービスが運営しており、情報の信頼性も高いといえます。
文系からデータサイエンティストになる方法
データサイエンティストといえば理系が想起されるかもしれませんが、文系でも経済学部や経営学部、政策学部、社会学部、心理学部などでデータを扱う機会はあります。文系だからと諦める前に、データサイエンティストを目指すための方法を参考にしてみてください。
統計学やデータ分析を扱うゼミを選ぶ
文系学生がデータサイエンスの知見を養う、絶好の場ともいえるのがゼミです。統計学、計量経済学、データ分析などのゼミを選ぶとよいでしょう。内容によってはマーケティングのゼミでも、近い分野に触れることができます。
データサイエンスに関係するPBL科目を受講する
文系の中でも法学部や文学部、国際学部などは、統計学やデータ分析に関係するゼミがほとんど存在しません。そんな学生さんに勧めたいのがPBL科目の受講です。
以下の記事も参考にしてください。
PBL科目とは、地域社会や企業が直面している課題を取り上げ、原因や解決策を探ったり、実際にアクションを起こしたりする授業です。大学によってはプロジェクト科目とも呼ばれています。
PBL科目は前期・後期(春学期・秋学期)をまたいで開講されることが多く、他の授業とは異なり、知識を実践に移していくことが重要視されます。
また、地域社会や企業の課題を見出し、分析、解決していくというのは、データサイエンティストの業務内容によく似ています。テーマによっては、実際のデータ収集・分析を経験できることもあるようです。
直接的に統計学やデータ分析に触れることはなくても、課題解決を行った経験は、データサイエンティストとなる上で非常に重要になります。それでも就職活動で問われるのは、実務に直結する知識であることが現状です。
実務につながる知識も身につけたいという方は、前章「理系からデータサイエンティストになる方法」の(B)の項目も参考にしてみてください。
文系・理系の両者におすすめしたいのが長期インターン
データサイエンティストを目指す、すべての学生さんに勧めたいのが長期インターンです。インターン先の規模や知名度にこだわる必要はありません。零細企業やベンチャー企業でも、とにかくスキルを身につけることと、経験を積むことが大事です。
知識のない人でも、実務に即して効率良くデータサイエンスを学ぶことができます。データサイエンスに限った話ではありませんが、理論や導入で挫折してしまう方がいます。その点、長期インターンはとにかく実践の連続。自ら手を動かすので、理解も深まりやすくなります。
すでに知識のある人も、学生時代に実績を作ることができます。業界の情報収集や人脈構築もねらえるので、アルバイト代わりの長期インターン参加はかなりおすすめです。
就活中の方はこちらの記事もぜひお読みください。就活の幅が広がるので役に立ちますよ。
高校生がデータサイエンティストを目指すには
データサイエンティストを目指すには、専門学校や大学で勉強するのが近道です。本記事では大学にフォーカスを当てているので、データサイエンスに注目した学部学科選びの方法をご紹介します。
データサイエンス学部やデータサイエンス学科が設置されているのは、全国でもそれほど多くありません。これらの大学以外であれば、数学や情報学、経済学を勉強できる環境を選ぶのがベターでしょう。
理系であれば理学部や工学部、情報学部。文系なら経済学部や経営学部、政策学部がおすすめです。学習内容は直結しませんが、データ分析を学ぶのであれば心理学部や社会学部、政策学部なども視野に入れてみるとよいかと思います。
心理学部については以下の記事を参考にしてください
まとめ
- 理系
すでにデータサイエンスの知識があれば、実績作りに取り組んでいく。
もっと知識が必要ならば、まずは統計学とプログラミングを学んでみる。
- 文系
統計学やデータ分析を学べる学部なら、ゼミへの所属はマスト。
無関係の学部でも、PBL科目や長期インターンなど方法は存在する。
- 高校生
数学や情報学、経済学系の学部への進学がおすすめ。
大学生のスキルアップの記事
大学生がやるべきスキルアップ9選
ゼミの選びのコツはスキルアップの視点が重要! 就職の軸にもなる!
通学時間でスキルアップする方法3選【大学生向け】
オンラインサービスを利用したスキルアップ方法