フリーワード検索


タグ検索

  • 注目キーワード
    業種
    目的・課題
    専門家
    国・地域

NRI トップ ナレッジ・インサイト コラム コラム一覧 ビジネスデータを活用するためのデータサイエンスとデータサイエンティストのスキル

ビジネスデータを活用するためのデータサイエンスとデータサイエンティストのスキル

第2回 データサイエンティストが持つべきスキルとは?

2023/09/13

  • Facebook
  • Twitter
  • LinkedIn

前回は、データサイエンスとは何かについてご説明しました。今回はさらに、データサイエンティストが持つべきスキルについて、説明を加えたいと思います。また記事の最後では、データサイエンティストに限らず、一般の人々がデータを活用する際の注意点や、ChatGPTなどの生成AIが提示する結果を活用する際の注意点についても触れたいと思います。

執筆者プロフィール

システムコンサルティング事業本部 主任研究員 有賀 友紀:
専門は企業のIT活用動向に関わる調査・研究とデータ活用に関わる施策検討

スキルとニーズのミスマッチ

データサイエンティストのスキルとして、多くの方が想像するのは、数学や統計学に関する知識を持ち、プログラミングに長けているといったことでしょう。サイエンティストという言葉のイメージから、理系の博士号を持った専門家をイメージする人もいるかもしれません。大学や大学院で統計学や数理科学を修めた人材が国内で不足しているという議論は、10年ほど前からなされています。国際的な競争力を維持する観点でも、このような人材の育成は重要と言えます。
しかし、全ての企業がこのような高度人材を採用すべきなのかというと、必ずしもそうとは言えないでしょう。むやみに博士号を持つような専門家を雇っても、その専門性が企業側のニーズと一致しないケースがあることは容易に想像できます。一般社団法人データサイエンティスト協会のWebサイトでは、企業が人材に期待する役割と人材が持つスキルセットのミスマッチによって、成果が得られない、経験や能力を活かせないといった状況があることが書かれていますi

求められる3つのスキル

データサイエンティスト協会は、データサイエンティストが持つべきスキルを3つの分野に分けて定義しています。一つは「ビジネス力」で、「課題背景を理解して、ビジネス課題を整理し、解決する力」とされています。二つめは「データサイエンス」で、「情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力」、三つめは「データエンジニアリング」で、「データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力」とされていますii
二つめのデータサイエンスは、統計数理や機械学習のスキルです。三つめのデータエンジニアリングは、プログラミングやシステム開発、システム環境構築のスキルで、ITのスキルと言えます。この二つはまさに、人々がイメージするようなデータサイエンティストのスキルでしょう。しかし、ビジネスの現場で活躍する人々の多くは、一つめのビジネス力を重視しています。私が以前にインタビューをした、ある有名なデータサイエンティストの方は、必要なのは統計学の学位などよりもビジネスの知見であり、業務上の要件を踏まえた発想力こそが重要であると仰っていました。
業務で得られたデータを実際に活用して何らかの施策を実行する場合、多くの人が用いるような手法と、最新の文献に基づく高度な手法とで大きく差が出るといったことは稀です。一方で、業務上の要件をきちんと理解していなければ、全く役に立たない結果を生み出すということもあり得ます。

「ドメイン知識」の重要性

簡単な例として、事故が起きやすい自動車の特性を割り出し、その原因を特定して改善策を検討するという課題を考えてみましょう。例えば、データを解析した結果から「青い車の事故が多い」という法則が見つかったとします。しかし、この結果から、青い色がトラブルの原因であるとは言えません。たまたま不具合の多い車種で、青い色が多く販売されていたのかもしれません。このようなことは、自動車という製品についてある程度の「常識」を持つ人なら想像できます。しかし、自身に知見のない分野では、このような表面的な現象を課題の本質だと見誤りがちです。データを分析するプログラムが、それらを自動的に区別してくれるわけではありません。
データサイエンスの世界では、結果を解釈する上で必要な、その分野の知識をドメイン知識と呼びます。例えば、株価のようなデータを扱うのであれば、株価やその値動きについての理論的な知識が、自動車の走行データを扱うのであれば自動車という機械の構造やその使われ方についての知識が必要ということです。

データサイエンスのスキルを学ぶ

私は実際に、データサイエンスのスキルを育成するための企業内の研修プログラムの作成と実施に携わってきました。そこで実感したのは、大学でデータサイエンスを専門に学んだ人であっても、業務で得られるようなデータを前にして分析に取り組むと、しばしば見当違いの報告をするということです。ビジネスの現場でデータサイエンスに携わるのであれば、先に述べたようなドメイン知識を踏まえて、仮説や分析の方略を考えるような研鑽を積むことが望ましいでしょう。
データサイエンスの実務家を志す大学生から「どのような勉強をすればよいか」と聞かれることもありますが、私は「マーケティング、エンジニアリングなど何らかの具体的な適用分野を想定して、その分野の知識を学びつつ、入手可能なデータで実践を積むべき」と答えるようにしています。統計学やプログラミングの知識は、書籍や、無料のオンラインセミナーなどで学ぶことができます。しかし、多くの教科書に掲載されているような、仮説が最初から明らかとなっている例題では、実践的な力が身につきません。また、ビジネスで扱うデータには、科学研究で扱うようなデータとは異なる落とし穴が数多くあります。それらの落とし穴をある程度予見し、対処するためのスキルも必要です。
このような観点から書かれた書籍やセミナーは決して多くはありません。データサイエンスを学ぶ方も、企業内で人材を育成する立場の方も、この点に注意してスキルの獲得や育成に励んでいただきたいと思います。

データから適切な知見を得るために

データサイエンティストや研究者ではない一般のビジネスパーソンでも、データから何か新しい知見を得たいと考えることはあるでしょう。その際に注意すべきことは、「データのみで有用な知識を得ることはできない」ということです。データ分析の結果は、多くのケースではこうだった、という過去の事実の確率的な表現に過ぎません。分析結果を適切に解釈し、有用な知識を得るためには、課題に関する知識と理論的な思考が必要です。その二つがあって、初めてデータが意味を持ちます。逆にそれらがなければ、誤った方向へと結論を導く可能性があります。
最新の対話型AIシステムであるChatGPTを利用する際も、同じようなことが言えます。ChatGPTは統計的な予測をもとにそれらしい文章を出力しますが、内容の真偽や有用性は、見かけからは判断できません。AIの回答を正しく解釈するためには、結局のところ、自分自身が知識と思考力を持つ必要があるということです。このことは、今後の社会において、私たちが踏まえておくべき一つのポイントであると思います。

  • i   

    一般社団法人データサイエンティスト協会Webサイト「設立の背景と目的」
    https://www.datascientist.or.jp/about/background/(2023年5月7日参照)

  • ii   

    データサイエンティスト協会8thシンポジウム「2021年度スキル定義委員会活動報告 2021年度版スキルチェック&タスクリスト公開 」2021年11月16日

前のページ:ビジネスデータを活用するためのデータサイエンスとデータサイエンティストのスキル
第1回 データサイエンスって何?

執筆者情報

  • 有賀 友紀

    システムコンサルティング事業本部

  • Facebook
  • Twitter
  • LinkedIn

NRI Digital Consulting Edgeの更新情報はFacebook・Twitterでもお知らせしています。