フリーワード検索


タグ検索

  • 注目キーワード
    業種
    目的・課題
    専門家
    国・地域

NRI トップ ナレッジ・インサイト コラム コラム一覧 分析コンペティションを活用した体系的スキルアップ

分析コンペティションを活用した体系的スキルアップ

2022/07/20

  • Facebook
  • Twitter
  • LinkedIn

自己紹介

こんにちは、野村総合研究所 システムデザインコンサルティング部の高橋です。

データ分析や機械学習モデルを活用したシステム導入支援などを行っています。

前回「1から10へスキルアップ!社内データ分析コンペのすすめ」では、社内のデータサイエンティストのスキルアップを目的とした、社内データ分析コンペティションの活用についてご紹介いたしました。

今回はその続編として、外部のコンペティションを活用した取り組みについてご紹介いたします。

NRIにおける過去の分析コンペティションの活用方法

NRIシステムコンサルティング事業本部では、データサイエンティストを業務で通用するレベルに育成するために、様々な取り組みを行っています。前回ご紹介した社内コンペティションもそのひとつですが、より多くの学習機会を提供するため、外部のコンペティションも活用しています。具体的には、以前開催されたコンペティションの問題をデータ種別×レベル別に整理し、以下の表のような形で問題集を作成しております。このように整理することで、社員が取り組みたい問題や早く身に着けたいスキルから優先的に取り組めるような内容をサポートしており、データサイエンススキルアッププログラムとして社内に提供しております。

例えば、難易度☆☆★の問題であれば、プログラム参加者に1-2週間ほどで取り組んでもらっています。個々の問題ごとに目標スコアが設定されており、参加者はそのスコアを目指してスキルアップに励んでおります。

外部コンペティションは、講師役の当部データサイエンティストが参加したコンペティションの中から、先進的なソリューションを学べるか、お客様の課題解決に繋がるかといった視点から選定しており、随時アップデートしております。

表. データサイエンススキルアッププログラムの問題集(2022年6月時点)

問題ごとにどのようなサポートをしているか

参加者が取り組みやすいように、講師側から問題ごとに以下のようなコードを提供しております。

  1. Baselineコード + 解説動画
  2. 目標スコアを達成できるコード
  3. さらに上のスコアを達成できるコード

  1. 「Baselineコード」は、参加者がどのように取り組めば良いかわかるよう、簡単なEDA、初手モデル作成の流れを記載したコードです。こちらのコードをベースに取り組むことによって、データ分析に重要なEDAや特徴量作成、CrossValidationの切り方を含むモデル作成の基本を学ぶことができます。こうした経験を積むことは参加者に有益となるため、問題を解くことで自然に多くの時間を割いてもらえるよう工夫しております。コードの解説動画も作成しているので、好きな時間に確認して取り組むことが可能です。
  2. 「目標スコアを達成できるコード」は、各問題において「まずはここまでできるレベルになってほしい」という願いを込めたコードであり、問題集に取り組んだ後に確認するものです。参加者には自分のコードと比較して、データに対する新たな視点を見つけていただき、処理が速くて読みやすいコードをどう書けばいいのかを学習してもらいたいと考えております。
  3. 「さらに上のスコアを達成できるコード」は、コンペ上位者の解法を組み込んだコードであり、問題集に取り組んだ後に確認するものです。コンペ上位者の解法を学ぶことで、エキスパートの視点を学び、分析における引き出しを増やしてほしいと考えております。

参加者の声

上記でご紹介したデータサイエンススキルアッププログラムの参加者の声をいくつかご紹介します。

  • 研修で提供されたサンプルコードは、データサイエンス力・データエンジニアリング力の基礎を習得するための示唆に富んだTipsが記されており、初心者でも自発的に調べながら課題をクリアしていくことができた。
  • Baselineコードを読み込むことで、各データ種別に基本的な可視化方法や特徴量作成方法を学ぶことができる。自身の経験のないデータ種別に対して基礎力を身につけるのに最適だと感じた。
  • 目標スコアが明確に定められているので、スコアを少しずつでも向上させることがモチベーションになる。Baselineからスコアを上げるのは中々難しいが、実現したときの達成感は大きく、スキルアップした実感を得られた。
  • ポケモンという世界的に有名なゲームを題材とした問題もあり、ドメイン知識を活用して楽しみながら進めることができた。(データ解析初心者が勉強する課題として有名なアヤメの分類やボストン住宅価格予測は、勉強になるがあまりワクワクしない)

まとめ

「1から10へスキルアップ!社内データ分析コンペのすすめ」に続き、データサイエンティストの卵を育成するために行っている、分析コンペティションを活用した体系的スキルアップについてご紹介しました。

分析コンペティションは世界中のデータサイエンティストが参加しており、トップデータサイエンティストの知見を学ぶことができる貴重な場です。実業務に応用できる知見も数多く存在します。

過去の分析コンペティションを参考に問題集化し、Baselineコード提供などのサポートを追加することで、一人で取り組む場合に比べて短時間かつ効率的にスキルアップすることが期待できます。

今回ご紹介した取り組みはNRI社内の人材育成を目的とした活動ですが、NRIではお客様の環境やデータを使ってオリジナルのコンペ問題を作成し、運営をサポートするサービスも用意しています。

実務で活躍できるデータサイエンティストを育成するために、分析コンペティションを活用してはいかがでしょうか。

執筆者情報

  • 高橋 俊介

    システムコンサルティング事業本部 システムデザインコンサルティング部

  • Facebook
  • Twitter
  • LinkedIn

DXブログの更新情報はFacebook・Twitterでもお知らせしています。