1から10へスキルアップ!社内データ分析コンペのすすめ
自己紹介
こんにちは、野村総合研究所 システムデザインコンサルティング部の清水です。
データ分析PoCや機械学習モデルを活用したシステム導入支援などを行っています。
今回は社内のデータサイエンティストのスキルアップを目的に、社内データ分析コンペティションを活用した取り組みついてご紹介します。
駆け出しデータサイエンティストの悩み
現在は社内外含めデータサイエンティストになるための研修講座や本、情報などが溢れています。もし「データサイエンティストになるためには何から始めたらいいの?」という悩みをもった方は、ネットや書店でちょっと探すだけで参考になる情報をすぐに見つけられるでしょう。
ただし、それだけでデータサイエンティストとして仕事が出来るようになるというわけではありません。大半の人は、簡単な機械学習モデルを使って学習・予測が出来るレベルまでであり、実際の業務で求められるスキルレベルとは大きな隔たりがあります。実践で使える特徴作成やモデルのアーキテクチャ作成などは、多くの問題を解くことで身に付いていくものですが、研修講座や本だけでは十分ではありません。一方で、そうした駆け出しデータサイエンティストを対象にした実践的な学びの場は少ないのが現状です。
そこで私たちはデータサイエンティストの卵を業務で通用するレベルに育成するために、社内でデータ分析コンペティションを開催することが効果的だと考えました。このコンペティションを、データサイエンティストの実際の業務で必要なスキルを、参加者同士が互いに教えあい、楽しみながら段階的に習得していけるような場にしたいと取り組んでいます。
社内データ分析コンペティションを開催する上で気を付けたこと
データサイエンス界隈ではKaggleを始めとした国内外でデータサイエンス力を競うコンペが開催されており、個人やチームで同じ課題に取り組み、コンペ終了後には解法を共有する文化があります。コンペの良いところは、参加することで、自分自身のスキルアップを図れることです。チームメンバーや他のチームとのやりとりを通して問題解決の思考法を学ぶことができ、新たなノウハウやスキルをごく自然に吸収することができます。
こうした社外コンペを参考に、自作データを使った社内コンペを開催しました。開催するにあたって気を付けていたことは4つです。
- データサイエンスに興味をもって取り組めるように、身近なデータを使って問題を作成すること
- 参加者にはコンペ終了後に解法を共有してもらうこと
- 問題作成者が初心者向けに解説する場と、モデルと特徴を深堀して精度をさらに向上させるための方法を紹介する場をそれぞれ設けること
- 短期集中で学ぶことに焦点を当て1~2週間で開催すること(通常Kaggleを始めとした社外コンペは2,3カ月にわたって実施)
過去の開催例
これまでに3回開催していて、いずれも身近かつ興味をひくテーマで問題を作成しています。
-
1回目:
ゲーム ポケットモンスターを倒したときの経験値を回帰予測
-
2回目:
ゲーム ポケットモンスターの対戦における勝敗予測
-
3回目:
Spotifyの曲のお気に入り登録予測
いずれもデータや問題設定には問題作成者自身が集めたデータセットを使用し、特徴作成のアイデアが思いつきやすいような身近なテーマで楽しくデータサイエンスを学べるように工夫をしています。
参加者の声
参加者は1~2週間のあいだ、業務終了後に平均して1~2時間/日ほど取り組んでいるようでした。
既にデータサイエンティストとして活躍されている方をはじめ、新人や中途キャリア人材からの参加やグループ会社からの参加もあり、参加者のデータサイエンススキルレベルは様々でした。
社内コンペに参加した人の声をいくつか紹介します。
- 扱いやすいサイズ、かついろいろなアプローチができるデータで面白かった。
- 身近なトピックで分かりやすく、またドメイン知識をどう生かすのかという点でも参考になり、とても良かった。
- 初心者向けの講座も度々実施いただいて非常にわかりやすかった。
- データやコードの具体的な説明などがあったのは良かった。
- 重すぎないデータボリュームなので試行錯誤がしやすかった。
- 解説講座がコード付き&見直し可能で理解しやすかった。
この「参加者の声」は、コンペ終了後に行った参加者同士の振り返り会で、参加者が実際に語ったものから拾い集めています。なお、この振り返り会は、参加者自身の取り組みを紹介したり、分析技術を共有したりする情報交換の場として有効活用してもらっています。
振り返り会の様子
振り返りメモ抜粋
まとめ
データサイエンティストの卵を次のレベルに育成するために行っている、身近なテーマを題材とした社内データ分析コンペについてご紹介しました。コンペ終了後に振り返り会を実施することでデータサイエンティストの実業務で必要なスキルを、参加者同士が互いに教えあい自分に足りなかった要素を明確にすることが出来ています。
こうした社内データ分析コンペのようなデータサイエンティストのコミュニティを育てることは重要です。コミュニティを通して得た知識や技術は、実業務に応用できる部分が多く、一人で取り組む場合に比べて短時間で大きな成果が期待できます。
NRIではこの社内データ分析コンペをお客様の社内環境へデリバーするサービスも用意しています。こうした育成の文化を根付かせるために、社内データ分析コンペを活用してはいかがしょうか。
次回は、コンペでの苦労話や社内の声などを発信しようと思います!
執筆者情報
DXブログの更新情報はFacebook・Twitterでもお知らせしています。
新着コンテンツ
-
2024/09/17
自民党総裁選討論会:経済政策の具体的な議論は深まらず:高市氏は日銀の利上げに明確に反対
木内登英のGlobal Economy & Policy Insight
-
2024/09/13
ECBのラガルド総裁の記者会見-Que será, será
井上哲也のReview on Central Banking
-
2024/09/13
ECBは予想通りに0.25%の利下げを実施:10月の連続利下げ観測は後退
木内登英のGlobal Economy & Policy Insight