連合学習

Federated Learning

連合学習とは

分散しているデータを1か所に集めずに、AIモデルを分散している環境に配布しながらセキュアにモデリングする方法のことです。組織を超えたモデルを構築する際に、組織間のデータを直接やり取りすることを避け、モデルを組織間でやり取りすることで、データ利用の高度化とプライバシー保護を同時に解決する方法です。

組織間でのデータ・モデル共有

データサイエンスの結果をビジネスに適切に反映するためには、質・量ともにより良いデータを取得することが欠かせません。いかにデータを取得・整理するかという点での一つのアプローチとして、組織を跨いでデータを集めることにより、多量・高品質のデータを利活用することが期待されています。
組織を跨いでデータの利活用を行うには、データのプライバシー保護を意識した分析技術を意識する必要があります。組織間で暗号化されたデータを共有する方法の「秘密計算」と、モデルを共有する方法である「連合学習」の2つがあります。
秘密計算ではデータに高度な暗号化を施しますが、データの授受が組織間で行われます。一方、連合学習ではデータの直接的な授受を避け、モデルの更新に必要な情報だけを共有するシステムの構築が基本的な考え方となっています。

連合学習の特徴

連合学習は、組織間でのデータの直接的な共有を避けて、一つのモデルを様々な参加者が共同で管理していくAIシステムです。具体的には、連合学習におけるAIモデルの学習プロセスは、下記のようなサイクルで行なわれます。

①初期AIモデルの配布
②クライアント環境でAIモデルの学習を実施
③中央サーバでのAIモデルの更新
④更新されたAIモデルの配布
⑤クライアント環境のAIモデルの更新

連合学習システムにおけるAIモデルの学習プロセス

連合学習のプロセスの中で、やり取りされるデータは、生の個人情報や機密データではなく、モデルを更新するために必要な誤差情報（FedSGD）やモデルのパラメータ(FedAVG)となるので、セキュアなモデル構築ができると考えられています。

連合学習の社会への適用

このようなシステムの具体的な適用先としては、金融機関での不正取引の「AI検知」が挙げられます。不正取引検知の業務は複数の金融機関で同様に行なわれていますが、このAIモデルの開発を個々の金融機関で独立に実施すると、不正取引データの数の少なさやデータの偏りによって、モデル開発に支障が生じます。そのため、十分なデータを確保し効率的なモデリングを業界全体で行うために、連合学習のような方法が期待されています。
その他には、保険査定、医療や自動運転などへの事例が見られます。一般的に連合学習は、個々の組織でモデリングに必要なデータ件数が十分でない場合で、かつ組織を跨いだデータの統合でデータの質量が確保されるような状況への適用が有効とされています。

連合学習の課題

広く実装が考えられている連合学習ですが、ITシステム、AIモデル開発、エコシステムとして以下の課題が認識されています。

ITシステム：

各クライアントにおいてAI利用の計算環境を構築する必要がある
AIモデル開発：

自社データのみを使った場合と比較して精度が落ちる懸念がある
エコシステム：

連合学習に参加するメリットが組織のもつデータ量に反比例する

連合学習は、データ分析を高度化する技術として、様々な領域への応用が期待されています。特に社会インフラに近い領域では、業界共通の類似業務のコスト削減が期待されています。その利用にあたっては、技術的課題からシステムの運用課題まで存在しますが、求めるシステムに応じた適切な解決策を選定することで、連合学習の選択肢が広がると予想されます。

「連合学習」に関して動画でお伝えしています

このページを見ている人はこんな用語解説ページも見ています

秘密計算

生成AI

機械学習

「連合学習」に関してこんなページも見られています

NRI JOURNAL

デジタル資本主義の未来を拓く秘密計算技術

D情報を暗号化したまま解析処理できる「秘密計算技術」が、個人のデータプライバシーを守りつつデータ利活用を進める手段として、また、異なる事業者間でのデータ共有による産業の活性化や社会的課題の解決に期待されています。野村総合研究所（NRI）グループでは、この技術の実用化に向けて、さまざまな分野での専門家メンバーが調査研究に取り組んでいます。チームを纏めるNRIデジタルの安増拓見は「デジタル資本主義を実現するカギとなる技術」と言います。

刊行物

秘密計算で進むデータ利活用ビジネス

「データを暗号化したまま計算する」暗号技術により、従来では不可能であった、プライバシーを守ったままの委託計算やニーズマッチングが可能となった。この秘密計算技術が金融機関内の個人情報を含む膨大なデータの利活用の一助になると考えられる。

コラム

なぜAIを活用したビジネス革新はうまくいかないのか

近年のAI技術の進化とともに、事業計画にAI活用を組み入れる企業が増えています。一方、AIを導入してみたものの、目標を達成できず、導入に失敗しているケースも少なくありません。それは、AIの特性である「不確実性」を考慮していないためです。
今回は、業務改革や新事業創出のためのAI活用プロジェクトにおいて、AIの不確実性のために起こりがちな失敗を取り上げ、それを避けるための対策をお話しします。

NRI JOURNAL

数値には世界を変える力がある
――トップデータサイエンティスト集団がビジネスに革命を起こす

今や、ビジネスだけではなく、医療やスポーツなどあらゆる分野で活用されている「データサイエンス」。しかし、日本ではまだその担い手であるデータサイエンティストが大きく不足している状況です。そのような中、野村総合研究所（NRI）では2021年4月に未来創発センター内に「データサイエンスラボ」を新設しました。

前のページに戻る