フリーワード検索


タグ検索

  • 注目キーワード
    業種
    目的・課題
    専門家
    国・地域

NRI トップ ナレッジ・インサイト 用語解説 用語解説一覧 自動機械学習

自動機械学習

AutoML

  • Facebook
  • Twitter
  • LinkedIn

自動機械学習(AutoML)とは

自動機械学習(AutoML:Automated Machine Learning)とは、機械学習を用いた分析で行われる、さまざまなタスクを自動化する技術のこと。自動機械学習は2015年ごろから研究が本格化した新しい分野で、機械学習のハイパーパラメータの最適化やアルゴリズムの選択の自動化を中心に発展してきた。従来、高度な専門性を必要とした機械学習を用いた分析は、自動機械学習の技術革新により活用のハードルが下がり、データ分析の専門家ではない市民データサイエンティストの活躍を後押ししている。

機械学習とは

機械学習とはデータを分析する方法の1つで、データから、「機械」(コンピューター)が自動で「学習」し、データの背景にあるルールやパターンを発見する方法です。機械学習の手法自体は半世紀以上前から存在し、これまでにさまざまなアルゴリズムが開発されてきました。例えば、昨今のAIブームの立役者であるディープラーニングも機械学習アルゴリズムの一種になります。
機械学習アルゴリズムは、分析するデータやその目的によって適用可能な手法が異なります。また機械学習では、通常複数のハイパーパラメータと呼ばれる値を設定する必要があり、この設定値によって結果の精度などが変化します。一般的に「どの問題にも最良の精度を出せる機械学習アルゴリズム」というものは存在せず、多数の機械学習アルゴリズムの中からどれを選択し、ハイパーパラメータをどのようにチューニングするかは、データサイエンティストの高度なスキルと経験が必要とされてきました。

自動機械学習(AutoML)の特徴

機械学習を用いた分析は、一般的に図表1に示されるようなタスクの流れで行われます。これらのタスクの一部を自動化する技術のことを、自動機械学習(AutoML)と呼びます。
多くの自動機械学習ツールでは、機械学習アルゴリズムに対してハイパーパラメータの設定値を最適化したり、複数の機械学習アルゴリズムを比較して最も精度の高い結果をもたらすアルゴリズムを自動的に見つけたりします。より高機能なAutoMLツールでは、複数の機械学習アルゴリズムを組み合わせて、よりよい精度のモデルを作る「アンサンブル学習」機能に対応したものや、今あるデータ(特徴量)を組み合わせて新たな特徴量を生成する「自動特徴量エンジニアリング」機能を持つもの、ディープラーニングのニューラルネットワークの構造を自動で探索する「NAS(Neural Architecture Search)」の機能を持つものなどがあります。

図表1.機械学習アルゴリズムを用いた分析タスク

出所)野村総合研究所

代表的な自動機械学習(AutoML)ツール

代表的な商用AutoMLツールとしては、グーグルが提供する「Vertex AI AutoML(AutoML Tables)」、マイクロソフトの「Azure Machine Learning」、アマゾン ウェブ サービスの「Amazon SageMaker Autopilot」、米国のボストンで創業した「DataRobot」などが挙げられます。そして、OSS(オープンソースソフトウェア)でも、複数のAutoMLツールの提供が始まっています。アマゾン ウェブ サービスが「re:Invent 2019」でOSSとして公開した「AutoGluon」は、構造化データの分類・回帰だけでなく、画像分類、物体検出、テキスト分類にも対応した高機能なAutoMLツールです。アマゾンの研究者が公開した論文※1によると、商用を含む複数のAutoMLツールと比較したところ、AutoGluonが50種類のベンチマークデータのうち30種類のデータで最もよい精度を記録したそうです。また、テキサスA&M大学のDATA Lab が開発した「AutoKeras」は、ニューラルネットワークライブラリの「Keras」をベースとしNASの機能に対応した、自動ディープラーニングを実現するAutoMLツールになります。

データサイエンティストは、統計学や機械学習の知識、「Python」「R言語」などのプログラミングスキル、大規模なデータを扱うためのデータ加工スキル、さらにビジネスの課題を理解し解決するスキルを併せ持つ必要があります。複数の領域で高いスキルセットが求められることもあり、データサイエンティストは世界的に人材不足が続いています。AutoMLツールにより、これまでデータサイエンティストの高度なスキルとノウハウが必要とされてきた作業の一部が自動化され、データサイエンティストほどの高いスキルは持たないが、深い業務知識を持ちデータ分析活動を行う「市民データサイエンティスト」と呼ばれる人材の活躍が進んできています。

  • ※1  

    “AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data”, Erickson et al., 2020

  • Facebook
  • Twitter
  • LinkedIn