フリーワード検索


タグ検索

  • 注目キーワード
    業種
    目的・課題
    専門家
    国・地域

NRI トップ ナレッジ・インサイト 用語解説 用語解説一覧 機械学習

機械学習

Machine Learning

  • Facebook
  • Twitter
  • LinkedIn

機械学習とは

機械学習とは、データを分析する方法の1つで、データから、「機械」(コンピューター)が自動で「学習」し、データの背景にあるルールやパターンを発見する方法。近年では、学習した成果に基づいて「予測・判断」することが重視されるようになった。

機械学習の類義語として、「人工知能(AI)」や「ディープラーニング(深層学習)」があります。「人工知能」を実現するためのデータ分析技術の1つが「機械学習」で、「機械学習」における代表的な分析手法が「ディープラーニング」と言われています。

機械学習で最も重視されることは予測の精度です。データの背景にあるルールが正しく説明できているかどうかではなく、より正しく予測できているかどうかを重視しています。機械的に予測精度の高いモデルを構築するため、予測モデルが妥当性や納得性を欠く場合もあります。一方で、従来の「統計学」による仮説検証型のデータ分析では見つけられなかった“新しい発見”や“高い精度”の予測モデルを構築することができるようになりました。

機械学習の種類

機械学習がデータの背景にあるルールやパターンを学習するための種類としては、①教師あり学習、②教師なし学習、③強化学習の3種類があります。

①教師あり学習

入力データと、出力データ(答)が揃っており、入力データから出力データを推計するためのもの。入力と出力の関係を分析するためには、統計学の手法である回帰分析を、機械的にすべてのデータの組み合わせで実施する方法などがあります。代表的な例としては、天候、価格、販促などの要因から売上を予測することが挙げられます。

②教師なし学習

一連の入力データから、データの背景にある隠れたパターンや構造を見つけ出すもの。「教師あり学習」と比べると、目的となる変数(出力データ)がないため、各データ間の近さや類似度などを計算して、データをグループに分けたり、データ間のつながりを推計します

統計学では使われないクラスタリング手法が使われることが多いです。代表的な例としては、ネットショッピングにおけるレコメンデーションを行うロジックなどが挙げられます。

③強化学習

教師あり・なし学習とは異なり、最初からデータがあるわけではなく、システム自身が試行錯誤しながら、精度を高めていくための学習方法。例えば、ロボットの歩行距離を伸ばすためにはどうすればよいかを考える際に、入力データから歩行距離を推計するのではなく、ロボットが歩行距離を伸ばすために自ら新たな歩き方を試行錯誤し、その結果を学習しながら最適な歩き方(アルゴリズム、ルール)を見出す方法です。自ら試行錯誤しながら学んでいくという点がポイントです。

①、②、③のいずれの方法も、変化の要因に対して、将来を正しく予測し、その結果から、成果を最大化するために、入力(インプット)を考えることが目的です。機械学習により、正しく将来予測できるモデルを作ることで、売上を最大化するためのマーケティング戦略を考えたり、工場における生産工程や配送ルートを最適化するための施策を考えることができます。機械学習はビジネスの分野でも広く用いられるようになってきています。

機械学習と統計学の違い

機械学習を理解するためには、統計学との違いを理解することが大切です。文字通りに捉えると、「機械学習」は、機械が自動的に学習するものであるのに対し、「統計学」は、データのルールやパターンを統計的に判断するものだと言えます。ここでいう“統計的に”とは、確率的に正しいかどうかを判断するという意味です。
ただし、現代においては、統計学の世界においても、コンピューターの活用は当たり前のことですし、明確に線を引くことは難しくなってきました。統計学と機械学習は「特に違いはない」という人もいますし、「機械学習は統計学の応用版」という人や、「機械学習は統計学からモデルや仮説検証を引いたもの」と表現する人もいます。両者は微妙な関係にあると言えるでしょう。

統計学も機械学習も、データから、ルールやパターンを見つけ出し、モデルを構築するという点では同じです。データ分析の方法ではなく“目的”に違いがあると言われることが多いです。統計学の場合は、データの『説明』を目的としており、機械学習の場合は『予測』を目的としています。統計学においても回帰モデルなどを使うことで、予測に活用することもできます。しかし、主目的としては、統計学の場合は、データの背景にあるルールをより正しく説明できているかどうかを重視し、機械学習の場合は、より正しく予測できているかどうかを重視しているのです。

統計学では、ある程度、直感的に理解できる説明変数で構成されたモデルが多くなりますが、機械学習の場合は、直感的には理解できない説明変数も考慮されるため、より精度が高まる可能性があります。これが、機械学習がビッグデータに強いと言われている理由です。

  • Facebook
  • Twitter
  • LinkedIn