フリーワード検索


タグ検索

  • 注目キーワード
    業種
    目的・課題
    専門家
    国・地域

NRI トップ ナレッジ・インサイト 用語解説 用語解説一覧 ベイジアンネットワーク

ベイジアンネットワーク

Bayesian Network

  • Facebook
  • Twitter
  • LinkedIn

ベイジアンネットワークとは

データの因果関係を分析する手法の1つで、因果関係の強さを、ある事象が起こった場合に他の事象が起こる確率である「条件付き確率」の大きさから判断し、多数の事象間の因果関係をグラフィカルに整理する方法。
条件付き確率による因果関係の強さは、トーマス・ベイズにより提唱された「ベイズの定理」を基本的な考え方としているため“ベイジアン”という名前がついている。また、分析結果をA→B→Cのようなネットワーク図として表記するため“ベイジアンネットワーク”と呼ばれている。

データの関係を分析する基本は回帰分析

それぞれのデータの関係性を分析する方法の代表例は「回帰分析」です。2つのデータにどれぐらい強い関係があるのかを表現します。1対1の関係をみたものが「単回帰」、複数のデータをもとに分析する方法が「重回帰」です。重回帰のイメージでは図1のような形です。
Y=a・X1+b・X2+c・X3+d・X4+e(定数)と表記され、a、b、c、dが回帰係数となります。X1が1増えた時に、Yがaだけ増えるという関係にあります。各観測点(データ)と、右辺の回帰直線との誤差の合計が最小になるように、回帰係数が決定します。
ただし、説明する変数の間にも関係があることが多く、単純に、図1のような関係で表せないことが多くあります。

ベイジアンネットワークのアウトプットはグラフィカルに表現される

ベイジアンネットワークの場合は、図2のような形で、各事象間の関係も含めて、ネットワーク図のように整理します。関係がない事象の間では、線が引かれませんし、また、X1→X2のように、事象間の関係がある向きに線が引かれます。各事象間の関係まで整理することにより、結果(Y)に対して、各事象がどのように影響しているのかを“視覚的に”整理されることが1つ目の特徴です。
ネットワーク図で整理されることにより、モデルの見直し(チューニング)を簡単に行うことができます。図2の場合、X3という事象が、X4に影響を与えているという構造になっていますが、感覚的におかしい場合には、X3はX2を介してX4に影響するというような形でモデルを組み替えることができます。
個別の事象間の関係を数式として表すだけであれば、このような関係を見つけにくく、直感や経験則をモデルに反映しにくいという欠点があります。

事象間の因果の強さは「条件付き確率」で決める

ベイジアンネットワークの2つ目の特徴は、事象間の因果関係の強さが「条件付き確率」で決定されることです。条件付き確率とは、ある事象の条件を指定したときに、他の事象が起こる確率のことです。例えば、X1が1という値になったときに、X2が2以上になる確率などです。このように確率を計算することで、X1とX2の関係性の強さが把握できます。X1がどのような値をとってもX2に関係がない(2つの事象は独立である)場合は、X1とX2の間に線は引かれないことになります。
事象が複数ある場合には、複数の事象の条件を設定して条件付き確率を計算します。例えば、X1が1、X2が1の時に、X3が1になる確率を計算するなどです。様々な事象間で条件付き確率を計算し、事象間の因果関係の強さを計ることで、図2のようなネットワーク図を作成します。
また、3つ目の特徴としては、シミュレーションのしやすさがあります。各変数の条件を任意で設定することで、結果(Y)の確率を推計することができます。各条件を変えた時の結果をシミュレーションできるため、各事象が結果に与える影響の大きさを把握したり、各事象間の相互作用(2つの条件が揃った場合の効果)などを推計できるという特徴があります。
条件付き確率という考え方が「ベイズ統計」(リンク参照)の基本となっており、その考え方をもとに事象間の関係をモデル化するため、ベイジアンネットワークと呼ばれています。

ベイジアンネットワークのビジネス活用

近年の人工知能ブームの中で、モデル化の手法の代表例は「ディープラーニング」(リンク参照)です。予測モデルを構築する上で、予測精度という点では、ディープラーニングが高い精度を出しやすいと言えます。一方で、変数間の関係がブラックボックスになっていることが多く、精度の高さを説明できないなどの欠点があります。ベイジアンネットワークによるモデル化は、精度としてはディープラーニングには劣りますが、わかりやすいという特徴があります。直感、納得感などを重視しながら、変数間の関係をモデル化する際には、ベイジアンネットワークを用いることをお薦めします。
ベイジアンネットワークによるモデル化した結果、精度が低い場合には、事象間の因果関係の仮説が間違えているか、観測できていない事象があるか、データが不足していることなどが考えられます。できあがったネットワーク図をもとに、何度も見直しをすることで、モデルの精度をあげていくことが重要となります。

ベイジアンネットワークは、医療・病気診断、気象予測、故障診断、マーケティング、レコメンドシステムなどで応用されています。複雑は事象がからみあって結果が出力される場合のモデル化に適しています。人間の意思決定プロセスに近い形でモデル化できるため、アンケート分析などにも活用されています。

  • Facebook
  • Twitter
  • LinkedIn