消費経済レビュー Vol.10 |
|
ネットワーク分析と帰納論理プログラミングの 比較と応用 |
関係性と属性を扱うデータ分析に向けて |
今日、人間関係のネットワークをはじめとした関係性を取り扱うデータの分析が盛んである。 関係性について 簡単に説明する。通常のデータ分析では、あるidとそれに付加された属性で構成されたデータを扱っていく。一方、関係性を取り扱う場合には、どのidとどのidが関係しているかという情報も同時に扱う。例をあげると、ある人物idがどの人物idと友達同士であるかなどのデータも扱うということである。 このような関係性を扱うデータは、数学ではグラフで扱われるほか、関係があるかないかを0,1で表現した隣接行列と呼ばれるものでも表現される。これらのデータを扱う手法には、古くから社会学で研究されてきたネットワーク分析があるが、それとは別に、述語論理表現というものを用いて、関係性を表現するだけではなく、詳細な特徴抽出を可能とする手法として、人工知能の一分野である機械学習の一種、帰納論理プログラミングがある。述語論理を用いた場合は、関係性だけではなく、その種類や属性情報を組み込んで分析できるという点が特徴的である。 ここでは、これらの分析手法について比較を行い、その上で、ネットワーク分析と帰納論理プログラミングの利点を組み合わせて両者の特徴を活かした情報抽出を行って、複数の関係や属性、新たな特徴の抽出など複雑なネットワークの分析などを行った。結果として、人間関係のネットワークから、中心的な人物が持つ特徴がわかり、調査データから得られた商品情報を交換するネットワークから、特定の年代において活発な情報の交換がなされていることなどがわかった。 以上のように、人工知能で開発されている技術を応用し、「関係性を持ったデータ」を扱い、同時に通常の統計分析に見られるような「属性」を扱っていくなど、必要に応じて様々な方法を使い分けることでより有用な特徴を抽出することが可能となることがわかった。 (2008.12)
| |
|