日本最大級のマーケティングサイト J-marketing.net


(2017.11)
マーケティングのための人工知能入門およびその周辺技術
(4)ディープラーニングなどの新たな機械学習と因果などの限界
客員研究員 沖縄国際大学 金城敬太






本コンテンツの全文は、会員サービスでのご提供となっております。
ご利用には無料または有料の会員登録が必要です。
ご登録済みの方は、こちらから全文をご利用ください。
会員のご登録はこちらをご覧ください。

 前回は、機械学習について簡単に解説した。基本としては、「教師あり学習」や「教師なし学習」のふたつがあり、そして「ホワイトボックス」タイプおよび「ブラックボックス」タイプがあることを述べた。これらは、応用するうえでも大きな分類で、重要である。

 今回は、ここ20年のうちに進んだ機械学習・ディープラーニングの手法について簡単に説明する。さらに、因果関係を理解できないなどの、現状機械が苦手なことについても説明しながら、マーケティングへの応用を考えたい。


1.近年の機械学習・ディープラーニングとその応用

 近年の機械学習の手法で特徴的なカーネル法やスパースモデリング、ディープラーニングについて概説し、マーケティングへの応用を考える。


カーネル法(サポートベクターマシンなど)

 90年代から発展した機械学習の手法として、サポートベクターマシンと呼ばれる手法がある。

 カーネル法は、一般的なデータを別の高次元の空間にマッピングすることで、被説明変数と説明変数の間の非線形な関係を表現できるというものである。これまでの機械学習の手法と比べて、分類などの領域で非常に高い予測精度を誇ったため、広く普及した。

 たとえば、「年齢」と「身長」が「購買の有無」に関連していたとしよう。この場合、ふたつの変数(次元)しかない。しかし、年齢の2乗や、年齢×身長など、変数間の様々な変換や組み合わせを行うことでより多くの変数(次元)を用いて、「購買の有無」を説明すると予測の精度が高くなる。同様に、与えられたデータをカーネル法と呼ばれるテクニック(データ間の内積を用いたグラム行列を用いて分析する)を使えば、高次元にマッピングし、複雑で非線形な分類や、相関関連を見つけたりすることが可能となる。そのため多くの場合、この方法の予測精度が高くなる。


図表1.サポートベクターマシンのイメージ


 カーネル法の応用としては、系列や木の構造をもったデータ、たとえばテキストデータや音声、画像処理に利用したり、ネットワークのようなグラフ構造をもったデータの分析に利用されている。

 マーケティングに関連する応用では、製品属性などから売上を予測するのに利用することが期待される。また、顧客の選好にあった商品やサービスの推薦システムや、見込み客の判定に利用している研究もある[1]。ただし、高次元空間上で表現するため、具体的に得られた結果を解釈するのが困難で、それに基づいて戦略を考えるのが難しいという問題もある。


疎なデータの分析・スパースモデリング

 膨大なデータを分析するときに不要な変数が多々ある可能性がある。例えば、文章に関するデータを考えてみよう。文章データをひとつのサンプルとして、そのなかのひとつひとつの特徴的な言葉を「変数」とすると、非常に少ない回数しか現れない単語も多い。特にビッグデータではサンプルの数に比べて、変数が非常に多いデータがある。またこれらの大多数がゼロで、一部だけ非ゼロとなっている。こうしたデータは疎データと呼ばれており、今日非常に重要視されている。

 このようなデータを分析するには、前回述べたようにパラメータに制約をかける「正則化」が有効だ。そのなかに、L1正則化と呼ばれる手法がある。これを利用した回帰モデル(lassoと呼ばれる)では、制約により係数(パラメータ)が 推定の際に0になりやすい。そこで0でない変数を調べれば何が重要な要素なのかが明らかになる。これは、高速で変数の選択を行っていることになる。このように現在のデータ環境に合わせた分析手法が開発されている。

 応用としては、高次元のデータを扱うようなゲノムデータ、金融データ、コンピュータビジョンなどの分析で利用されている。マーケティングに関連させると属性の大きなデータの分析に利用できることから、ソーシャルネットワークなどで得られるような言葉を用いた分析、売上を分析しようとした場合にそれに関連する変数が多い場合などに利用することが期待できる。


図表2.疎データの事例



人工知能ブームのきっかけとなったディープラーニングについて詳述。また、機械学習の限界についても触れる。【続きを読む】(無料会員向け)
※会員のご登録はこちらをご覧ください。






参考文献

[1]  矢島安敏, 矢田佳久. (2006). ラプラシアンカーネルを用いた One-Class SVM とそのマーケティングへの応用 (< 特集> SVM の周辺: One-Class SVM と領域判別). オペレーションズ・リサーチ: 経営の科学, 51(11), 689-695.
[2]  Lake, B. M., Ullman, T. D., Tenenbaum, J. B., & Gershman, S. J. (2016). Building machines that learn and think like people. arXiv preprint arXiv:1604.00289.
[3]  多田智史, 石井一夫 (監修) (2016)「あたらしい人工知能の教科書 プロダクト/サービス開発に必要な基礎知識」翔泳社
会員登録のご案内
消費社会白書2018
「戦略200+」比較分析ツールのご案内
page top

JMR生活総合研究所マーケティングサイトに掲載の記事・写真・図表などの無断転載を禁止します。著作権はJMR生活総合研究所に属します。

Copyright (c) 1997-2017 Japan Consumer Marketing Research Institute. All rights reserved.