日本最大級のマーケティングサイト J-marketing.net


(2017.11)
マーケティングのための人工知能入門およびその周辺技術
(4)ディープラーニングなどの新たな機械学習と因果などの限界
客員研究員 沖縄国際大学 金城敬太






本コンテンツの全文は、会員サービスでのご提供となっております。
ご利用には無料または有料の会員登録が必要です。
ご登録済みの方は、こちらから全文をご利用ください。
会員のご登録はこちらをご覧ください。

 前回は、機械学習について簡単に解説した。基本としては、「教師あり学習」や「教師なし学習」のふたつがあり、そして「ホワイトボックス」タイプおよび「ブラックボックス」タイプがあることを述べた。これらは、応用するうえでも大きな分類で、重要である。

 今回は、ここ20年のうちに進んだ機械学習・ディープラーニングの手法について簡単に説明する。さらに、因果関係を理解できないなどの、現状機械が苦手なことについても説明しながら、マーケティングへの応用を考えたい。


1.近年の機械学習・ディープラーニングとその応用

 近年の機械学習の手法で特徴的なカーネル法やスパースモデリング、ディープラーニングについて概説し、マーケティングへの応用を考える。


カーネル法(サポートベクターマシンなど)

 90年代から発展した機械学習の手法として、サポートベクターマシンと呼ばれる手法がある。

 カーネル法は、一般的なデータを別の高次元の空間にマッピングすることで、被説明変数と説明変数の間の非線形な関係を表現できるというものである。これまでの機械学習の手法と比べて、分類などの領域で非常に高い予測精度を誇ったため、広く普及した。

 たとえば、「年齢」と「身長」が「購買の有無」に関連していたとしよう。この場合、ふたつの変数(次元)しかない。しかし、年齢の2乗や、年齢×身長など、変数間の様々な変換や組み合わせを行うことでより多くの変数(次元)を用いて、「購買の有無」を説明すると予測の精度が高くなる。同様に、与えられたデータをカーネル法と呼ばれるテクニック(データ間の内積を用いたグラム行列を用いて分析する)を使えば、高次元にマッピングし、複雑で非線形な分類や、相関関連を見つけたりすることが可能となる。そのため多くの場合、この方法の予測精度が高くなる。


図表1.サポートベクターマシンのイメージ


 カーネル法の応用としては、系列や木の構造をもったデータ、たとえばテキストデータや音声、画像処理に利用したり、ネットワークのようなグラフ構造をもったデータの分析に利用されている。

 マーケティングに関連する応用では、製品属性などから売上を予測するのに利用することが期待される。また、顧客の選好にあった商品やサービスの推薦システムや、見込み客の判定に利用している研究もある[1]。ただし、高次元空間上で表現するため、具体的に得られた結果を解釈するのが困難で、それに基づいて戦略を考えるのが難しいという問題もある。


疎なデータの分析・スパースモデリング

 膨大なデータを分析するときに不要な変数が多々ある可能性がある。例えば、文章に関するデータを考えてみよう。文章データをひとつのサンプルとして、そのなかのひとつひとつの特徴的な言葉を「変数」とすると、非常に少ない回数しか現れない単語も多い。特にビッグデータではサンプルの数に比べて、変数が非常に多いデータがある。またこれらの大多数がゼロで、一部だけ非ゼロとなっている。こうしたデータは疎データと呼ばれており、今日非常に重要視されている。

 このようなデータを分析するには、前回述べたようにパラメータに制約をかける「正則化」が有効だ。そのなかに、L1正則化と呼ばれる手法がある。これを利用した回帰モデル(lassoと呼ばれる)では、制約により係数(パラメータ)が 推定の際に0になりやすい。そこで0でない変数を調べれば何が重要な要素なのかが明らかになる。これは、高速で変数の選択を行っていることになる。このように現在のデータ環境に合わせた分析手法が開発されている。

 応用としては、高次元のデータを扱うようなゲノムデータ、金融データ、コンピュータビジョンなどの分析で利用されている。マーケティングに関連させると属性の大きなデータの分析に利用できることから、ソーシャルネットワークなどで得られるような言葉を用いた分析、売上を分析しようとした場合にそれに関連する変数が多い場合などに利用することが期待できる。


図表2.疎データの事例



人工知能ブームのきっかけとなったディープラーニングについて詳述。また、機械学習の限界についても触れる。【続きを読む】(無料会員向け)
※会員のご登録はこちらをご覧ください。


参考文献

[1]  矢島安敏, 矢田佳久. (2006). ラプラシアンカーネルを用いた One-Class SVM とそのマーケティングへの応用 (< 特集> SVM の周辺: One-Class SVM と領域判別). オペレーションズ・リサーチ: 経営の科学, 51(11), 689-695.
[2]  Lake, B. M., Ullman, T. D., Tenenbaum, J. B., & Gershman, S. J. (2016). Building machines that learn and think like people. arXiv preprint arXiv:1604.00289.
[3]  多田智史, 石井一夫 (監修) (2016)「あたらしい人工知能の教科書 プロダクト/サービス開発に必要な基礎知識」翔泳社

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事

陽性者報道の消費インパクトは1人3円から1円へ コロナへの関心低下鮮明に
陽性者報道の消費インパクトは1人3円から1円へ コロナへの関心低下鮮明に

当社独自の推計モデルを用いて、コロナ陽性確認者数が消費支出に与える影響の推計を試みるコンテンツ第三弾。今回は、前回モデルに7月の消費支出データを追加し、モデルの修正を行った。その結果、前日の陽性確認者数が1人増えると、消費支出の日別支出は約1円減少するという結果が得られた。前回モデルの1人増えると3円減少という結果よりもインパクトが小さいことがわかる。要因は、消費者のコロナへの関心の低下だ。

特集:コロナ禍の消費を読む 家電出荷は先行復活の気配
特集:コロナ禍の消費を読む 家電出荷は先行復活の気配

コロナ禍において、家電出荷は先んじて回復の動きが出ている。ノーリモートワークの導入が進む中でノートパソコンが復調に転じた。AV機器においても、コンテンツ消費の活発化などを後押しに復調の動きがみられる。白物家電では「ホットプレート」や「空気清浄機」など食生活や住環境の改善に力点を置いた宅内充実の動きが、裾野の拡がりをみせている。

マスク生活で熱中症危険度は高止まり?注目集まる「塩」入り飲料
マスク生活で熱中症危険度は高止まり?注目集まる「塩」入り飲料

今年上期の清涼飲料市場は、外出自粛などの影響を受け前年比10%程度のマイナスとなった。6月以降は回復の兆しがみられ、特に8月は東京都心の猛暑日が1875年の統計開始以来最多を記録するなど、マスク着用とあいまって例年以上に熱中症リスクが増加。メーカー各社も熱中症対策の周知に注力している。(2020.09.16)






コロナ経営危機を乗り越える!中堅ビジネス向け無料オンライン相談
会員登録のご案内
消費社会白書2020
「戦略200+」比較分析ツールのご案内
マーケティングモニターのご案内
データでわかる辛口性格診断
page top

JMR生活総合研究所マーケティングサイトに掲載の記事・写真・図表などの無断転載を禁止します。著作権はJMR生活総合研究所に属します。

Copyright (c) 1997-2020 Japan Consumer Marketing Research Institute. All rights reserved.