日本最大級のマーケティングサイト J-marketing.net


(2017.11)
マーケティングのための人工知能入門およびその周辺技術
(4)ディープラーニングなどの新たな機械学習と因果などの限界
客員研究員 沖縄国際大学 金城敬太






本コンテンツの全文は、会員サービスでのご提供となっております。
ご利用には無料または有料の会員登録が必要です。
ご登録済みの方は、こちらから全文をご利用ください。
会員のご登録はこちらをご覧ください。

 前回は、機械学習について簡単に解説した。基本としては、「教師あり学習」や「教師なし学習」のふたつがあり、そして「ホワイトボックス」タイプおよび「ブラックボックス」タイプがあることを述べた。これらは、応用するうえでも大きな分類で、重要である。

 今回は、ここ20年のうちに進んだ機械学習・ディープラーニングの手法について簡単に説明する。さらに、因果関係を理解できないなどの、現状機械が苦手なことについても説明しながら、マーケティングへの応用を考えたい。


1.近年の機械学習・ディープラーニングとその応用

 近年の機械学習の手法で特徴的なカーネル法やスパースモデリング、ディープラーニングについて概説し、マーケティングへの応用を考える。


カーネル法(サポートベクターマシンなど)

 90年代から発展した機械学習の手法として、サポートベクターマシンと呼ばれる手法がある。

 カーネル法は、一般的なデータを別の高次元の空間にマッピングすることで、被説明変数と説明変数の間の非線形な関係を表現できるというものである。これまでの機械学習の手法と比べて、分類などの領域で非常に高い予測精度を誇ったため、広く普及した。

 たとえば、「年齢」と「身長」が「購買の有無」に関連していたとしよう。この場合、ふたつの変数(次元)しかない。しかし、年齢の2乗や、年齢×身長など、変数間の様々な変換や組み合わせを行うことでより多くの変数(次元)を用いて、「購買の有無」を説明すると予測の精度が高くなる。同様に、与えられたデータをカーネル法と呼ばれるテクニック(データ間の内積を用いたグラム行列を用いて分析する)を使えば、高次元にマッピングし、複雑で非線形な分類や、相関関連を見つけたりすることが可能となる。そのため多くの場合、この方法の予測精度が高くなる。


図表1.サポートベクターマシンのイメージ


 カーネル法の応用としては、系列や木の構造をもったデータ、たとえばテキストデータや音声、画像処理に利用したり、ネットワークのようなグラフ構造をもったデータの分析に利用されている。

 マーケティングに関連する応用では、製品属性などから売上を予測するのに利用することが期待される。また、顧客の選好にあった商品やサービスの推薦システムや、見込み客の判定に利用している研究もある[1]。ただし、高次元空間上で表現するため、具体的に得られた結果を解釈するのが困難で、それに基づいて戦略を考えるのが難しいという問題もある。


疎なデータの分析・スパースモデリング

 膨大なデータを分析するときに不要な変数が多々ある可能性がある。例えば、文章に関するデータを考えてみよう。文章データをひとつのサンプルとして、そのなかのひとつひとつの特徴的な言葉を「変数」とすると、非常に少ない回数しか現れない単語も多い。特にビッグデータではサンプルの数に比べて、変数が非常に多いデータがある。またこれらの大多数がゼロで、一部だけ非ゼロとなっている。こうしたデータは疎データと呼ばれており、今日非常に重要視されている。

 このようなデータを分析するには、前回述べたようにパラメータに制約をかける「正則化」が有効だ。そのなかに、L1正則化と呼ばれる手法がある。これを利用した回帰モデル(lassoと呼ばれる)では、制約により係数(パラメータ)が 推定の際に0になりやすい。そこで0でない変数を調べれば何が重要な要素なのかが明らかになる。これは、高速で変数の選択を行っていることになる。このように現在のデータ環境に合わせた分析手法が開発されている。

 応用としては、高次元のデータを扱うようなゲノムデータ、金融データ、コンピュータビジョンなどの分析で利用されている。マーケティングに関連させると属性の大きなデータの分析に利用できることから、ソーシャルネットワークなどで得られるような言葉を用いた分析、売上を分析しようとした場合にそれに関連する変数が多い場合などに利用することが期待できる。


図表2.疎データの事例



人工知能ブームのきっかけとなったディープラーニングについて詳述。また、機械学習の限界についても触れる。【続きを読む】(無料会員向け)
※会員のご登録はこちらをご覧ください。


参考文献

[1]  矢島安敏, 矢田佳久. (2006). ラプラシアンカーネルを用いた One-Class SVM とそのマーケティングへの応用 (< 特集> SVM の周辺: One-Class SVM と領域判別). オペレーションズ・リサーチ: 経営の科学, 51(11), 689-695.
[2]  Lake, B. M., Ullman, T. D., Tenenbaum, J. B., & Gershman, S. J. (2016). Building machines that learn and think like people. arXiv preprint arXiv:1604.00289.
[3]  多田智史, 石井一夫 (監修) (2016)「あたらしい人工知能の教科書 プロダクト/サービス開発に必要な基礎知識」翔泳社

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事

11年連続成長で売上高160億円増 フジッコの「粘り強さ」
11年連続成長で売上高160億円増 フジッコの「粘り強さ」

「ふじっ子煮」「おばんざい小鉢」「カスピ海ヨーグルト」――創業60周年を迎えるフジッコの看板商品だ。同社は過去11年間増収を続け、売上高は160億円増加した。紆余曲折の中、同社が着実な成長を遂げてこられたのにはワケがある。コロナ禍で苦戦する多くの中堅企業にとって、このフジッコの事例からは学べることも多いはずだ。

消費者調査データ 紅茶飲料<br>成長市場をリードする「午後の紅茶」
消費者調査データ 紅茶飲料
成長市場をリードする「午後の紅茶」

成長市場をリードする「午後の紅茶」
今2019年の紅茶飲料の販売数量は4年連続の増加となった。ここ最近のトレンドは、働く人をターゲットにした新製品や、フルーツのフレーバーティなど新たな切り口の商品の新発売が相次いでいるが、今回の調査結果では、リーディングブランドである「午後の紅茶」がランキングのトップを独占した。

「食と生活」のマンスリー・ニュースレター<br>在宅時間の増加で増えるおうちカフェこだわり派
「食と生活」のマンスリー・ニュースレター
在宅時間の増加で増えるおうちカフェこだわり派

在宅勤務や外出自粛で自宅で過ごす時間が増える中、コーヒーやお茶の飲み方にも"ある変化"が起きている。今回は在宅時間の増加に着目して、コロナ前後でのコーヒーや日本茶の飲み方の変化を探った。その結果、在宅勤務をしている人ほど豆から挽いたコーヒーや茶葉から淹れた日本茶の飲用が増えていることがわかった。コロナ禍で、手間ひまかけて丁寧にコーヒーやお茶を淹れることにより、おうち時間を大切に過ごしたいという意識が垣間見える。






会員登録のご案内
消費社会白書2020
研修テキストに使える!コンテンツパッケージ販売のご案内
「戦略200+」比較分析ツールのご案内
マーケティングモニターのご案内
データでわかる辛口性格診断
page top

JMR生活総合研究所マーケティングサイトに掲載の記事・写真・図表などの無断転載を禁止します。著作権はJMR生活総合研究所に属します。

Copyright (c) 1997-2020 Japan Consumer Marketing Research Institute. All rights reserved.