半歩先を読む日本最大級のマーケティングサイト J-marketing.net


(2017.11)
マーケティングのための人工知能入門およびその周辺技術
(4)ディープラーニングなどの新たな機械学習と因果などの限界
客員研究員 沖縄国際大学 金城敬太






本コンテンツの全文は、会員サービスでのご提供となっております。
ご利用には無料または有料の会員登録が必要です。
ご登録済みの方は、こちらから全文をご利用ください。
会員のご登録はこちらをご覧ください。

 前回は、機械学習について簡単に解説した。基本としては、「教師あり学習」や「教師なし学習」のふたつがあり、そして「ホワイトボックス」タイプおよび「ブラックボックス」タイプがあることを述べた。これらは、応用するうえでも大きな分類で、重要である。

 今回は、ここ20年のうちに進んだ機械学習・ディープラーニングの手法について簡単に説明する。さらに、因果関係を理解できないなどの、現状機械が苦手なことについても説明しながら、マーケティングへの応用を考えたい。


1.近年の機械学習・ディープラーニングとその応用

 近年の機械学習の手法で特徴的なカーネル法やスパースモデリング、ディープラーニングについて概説し、マーケティングへの応用を考える。


カーネル法(サポートベクターマシンなど)

 90年代から発展した機械学習の手法として、サポートベクターマシンと呼ばれる手法がある。

 カーネル法は、一般的なデータを別の高次元の空間にマッピングすることで、被説明変数と説明変数の間の非線形な関係を表現できるというものである。これまでの機械学習の手法と比べて、分類などの領域で非常に高い予測精度を誇ったため、広く普及した。

 たとえば、「年齢」と「身長」が「購買の有無」に関連していたとしよう。この場合、ふたつの変数(次元)しかない。しかし、年齢の2乗や、年齢×身長など、変数間の様々な変換や組み合わせを行うことでより多くの変数(次元)を用いて、「購買の有無」を説明すると予測の精度が高くなる。同様に、与えられたデータをカーネル法と呼ばれるテクニック(データ間の内積を用いたグラム行列を用いて分析する)を使えば、高次元にマッピングし、複雑で非線形な分類や、相関関連を見つけたりすることが可能となる。そのため多くの場合、この方法の予測精度が高くなる。


図表1.サポートベクターマシンのイメージ


 カーネル法の応用としては、系列や木の構造をもったデータ、たとえばテキストデータや音声、画像処理に利用したり、ネットワークのようなグラフ構造をもったデータの分析に利用されている。

 マーケティングに関連する応用では、製品属性などから売上を予測するのに利用することが期待される。また、顧客の選好にあった商品やサービスの推薦システムや、見込み客の判定に利用している研究もある[1]。ただし、高次元空間上で表現するため、具体的に得られた結果を解釈するのが困難で、それに基づいて戦略を考えるのが難しいという問題もある。


疎なデータの分析・スパースモデリング

 膨大なデータを分析するときに不要な変数が多々ある可能性がある。例えば、文章に関するデータを考えてみよう。文章データをひとつのサンプルとして、そのなかのひとつひとつの特徴的な言葉を「変数」とすると、非常に少ない回数しか現れない単語も多い。特にビッグデータではサンプルの数に比べて、変数が非常に多いデータがある。またこれらの大多数がゼロで、一部だけ非ゼロとなっている。こうしたデータは疎データと呼ばれており、今日非常に重要視されている。

 このようなデータを分析するには、前回述べたようにパラメータに制約をかける「正則化」が有効だ。そのなかに、L1正則化と呼ばれる手法がある。これを利用した回帰モデル(lassoと呼ばれる)では、制約により係数(パラメータ)が 推定の際に0になりやすい。そこで0でない変数を調べれば何が重要な要素なのかが明らかになる。これは、高速で変数の選択を行っていることになる。このように現在のデータ環境に合わせた分析手法が開発されている。

 応用としては、高次元のデータを扱うようなゲノムデータ、金融データ、コンピュータビジョンなどの分析で利用されている。マーケティングに関連させると属性の大きなデータの分析に利用できることから、ソーシャルネットワークなどで得られるような言葉を用いた分析、売上を分析しようとした場合にそれに関連する変数が多い場合などに利用することが期待できる。


図表2.疎データの事例



人工知能ブームのきっかけとなったディープラーニングについて詳述。また、機械学習の限界についても触れる。【続きを読む】(無料会員向け)
※会員のご登録はこちらをご覧ください。


参考文献

[1]  矢島安敏, 矢田佳久. (2006). ラプラシアンカーネルを用いた One-Class SVM とそのマーケティングへの応用 (< 特集> SVM の周辺: One-Class SVM と領域判別). オペレーションズ・リサーチ: 経営の科学, 51(11), 689-695.
[2]  Lake, B. M., Ullman, T. D., Tenenbaum, J. B., & Gershman, S. J. (2016). Building machines that learn and think like people. arXiv preprint arXiv:1604.00289.
[3]  多田智史, 石井一夫 (監修) (2016)「あたらしい人工知能の教科書 プロダクト/サービス開発に必要な基礎知識」翔泳社

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事



J-marketingをもっと活用するために
無料で読める豊富なコンテンツ プレミアム会員サービス 戦略ケースの教科書Online


新着記事

2026.03.12

26年1月は「有効求人倍率」、「完全失業率」とも悪化

2026.03.11

業界分析 EV失速から始まる自動車産業の脱成熟戦略 - 世界の食、自然、道を楽しむ移動拡張産業へ

2026.03.10

26年2月の「乗用車販売台数」は8ヶ月連続のマイナス

2026.03.09

企業活動分析 スズキの25年3月期は、販売台数増加や価格改定、為替影響などで増収増益に

2026.03.06

消費者調査データ スナック菓子(2026年3月版) 「カルビーポテトチップス」首位揺るがず、PBは高再購入意向保つ

2026.03.05

MNEXT 現代日本の保守意識の潮流を読む

2026.03.05

26年1月の「新設住宅着工戸数」は3ヶ月連続のマイナスに

2026.03.04

月例消費レポート 2026年2月号 消費回復の動きは一旦小休止 - 収入と支出での両面支援が消費再成長に不可欠

2026.03.03

企業活動分析 トヨタの25年3月期は、全地域で増収、減益ながら高水準の利益を確保

2026.03.02

業界分析 脅かされるトイレタリー市場の勝者と新しい成功条件

2026.02.27

26年1月の「ファミリーレストラン売上高」は47ヶ月連続プラス

週間アクセスランキング

1位 2026.03.02

業界分析 脅かされるトイレタリー市場の勝者と新しい成功条件

2位 2024.06.21

消費者調査データ ビール系飲料(2024年6月版) 首位「スーパードライ」、キリンの新ビール「晴れ風」にも注目

3位 2026.03.05

MNEXT 現代日本の保守意識の潮流を読む

4位 2026.03.11

業界分析 EV失速から始まる自動車産業の脱成熟戦略 - 世界の食、自然、道を楽しむ移動拡張産業へ

5位 2019.04.16

MNEXT 眼のつけどころ 次の時代のマーケティング戦略を考える (1)GAFA、増税、キャッシュレスなどへの対応

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area