
ご利用には無料または有料の会員登録が必要です。
ご登録済みの方は、こちらから全文をご利用ください。
会員のご登録はこちらをご覧ください。
前回は、機械学習について簡単に解説した。基本としては、「教師あり学習」や「教師なし学習」のふたつがあり、そして「ホワイトボックス」タイプおよび「ブラックボックス」タイプがあることを述べた。これらは、応用するうえでも大きな分類で、重要である。
今回は、ここ20年のうちに進んだ機械学習・ディープラーニングの手法について簡単に説明する。さらに、因果関係を理解できないなどの、現状機械が苦手なことについても説明しながら、マーケティングへの応用を考えたい。
近年の機械学習の手法で特徴的なカーネル法やスパースモデリング、ディープラーニングについて概説し、マーケティングへの応用を考える。
カーネル法(サポートベクターマシンなど)
90年代から発展した機械学習の手法として、サポートベクターマシンと呼ばれる手法がある。
カーネル法は、一般的なデータを別の高次元の空間にマッピングすることで、被説明変数と説明変数の間の非線形な関係を表現できるというものである。これまでの機械学習の手法と比べて、分類などの領域で非常に高い予測精度を誇ったため、広く普及した。
たとえば、「年齢」と「身長」が「購買の有無」に関連していたとしよう。この場合、ふたつの変数(次元)しかない。しかし、年齢の2乗や、年齢×身長など、変数間の様々な変換や組み合わせを行うことでより多くの変数(次元)を用いて、「購買の有無」を説明すると予測の精度が高くなる。同様に、与えられたデータをカーネル法と呼ばれるテクニック(データ間の内積を用いたグラム行列を用いて分析する)を使えば、高次元にマッピングし、複雑で非線形な分類や、相関関連を見つけたりすることが可能となる。そのため多くの場合、この方法の予測精度が高くなる。

カーネル法の応用としては、系列や木の構造をもったデータ、たとえばテキストデータや音声、画像処理に利用したり、ネットワークのようなグラフ構造をもったデータの分析に利用されている。
マーケティングに関連する応用では、製品属性などから売上を予測するのに利用することが期待される。また、顧客の選好にあった商品やサービスの推薦システムや、見込み客の判定に利用している研究もある[1]。ただし、高次元空間上で表現するため、具体的に得られた結果を解釈するのが困難で、それに基づいて戦略を考えるのが難しいという問題もある。
疎なデータの分析・スパースモデリング
膨大なデータを分析するときに不要な変数が多々ある可能性がある。例えば、文章に関するデータを考えてみよう。文章データをひとつのサンプルとして、そのなかのひとつひとつの特徴的な言葉を「変数」とすると、非常に少ない回数しか現れない単語も多い。特にビッグデータではサンプルの数に比べて、変数が非常に多いデータがある。またこれらの大多数がゼロで、一部だけ非ゼロとなっている。こうしたデータは疎データと呼ばれており、今日非常に重要視されている。
このようなデータを分析するには、前回述べたようにパラメータに制約をかける「正則化」が有効だ。そのなかに、L1正則化と呼ばれる手法がある。これを利用した回帰モデル(lassoと呼ばれる)では、制約により係数(パラメータ)が 推定の際に0になりやすい。そこで0でない変数を調べれば何が重要な要素なのかが明らかになる。これは、高速で変数の選択を行っていることになる。このように現在のデータ環境に合わせた分析手法が開発されている。
応用としては、高次元のデータを扱うようなゲノムデータ、金融データ、コンピュータビジョンなどの分析で利用されている。マーケティングに関連させると属性の大きなデータの分析に利用できることから、ソーシャルネットワークなどで得られるような言葉を用いた分析、売上を分析しようとした場合にそれに関連する変数が多い場合などに利用することが期待できる。

参考文献
参照コンテンツ
【シリーズ】マーケティングのための人工知能入門およびその周辺技術
- (1)人工知能とその社会的インパクト
- (2)人工知能とは
- (3)機械学習の入門およびマーケティング
- (4)ディープラーニングなどの新たな機械学習と因果などの限界
- (5)実践:今日からはじめる機械学習とディープ・ラーニング
おすすめ新着記事

消費者調査データ スナック菓子 「カルビーポテトチップス」首位揺るがず、PBは高再購入意向保つ
好調が続くスナック菓子市場の消費者調査データをみると、カルビーの「ポテトチップス」をはじめ、ロングセラー強さが目立つ結果となった。一方、再購入意向上位にはPBが食い込んだ。

成長市場を探せ コロナ禍からの回復続く居酒屋業態 けん引車はネオ居酒屋か
コロナ禍で大きな打撃を受けた居酒屋が回復を続けている。けん引しているのは、「ネオ居酒屋」「ネオ大衆酒場」などといわれる業態や、特定のメニューに特化した業態だ。

消費者調査データ チョコレート 首位「明治チョコレート」、追う「ガーナ」、再購入意向上位にはプレミアムチョコレートも
カカオショックのなか、最需要期を迎えたチョコレート市場。調査結果では明治チョコレートが首位で、「失敗しない」安心感のあるロングセラーがそれに続く。再購入意向首位にはリンツで、プチ贅沢需要もうかがえる。


![戦略家のための知的羅針盤[エム・ネクスト]product by 松田 久一](/img/mnext-sub-title.png)