日本最大級のマーケティングサイト J-marketing.net


(2019.03)
マーケティングのための人工知能入門およびその周辺技術
(6)Rを用いたディープラーニング入門
客員研究員 沖縄国際大学 金城敬太






 前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。


1.はじめに

 第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。

  • Tensorflow・・・Googleの開発しているフレームワーク。
  • Keras・・・非常に簡単に実装できる。そのため導入としてよい。
  • Chainer・・・日本のpreferred networksで開発されている。

 それ以外にもMxnetなどがある。

 それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。

 ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。

 Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。

 Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。

 まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。


図表1.主な実装のステップ



図表2.ディープラーニングの概念図



0.フレームワークの入手

 1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。

1.データの用意

 トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。

2.モデルの設定とコンパイル

 どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。

 ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。

 また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。

3.学習

 学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。

4.評価

 評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。

5.予測

 最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。


 以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。


次は「Kerasによるディープラーニングの実装」
【続きを読む】(有料会員向け先行公開)

※会員のご登録はこちらをご覧ください。

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事

消費者調査データ 紅茶飲料<br>成長市場をリードする「午後の紅茶」
消費者調査データ 紅茶飲料
成長市場をリードする「午後の紅茶」

成長市場をリードする「午後の紅茶」
今2019年の紅茶飲料の販売数量は4年連続の増加となった。ここ最近のトレンドは、働く人をターゲットにした新製品や、フルーツのフレーバーティなど新たな切り口の商品の新発売が相次いでいるが、今回の調査結果では、リーディングブランドである「午後の紅茶」がランキングのトップを独占した。

「食と生活」のマンスリー・ニュースレター<br>在宅時間の増加で増えるおうちカフェこだわり派
「食と生活」のマンスリー・ニュースレター
在宅時間の増加で増えるおうちカフェこだわり派

在宅勤務や外出自粛で自宅で過ごす時間が増える中、コーヒーやお茶の飲み方にも"ある変化"が起きている。今回は在宅時間の増加に着目して、コロナ前後でのコーヒーや日本茶の飲み方の変化を探った。その結果、在宅勤務をしている人ほど豆から挽いたコーヒーや茶葉から淹れた日本茶の飲用が増えていることがわかった。コロナ禍で、手間ひまかけて丁寧にコーヒーやお茶を淹れることにより、おうち時間を大切に過ごしたいという意識が垣間見える。

消費者調査データ 日焼け止め<br>盤石「ビオレUV」、ロングセラーひしめく上位に定着する「スキントーンアクア」
消費者調査データ 日焼け止め
盤石「ビオレUV」、ロングセラーひしめく上位に定着する「スキントーンアクア」

今回の調査では複数項目で「ビオレUV」が首位を獲得した。一方「スキントーンアクア」が再購入意向で首位など、ロングセラーひしめく上位で存在感を増している。10年連続で拡大してきたサンケア市場だが、今年は新型コロナウイルスの影響でインバウンド需要が激減。需要最盛期を前に先行き不透明感が続いている。

会員登録のご案内
消費社会白書2020
研修テキストに使える!コンテンツパッケージ販売のご案内
「戦略200+」比較分析ツールのご案内
マーケティングモニターのご案内
データでわかる辛口性格診断
page top

JMR生活総合研究所マーケティングサイトに掲載の記事・写真・図表などの無断転載を禁止します。著作権はJMR生活総合研究所に属します。

Copyright (c) 1997-2020 Japan Consumer Marketing Research Institute. All rights reserved.