半歩先を読む日本最大級のマーケティングサイト J-marketing.net


(2019.03)
マーケティングのための人工知能入門およびその周辺技術
(6)Rを用いたディープラーニング入門
客員研究員 沖縄国際大学 金城敬太






 前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。


1.はじめに

 第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。

  • Tensorflow・・・Googleの開発しているフレームワーク。
  • Keras・・・非常に簡単に実装できる。そのため導入としてよい。
  • Chainer・・・日本のpreferred networksで開発されている。

 それ以外にもMxnetなどがある。

 それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。

 ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。

 Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。

 Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。

 まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。


図表1.主な実装のステップ



図表2.ディープラーニングの概念図



0.フレームワークの入手

 1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。

1.データの用意

 トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。

2.モデルの設定とコンパイル

 どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。

 ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。

 また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。

3.学習

 学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。

4.評価

 評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。

5.予測

 最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。


 以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。


次は「Kerasによるディープラーニングの実装」
【続きを読む】(有料会員向け先行公開)

※会員のご登録はこちらをご覧ください。

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事

お知らせ

2024.03.25

当社合田執筆の「猛スピードのクルマはいらない」 これからの高齢化社会に必要な“まちづくり”とは何か? そのヒントは欧米になかった!」がメルクマールに掲載されました。

2024.04.22

JMR生活総合研究所 ゴールデンウイーク期間中の営業のお知らせ

新着記事

2024.04.23

24年2月の「旅行業者取扱高」は19年比で78%に

2024.04.23

24年2月の「広告売上高」は、3ヶ月連続のマイナス

2024.04.22

企業活動分析 カルビーの23年3月期は需要堅調もコスト高吸収できず減益に

2024.04.22

企業活動分析 亀田製菓の23年3月期は国内外好調で増収もコスト増で減益着地

2024.04.22

企業活動分析 大正製薬の23年3月期はOTCなど好調で増収増益

2024.04.19

企業活動分析 森永製菓の23年3月期は、「inゼリー」等好調で2年連続最高益更新

2024.04.18

24年2月の「商業動態統計調査」は36ヶ月連続のプラスに

2024.04.17

24年3月の「景気の現状判断」は14ヶ月ぶりに50ポイント割れに

2024.04.17

24年3月の「景気の先行き判断」は5ヶ月連続で50ポイント超えに

2024.04.16

24年2月の「家計収入」は17ヶ月連続のマイナス

2024.04.16

24年2月の「消費支出」は12ヶ月連続のマイナス

週間アクセスランキング

1位 2024.04.05

消費者調査データ ノンアルコール飲料(2024年4月版) 首位は「ドライゼロ」、追う「オールフリー」「のんある気分」

2位 2024.04.03

24年3月の「乗用車販売台数」は3ヶ月連続の2桁マイナス

3位 2022.05.10

消費者調査データ エナジードリンク(2022年5月版) 「レッドブル」「モンスター」認知率拡大、上位の牙城揺るがず

4位 2013.03.22

MNEXT ビックカメラによるコジマの買収はメーカーを巻き込んだ衰退業界再編の始まり

5位 2016.03.16

【マーケティングFAQ】どうすればブランド力を強化できるか

パブリシティ

2023.10.23

週刊トラベルジャーナル2023年10月23日号に、当社代表取締役社長 松田の執筆記事「ラーケーションへの視点 旅の価値問い直す大事な切り口」が掲載されました。

2023.08.07

日経MJ「CM裏表」に、当社代表取締役社長 松田の執筆記事が掲載されました。サントリー ザ・プレミアム・モルツ「すず登場」篇をとりあげています。

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area