半歩先を読む日本最大級のマーケティングサイト J-marketing.net


(2019.03)
マーケティングのための人工知能入門およびその周辺技術
(6)Rを用いたディープラーニング入門
客員研究員 沖縄国際大学 金城敬太






 前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。


1.はじめに

 第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。

  • Tensorflow・・・Googleの開発しているフレームワーク。
  • Keras・・・非常に簡単に実装できる。そのため導入としてよい。
  • Chainer・・・日本のpreferred networksで開発されている。

 それ以外にもMxnetなどがある。

 それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。

 ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。

 Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。

 Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。

 まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。


図表1.主な実装のステップ



図表2.ディープラーニングの概念図



0.フレームワークの入手

 1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。

1.データの用意

 トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。

2.モデルの設定とコンパイル

 どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。

 ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。

 また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。

3.学習

 学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。

4.評価

 評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。

5.予測

 最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。


 以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。


次は「Kerasによるディープラーニングの実装」
【続きを読む】(有料会員向け先行公開)

※会員のご登録はこちらをご覧ください。

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事

お知らせ

2024.03.25

当社合田執筆の「猛スピードのクルマはいらない」 これからの高齢化社会に必要な“まちづくり”とは何か? そのヒントは欧米になかった!」がメルクマールに掲載されました。

新着記事

2024.05.17

24年3月の「家計収入」は18ヶ月連続のマイナス

2024.05.17

24年3月の「消費支出」は13ヶ月ぶりのプラス

2024.05.16

24年2月の「現金給与総額」は26ヶ月連続プラス、「所定外労働時間」はマイナス続く

2024.05.16

24年3月は「完全失業率」は横ばい、「有効求人倍率」は改善

2024.05.15

MNEXT 未来を読むー四つの資本主義

2024.05.14

24年3月の「新設住宅着工戸数」は10ヶ月連続マイナスに

2024.05.08

企業活動分析 マルハニチロの23年3月期は、売上高初の1兆円超えで増収増益に

2024.05.13

企業活動分析 伊藤ハム米久HDの23年3月期は価格改定で増収もコスト増響き減益に

週間アクセスランキング

1位 2024.01.18

「食と生活」のマンスリー・ニュースレター おにぎりブーム到来! おにぎりが選ばれる理由とは(2024年1月)

2位 2024.03.13

戦略ケース なぜマクドナルドは値上げしても過去最高売上を更新できたのか

3位 2017.09.19

MNEXT 眼のつけどころ なぜ日本の若者はインスタに走り、世界の若者はタトゥーを入れるのか?

4位 2024.05.08

企業活動分析 ニッスイの23年3月期は売上高過去最高も原材料高や円安で減益に

5位 2009.06.26

【マーケティングFAQ】「需要の価格弾力性」とは

パブリシティ

2023.10.23

週刊トラベルジャーナル2023年10月23日号に、当社代表取締役社長 松田の執筆記事「ラーケーションへの視点 旅の価値問い直す大事な切り口」が掲載されました。

2023.08.07

日経MJ「CM裏表」に、当社代表取締役社長 松田の執筆記事が掲載されました。サントリー ザ・プレミアム・モルツ「すず登場」篇をとりあげています。

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area