半歩先を読む日本最大級のマーケティングサイト J-marketing.net


(2019.03)
マーケティングのための人工知能入門およびその周辺技術
(6)Rを用いたディープラーニング入門
客員研究員 沖縄国際大学 金城敬太






 前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。


1.はじめに

 第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。

  • Tensorflow・・・Googleの開発しているフレームワーク。
  • Keras・・・非常に簡単に実装できる。そのため導入としてよい。
  • Chainer・・・日本のpreferred networksで開発されている。

 それ以外にもMxnetなどがある。

 それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。

 ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。

 Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。

 Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。

 まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。


図表1.主な実装のステップ



図表2.ディープラーニングの概念図



0.フレームワークの入手

 1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。

1.データの用意

 トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。

2.モデルの設定とコンパイル

 どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。

 ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。

 また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。

3.学習

 学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。

4.評価

 評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。

5.予測

 最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。


 以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。


次は「Kerasによるディープラーニングの実装」
【続きを読む】(有料会員向け先行公開)

※会員のご登録はこちらをご覧ください。

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事

新着記事

2025.06.16

提言論文 なぜそのブランドを選ぶのか - 性格で読み解くブランド選好の心理

2025.06.13

成長市場を探せ カカオショックのなか、過去最高を更新したチョコレート市場(2025年)

2025.06.12

25年5月の「景気の現状判断」は15ヶ月連続で50ポイント割れに

2025.06.11

25年4月の「家計収入」は前年から横ばいに、「可処分所得」は4ヶ月ぶりのプラス

2025.06.11

25年4月の「消費支出」は2ヶ月連続のプラスに

2025.06.10

25年4月の「現金給与総額」は40ヶ月連続プラス、「所定外労働時間」はマイナス続く

2025.06.09

企業活動分析 P&Gの24年6月期決算は、7期連続増収、2期連続増益も25年は逆風予想

2025.06.06

25年4月は「完全失業率」、「有効求人倍率」とも横ばいに

2025.06.05

「食と生活」のマンスリー・ニュースレター 異なる購買体験を提供するリアル書店とEC書店 衝動買いが満足度を最大20%アップ!

2025.06.04

25年5月の「乗用車販売台数」は5ヶ月連続のプラス

2025.06.03

25年4月の「新設住宅着工戸数」は3ヶ月ぶりのマイナスに

2025.06.03

消費からみた景気指標 25年3月は6項目が改善

週間アクセスランキング

1位 2025.06.02

寡占米市場の高い米価の行方 - 値下げ政策の賢愚

2位 2024.05.10

消費者調査データ エナジードリンク(2024年5月版)首位は「モンエナ」、2位争いは三つ巴、再購入意向上位にPBがランクイン

3位 2013.03.22

MNEXT ビックカメラによるコジマの買収はメーカーを巻き込んだ衰退業界再編の始まり

4位 2025.06.05

「食と生活」のマンスリー・ニュースレター 異なる購買体験を提供するリアル書店とEC書店 衝動買いが満足度を最大20%アップ!

5位 2017.09.19

MNEXT 眼のつけどころ なぜ日本の若者はインスタに走り、世界の若者はタトゥーを入れるのか?

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area