半歩先を読む日本最大級のマーケティングサイト J-marketing.net


(2019.03)
マーケティングのための人工知能入門およびその周辺技術
(6)Rを用いたディープラーニング入門
客員研究員 沖縄国際大学 金城敬太






 前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。


1.はじめに

 第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。

  • Tensorflow・・・Googleの開発しているフレームワーク。
  • Keras・・・非常に簡単に実装できる。そのため導入としてよい。
  • Chainer・・・日本のpreferred networksで開発されている。

 それ以外にもMxnetなどがある。

 それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。

 ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。

 Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。

 Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。

 まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。


図表1.主な実装のステップ



図表2.ディープラーニングの概念図



0.フレームワークの入手

 1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。

1.データの用意

 トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。

2.モデルの設定とコンパイル

 どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。

 ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。

 また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。

3.学習

 学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。

4.評価

 評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。

5.予測

 最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。


 以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。


次は「Kerasによるディープラーニングの実装」
【続きを読む】(有料会員向け先行公開)

※会員のご登録はこちらをご覧ください。

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事

新着記事

2025.02.06

25年1月の「乗用車販売台数」は3ヶ月ぶりのプラス

2025.02.05

提言論文 新しい群れ集団が生む市場ダイナミズム

2025.02.04

24年12月の「新設住宅着工戸数」は8ヶ月連続のマイナス

  

2025.02.03

企業活動分析 本田技研工業 24年3月期は、販売台数増加により増収増益、営業利益は過去最高に

2025.02.03

企業活動分析 日産自動車株式会社 24年3月期は、販売台数増加に加えコスト管理により増収増益

  

2025.01.31

消費からみた景気指標 24年11月は7項目が改善

2025.01.30

24年12月の「ファーストフード売上高」は46ヶ月連続のプラスに

2025.01.30

24年12月の「ファミリーレストラン売上高」は34ヶ月連続プラス

2025.01.29

24年12月の「全国百貨店売上高」は2ヶ月連続のプラスに

2025.01.29

24年12月の「チェーンストア売上高」は既存店で2ヶ月連続のプラスに

2025.01.29

24年12月の「コンビニエンスストア売上高」は13ヶ月ぶりのマイナスに

2025.01.29

24年11月の「商業動態統計調査」は8ヶ月連続のプラス

2025.01.28

24年12月の「景気の先行き判断」は4ヶ月連続の50ポイント割れに

2025.01.28

24年12月の「景気の現状判断」は10ヶ月連続で50ポイント割れに

2025.01.27

「食と生活」のマンスリー・ニュースレター No.168 管理職は筋トレ率2倍! 20〜30代の美容・健康意識がプロテイン市場をけん引

2025.01.27

企業活動分析 サンドラッグの24年3月期はインバウンド・化粧品需要回復で2期連続の増収増益

2025.01.24

成長市場を探せ コロナも値上げも乗り越えて成長するドラッグストア(2025年)

2025.01.23

24年11月の「広告売上高」は、7ヶ月連続のプラス

2025.01.23

24年11月の「旅行業者取扱高」は19年比で80%に

2025.01.22

24年11月の「家計収入」は2ヶ月連続のプラスに

週間アクセスランキング

1位 2025.01.27

「食と生活」のマンスリー・ニュースレター No.168 管理職は筋トレ率2倍! 20〜30代の美容・健康意識がプロテイン市場をけん引

2位 2024.03.08

消費者調査データ カップめん(2024年3月版)独走「カップヌードル」、「どん兵衛」「赤いきつね/緑のたぬき」が2位争い

3位 2025.01.27

企業活動分析 サンドラッグの24年3月期はインバウンド・化粧品需要回復で2期連続の増収増益

4位 2025.01.24

成長市場を探せ コロナも値上げも乗り越えて成長するドラッグストア(2025年)

5位 2013.03.22

MNEXT ビックカメラによるコジマの買収はメーカーを巻き込んだ衰退業界再編の始まり

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area