半歩先を読む日本最大級のマーケティングサイト J-marketing.net


(2019.03)
マーケティングのための人工知能入門およびその周辺技術
(6)Rを用いたディープラーニング入門
客員研究員 沖縄国際大学 金城敬太






 前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。


1.はじめに

 第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。

  • Tensorflow・・・Googleの開発しているフレームワーク。
  • Keras・・・非常に簡単に実装できる。そのため導入としてよい。
  • Chainer・・・日本のpreferred networksで開発されている。

 それ以外にもMxnetなどがある。

 それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。

 ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。

 Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。

 Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。

 まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。


図表1.主な実装のステップ



図表2.ディープラーニングの概念図



0.フレームワークの入手

 1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。

1.データの用意

 トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。

2.モデルの設定とコンパイル

 どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。

 ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。

 また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。

3.学習

 学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。

4.評価

 評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。

5.予測

 最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。


 以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。


次は「Kerasによるディープラーニングの実装」
【続きを読む】(有料会員向け先行公開)

※会員のご登録はこちらをご覧ください。

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事

新着記事

2026.05.21

26年3月の「現金給与総額」は51ヶ月連続プラス、「所定外労働時間」はマイナス続く

2026.05.20

26年3月は「有効求人倍率」、「完全失業率」とも悪化

2026.05.19

26年3月の「消費支出」は2ヶ月ぶりのマイナスに

2026.05.19

26年3月は「家計収入」、「可処分所得」ともプラスに

2026.05.18

企業活動分析 花王の25年12月期は、シェア拡大などで増収増益に

2026.05.15

消費者調査データ 「キリン 氷結」、「ほろよい」デッドヒート、サントリーは「-196℃」「角ハイ」も上位に

2026.05.14

26年4月の「乗用車販売台数」は10ヶ月ぶりのプラス

2026.05.13

26年3月の「新設住宅着工戸数」は5ヶ月連続のマイナスに

2026.05.11

企業活動分析 サイゼリヤの25年8月期は、国内好調、アジア新店拡大などで増収増益に

2026.05.08

26年3月の「全国百貨店売上高」は3ヶ月連続のプラスに

2026.05.08

26年3月の「ファーストフード売上高」は61ヶ月連続のプラスに

2026.05.08

26年3月の「ファミリーレストラン売上高」は49ヶ月連続プラス

2026.05.07

企業活動分析 くら寿司の25年10月期は、フェアやコラボで過去最高売上も、微減益に

週間アクセスランキング

1位 2025.05.07

なぜ井上尚弥選手はダウンしたのか

2位 2013.03.22

MNEXT ビックカメラによるコジマの買収はメーカーを巻き込んだ衰退業界再編の始まり

3位 2025.06.20

消費者調査データ ミネラルウォーター(2025年6月版) 強さ鮮明「サントリー 天然水」、「い・ろ・は・す」に水をあける

4位 2024.06.21

消費者調査データ ビール系飲料(2024年6月版) 首位「スーパードライ」、キリンの新ビール「晴れ風」にも注目

5位 2022.01.28

MNEXT 眼のつけどころ ePOPで成熟ブランドのリブランディング― 2022年春の提案

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area