

前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。
第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。
- Tensorflow・・・Googleの開発しているフレームワーク。
- Keras・・・非常に簡単に実装できる。そのため導入としてよい。
- Chainer・・・日本のpreferred networksで開発されている。
それ以外にもMxnetなどがある。
それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。
ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。
Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。
Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。
まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。


0.フレームワークの入手
1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。
1.データの用意
トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。
2.モデルの設定とコンパイル
どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。
ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。
また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。
3.学習
学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。
4.評価
評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。
5.予測
最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。
以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。
参照コンテンツ
【シリーズ】マーケティングのための人工知能入門およびその周辺技術
- (1)人工知能とその社会的インパクト
- (2)人工知能とは
- (3)機械学習の入門およびマーケティング
- (4)ディープラーニングなどの新たな機械学習と因果などの限界
- (5)実践:今日からはじめる機械学習とディープ・ラーニング
- (6)Rを用いたディープラーニング入門
おすすめ新着記事

「食と生活」のマンスリー・ニュースレター 成長するコーヒー市場 6つの形態が店頭に共存するワケとは?
コーヒーの国内消費量は、2022年に4年ぶりの増加に転じた。最近では大手コンビニエンスストアがコーヒーのサブスクサービスを実験的に導入する動きがみられる。今回はコンビニを中心にコーヒーがどのように買われているのか調査をおこなった。

消費者調査データ No.397 シャンプー(2023年12月版) 「パンテーン」と「ラックス」、僅差の競り合い
コロナ禍によるインバウンド需要喪失からゆっくり立ち直りつつあるシャンプー市場。調査結果は「パンテーン」が複数項目で首位を獲得したが、2位の「ラックス」との差はごくわずかで競り合いが続いている。国内メーカーでは、独立系の専業メーカーが独自のコンセプトで高いリピート意向を獲得している。

成長市場を探せ 「巣ごもり」後も割安感で堅調な家庭用冷凍食品(2023年)
2022年の家庭用冷凍食品の生産量は、前年比100.8%となる80万5,000トンで、8年連続拡大、過去最高を更新。22年からの食品全般の値上げのなかで、簡便化志向や節約志向から利用が継続されているとみられている。