
前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。
第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。
- Tensorflow・・・Googleの開発しているフレームワーク。
- Keras・・・非常に簡単に実装できる。そのため導入としてよい。
- Chainer・・・日本のpreferred networksで開発されている。
それ以外にもMxnetなどがある。
それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。
ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。
Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。
Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。
まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。


0.フレームワークの入手
1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。
1.データの用意
トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。
2.モデルの設定とコンパイル
どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。
ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。
また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。
3.学習
学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。
4.評価
評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。
5.予測
最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。
以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。
参照コンテンツ
【シリーズ】マーケティングのための人工知能入門およびその周辺技術
- (1)人工知能とその社会的インパクト
- (2)人工知能とは
- (3)機械学習の入門およびマーケティング
- (4)ディープラーニングなどの新たな機械学習と因果などの限界
- (5)実践:今日からはじめる機械学習とディープ・ラーニング
- (6)Rを用いたディープラーニング入門
おすすめ新着記事

成長市場を探せ コロナ禍からの回復続く居酒屋業態 けん引車はネオ居酒屋か
コロナ禍で大きな打撃を受けた居酒屋が回復を続けている。けん引しているのは、「ネオ居酒屋」「ネオ大衆酒場」などといわれる業態や、特定のメニューに特化した業態だ。

消費者調査データ チョコレート 首位「明治チョコレート」、追う「ガーナ」、再購入意向上位にはプレミアムチョコレートも
カカオショックのなか、最需要期を迎えたチョコレート市場。調査結果では明治チョコレートが首位で、「失敗しない」安心感のあるロングセラーがそれに続く。再購入意向首位にはリンツで、プチ贅沢需要もうかがえる。

「食と生活」のマンスリー・ニュースレター 主食・米の値上げを8割が実感 価格と品質の間で揺れる食卓
日本人の主食である米は、値上げが続くなか、食頻度の減少が増加を上回る一方、品質を重視する層もみられ、消費者の中で「こだわり」と「節約」が並存していることがわかる。


![戦略家のための知的羅針盤[エム・ネクスト]product by 松田 久一](/img/mnext-sub-title.png)