半歩先を読む日本最大級のマーケティングサイト J-marketing.net

マーケティング用語集
データマイニング
1.データマイニングとは
 データマイニングとは、データベースにある大量のデータから意味のある特徴を高速に抽出するデータ分析手法のことです。機械学習や統計、人口知能といった分野の技術を応用し、情報探索・アルゴリズム等を用いるという特徴があります。これまでの統計と異なる点は、これまでの統計が仮説検証的であったのに対し、説明変数の選択を自動的に行うなど帰納的・発見的であることがあげられます。
 歴史的には、1994年にIBMのR.Agrawalらにより、大規模データから多頻度アイテム集合を効率よく抽出するアプリオリアルゴリズムが提案されたことに始まります。応用として有名なのは、ある店において「顧客がビールと紙おむつを同時に買う」というルールが抽出されたことがあります。解釈としては「子供のいる家庭で、父親は母親に紙おむつを買うように頼まれ、それと同時に自身のビールを買う傾向がある」ということです。仮説としては極めて想起しにくい組み合わせですので、統計ではなくデータマイニングを行うことで初めて発見された象徴的な事例として語り継がれています。

2.データマイニングの手法と活用
 データマイニングの手法は数多くありますが、ここでは代表的なものを紹介します。
  1. 頻出パターンを抽出する
     データ集合の中から、高頻度で発生する特徴的なパターンを見つける方法で、代表的な手法としては、頻繁に同時に生起する事象同士を相関の強い事象の関係として抽出する技術である「相関ルール」があります。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名です。
  2. データの集合をクラスタと呼ぶグループに分ける(クラスタリング)
     クラスタとは、同じクラスタのデータならば互いに似ていて、違うクラスタならば似ていないようなデータの集まりを意味します。与えられたデータを外的基準なしに自動的に分類する方法で、代表的な手法として「K平均法(K-means法)」があげられます。具体例としては、Webの視聴パターンのデータで、類似したものをまとめることで、視聴傾向が同じ利用者のグループを発見することなどが可能です。
  3. 与えられたデータに対応するカテゴリを予測する(クラス分類)
     代表的なものに「決定木分析(ディシジョンツリー)」があります。ある事項に対する観察結果から、その事項の目標値に関する結論を導く予測モデルで、葉が分類を表し、枝がその分類に至るまでの特徴の集まりを表すような木構造を示します。ビジネスの分野では、顧客特性や傾向を分析するのに使われています。

3.データマイニングの今後
 近年では、ネットワークなど構造を持ったデータからの構造データマイニング、時系列データを扱う時系列データマイニングなど幅広い分野へ拡張されています。応用として、自然言語処理技術と組み合わせることで自由記述文から情報を抽出する、テキストマイニングの技術も急速に発展しています。
 また、マーケティングの分野では、データベースマーケティングなどに利用されており、アマゾンの推薦システムに代表されるような協調フィルタリングといった技術があります。その他、社会調査を目的として大量のブログへのテキストマイニングも行われています。
 今後の展開としては、ユビキタス社会の到来により、センサーから得られるデータが増えるなど、大規模なデータを逐次的に扱う技術の必要性が益々増えると考えられます。






お知らせ

2024.03.25

当社合田執筆の「猛スピードのクルマはいらない」 これからの高齢化社会に必要な“まちづくり”とは何か? そのヒントは欧米になかった!」がメルクマールに掲載されました。

新着記事

2024.07.26

消費者調査データ 炭酸飲料(2024年7月版)  首位「コカ・コーラ」、迫る「三ツ矢サイダー」、高い再購入意向の無糖炭酸水

2024.07.25

24年5月の「広告売上高」は、6ヶ月ぶりのプラス

2024.07.24

24年5月の「旅行業者取扱高」は19年比で72%に

2024.07.23

24年5月の「商業動態統計調査」は2ヶ月連続のプラス

2024.07.22

企業活動分析 キユーピー株式会社 23年11月期は海外など好調で増収も原材料高騰で2桁減益に

2024.07.22

企業活動分析 カゴメ株式会社 23年12月期は引き続き海外事業がけん引し増収増益に

2024.07.19

企業活動分析 ライオン株式会社(2023年12月期) 増収も土地譲渡益の反動等で減益に

2024.07.19

企業活動分析 ユニリーバ(Unilever)(2023年12月期) 減収減益、事業部門の業績格差受け、新成長戦略を修正へ

2024.07.19

24年6月の「景気の先行き判断」は3ヶ月連続で50ポイント割れに

2024.07.18

24年6月の「景気の現状判断」は4ヶ月連続で50ポイント割れに

2024.07.17

MNEXT 円安は歓迎すべきかー過熱する円安論争

2024.07.16

企業活動分析 山崎製パン株式会社 23年12月期は大幅な増収増益で過去最高益に

2024.07.12

消費者調査データ スポーツドリンク・熱中症対策飲料(2024年7月版) 首位「ポカリスエット」、追い上げる「アクエリアス」

2024.07.11

24年5月の「消費支出」はふたたびマイナスに

2024.07.10

24年5月の「家計収入」は20ヶ月ぶりのプラス

2024.07.09

24年4月の「現金給与総額」は28ヶ月連続プラス、「所定外労働時間」はマイナス続く

2024.07.08

企業活動分析 大塚HD 23年12月期は売上は過去最高を記録、医療事業の減損損失で減益に

2024.07.08

企業活動分析 小林製薬の23年12月期は、R&Dや宣伝広告への積極投資を行い増収減益に

2024.07.05

成長市場を探せ 初の6,000億円超え、猛暑に伸びるアイスクリーム(2024年)

週間アクセスランキング

1位 2017.09.19

MNEXT 眼のつけどころ なぜ日本の若者はインスタに走り、世界の若者はタトゥーを入れるのか?

2位 2024.07.03

MNEXT コロナ禍の前中後の内食もどりはあったのか? -食欲望の現在-

3位 2024.03.13

戦略ケース なぜマクドナルドは値上げしても過去最高売上を更新できたのか

4位 2019.09.10

戦略ケース プラットフォームビジネスで急拡大するウーバーイーツ

5位 2024.03.08

消費者調査データ カップめん(2024年3月版)独走「カップヌードル」、「どん兵衛」「赤いきつね/緑のたぬき」が2位争い

パブリシティ

2023.10.23

週刊トラベルジャーナル2023年10月23日号に、当社代表取締役社長 松田の執筆記事「ラーケーションへの視点 旅の価値問い直す大事な切り口」が掲載されました。

2023.08.07

日経MJ「CM裏表」に、当社代表取締役社長 松田の執筆記事が掲載されました。サントリー ザ・プレミアム・モルツ「すず登場」篇をとりあげています。

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area