半歩先を読む日本最大級のマーケティングサイト J-marketing.net

マーケティング用語集
データマイニング
1.データマイニングとは
 データマイニングとは、データベースにある大量のデータから意味のある特徴を高速に抽出するデータ分析手法のことです。機械学習や統計、人口知能といった分野の技術を応用し、情報探索・アルゴリズム等を用いるという特徴があります。これまでの統計と異なる点は、これまでの統計が仮説検証的であったのに対し、説明変数の選択を自動的に行うなど帰納的・発見的であることがあげられます。
 歴史的には、1994年にIBMのR.Agrawalらにより、大規模データから多頻度アイテム集合を効率よく抽出するアプリオリアルゴリズムが提案されたことに始まります。応用として有名なのは、ある店において「顧客がビールと紙おむつを同時に買う」というルールが抽出されたことがあります。解釈としては「子供のいる家庭で、父親は母親に紙おむつを買うように頼まれ、それと同時に自身のビールを買う傾向がある」ということです。仮説としては極めて想起しにくい組み合わせですので、統計ではなくデータマイニングを行うことで初めて発見された象徴的な事例として語り継がれています。

2.データマイニングの手法と活用
 データマイニングの手法は数多くありますが、ここでは代表的なものを紹介します。
  1. 頻出パターンを抽出する
     データ集合の中から、高頻度で発生する特徴的なパターンを見つける方法で、代表的な手法としては、頻繁に同時に生起する事象同士を相関の強い事象の関係として抽出する技術である「相関ルール」があります。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名です。
  2. データの集合をクラスタと呼ぶグループに分ける(クラスタリング)
     クラスタとは、同じクラスタのデータならば互いに似ていて、違うクラスタならば似ていないようなデータの集まりを意味します。与えられたデータを外的基準なしに自動的に分類する方法で、代表的な手法として「K平均法(K-means法)」があげられます。具体例としては、Webの視聴パターンのデータで、類似したものをまとめることで、視聴傾向が同じ利用者のグループを発見することなどが可能です。
  3. 与えられたデータに対応するカテゴリを予測する(クラス分類)
     代表的なものに「決定木分析(ディシジョンツリー)」があります。ある事項に対する観察結果から、その事項の目標値に関する結論を導く予測モデルで、葉が分類を表し、枝がその分類に至るまでの特徴の集まりを表すような木構造を示します。ビジネスの分野では、顧客特性や傾向を分析するのに使われています。

3.データマイニングの今後
 近年では、ネットワークなど構造を持ったデータからの構造データマイニング、時系列データを扱う時系列データマイニングなど幅広い分野へ拡張されています。応用として、自然言語処理技術と組み合わせることで自由記述文から情報を抽出する、テキストマイニングの技術も急速に発展しています。
 また、マーケティングの分野では、データベースマーケティングなどに利用されており、アマゾンの推薦システムに代表されるような協調フィルタリングといった技術があります。その他、社会調査を目的として大量のブログへのテキストマイニングも行われています。
 今後の展開としては、ユビキタス社会の到来により、センサーから得られるデータが増えるなど、大規模なデータを逐次的に扱う技術の必要性が益々増えると考えられます。






新着記事

2026.01.16

成長市場を探せ 8年連続プラスのスナック菓子、インバウンドも貢献(2026年)

2026.01.15

25年11月の「現金給与総額」は47ヶ月連続プラス、「所定外労働時間」はマイナス続く

2026.01.14

25年11月は「有効求人倍率」、「完全失業率」とも横ばいに

2026.01.13

企業活動分析 ウエルシアの25年2月期は、調剤堅調も人材投資などの人件費増加で増収減益に

2026.01.09

消費者調査データ シャンプー(2026年1月版) 首位は「パンテーン」、迫る「ラックス」、再購入意向には高機能ブランド並ぶ

2026.01.08

25年12月の「乗用車販売台数」は6ヶ月連続のマイナス

2026.01.07

25年11月の「新設住宅着工戸数」は再びマイナスに

2026.01.06

企業活動分析 任天堂の25年3月期は、Switch末期で減収減益も、6月発売のSwitch2発売好調で反転の布石に

2025.12.26

消費者調査データ レトルトカレー(2025年12月版) 首位「咖喱屋カレー」、再購入意向上位はソースタイプやPBが

2025.12.26

25年11月の「チェーンストア売上高」は既存店で9ヶ月連続のプラス

2025.12.26

25年11月の「全国百貨店売上高」は4ヶ月連続のプラス

2025.12.26

25年11月の「ファミリーレストラン売上高」は45ヶ月連続プラス

2025.11.28

25年11月の「ファーストフード売上高」は57ヶ月連続のプラスに

週間アクセスランキング

1位 2025.12.16

提言論文 高消費時代への戦略経営と価値マーケティング(2025年)

2位 2019.04.16

MNEXT 眼のつけどころ 次の時代のマーケティング戦略を考える (1)GAFA、増税、キャッシュレスなどへの対応

3位 2019.02.04

MNEXT 眼のつけどころ 巨大融合メディアへの戦略的対応―情報チャネルの再設計の提案

4位 2022.11.29

MNEXT 2023年の消費と戦略経営~マーケティングの6つの革新~

5位 2022.01.28

MNEXT 眼のつけどころ ePOPで成熟ブランドのリブランディング― 2022年春の提案

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area