半歩先を読む日本最大級のマーケティングサイト J-marketing.net

マーケティング用語集
データマイニング
1.データマイニングとは
 データマイニングとは、データベースにある大量のデータから意味のある特徴を高速に抽出するデータ分析手法のことです。機械学習や統計、人口知能といった分野の技術を応用し、情報探索・アルゴリズム等を用いるという特徴があります。これまでの統計と異なる点は、これまでの統計が仮説検証的であったのに対し、説明変数の選択を自動的に行うなど帰納的・発見的であることがあげられます。
 歴史的には、1994年にIBMのR.Agrawalらにより、大規模データから多頻度アイテム集合を効率よく抽出するアプリオリアルゴリズムが提案されたことに始まります。応用として有名なのは、ある店において「顧客がビールと紙おむつを同時に買う」というルールが抽出されたことがあります。解釈としては「子供のいる家庭で、父親は母親に紙おむつを買うように頼まれ、それと同時に自身のビールを買う傾向がある」ということです。仮説としては極めて想起しにくい組み合わせですので、統計ではなくデータマイニングを行うことで初めて発見された象徴的な事例として語り継がれています。

2.データマイニングの手法と活用
 データマイニングの手法は数多くありますが、ここでは代表的なものを紹介します。
  1. 頻出パターンを抽出する
     データ集合の中から、高頻度で発生する特徴的なパターンを見つける方法で、代表的な手法としては、頻繁に同時に生起する事象同士を相関の強い事象の関係として抽出する技術である「相関ルール」があります。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名です。
  2. データの集合をクラスタと呼ぶグループに分ける(クラスタリング)
     クラスタとは、同じクラスタのデータならば互いに似ていて、違うクラスタならば似ていないようなデータの集まりを意味します。与えられたデータを外的基準なしに自動的に分類する方法で、代表的な手法として「K平均法(K-means法)」があげられます。具体例としては、Webの視聴パターンのデータで、類似したものをまとめることで、視聴傾向が同じ利用者のグループを発見することなどが可能です。
  3. 与えられたデータに対応するカテゴリを予測する(クラス分類)
     代表的なものに「決定木分析(ディシジョンツリー)」があります。ある事項に対する観察結果から、その事項の目標値に関する結論を導く予測モデルで、葉が分類を表し、枝がその分類に至るまでの特徴の集まりを表すような木構造を示します。ビジネスの分野では、顧客特性や傾向を分析するのに使われています。

3.データマイニングの今後
 近年では、ネットワークなど構造を持ったデータからの構造データマイニング、時系列データを扱う時系列データマイニングなど幅広い分野へ拡張されています。応用として、自然言語処理技術と組み合わせることで自由記述文から情報を抽出する、テキストマイニングの技術も急速に発展しています。
 また、マーケティングの分野では、データベースマーケティングなどに利用されており、アマゾンの推薦システムに代表されるような協調フィルタリングといった技術があります。その他、社会調査を目的として大量のブログへのテキストマイニングも行われています。
 今後の展開としては、ユビキタス社会の到来により、センサーから得られるデータが増えるなど、大規模なデータを逐次的に扱う技術の必要性が益々増えると考えられます。






お知らせ

2025.03.06

クレジットカード決済に関する重要なお知らせ

新着記事

2025.05.07

なぜ井上尚弥選手はダウンしたのか

2025.05.07

企業活動分析 アサヒグループHDの24年12月期はプレミアム化の進展や価格改定効果などで増収増益に

2025.04.25

成長市場を探せ 少子化ものともせず、拡大する学習塾市場(2025年)

 

2025.04.24

25年2月の「広告売上高」は、10ヶ月連続のプラス

2025.04.23

25年3月の「コンビニエンスストア売上高」は2ヶ月ぶりのプラスに

2025.04.22

トランプ関税の正義、賢愚、そして帰結 - ポストグロ-バル経済と自由貿易体制(上編)

 

2025.04.22

25年2月の「旅行業者取扱高」は19年比で78%に

2025.04.21

ポートフォリオ戦略からダイナミック・ポートフォリオ分析で統合経営へ

2025.04.21

企業活動分析 2024年12月期のアルファベット(Google)は、検索、AIとも2桁増で過去最高更新

2025.04.18

消費者調査データ カップめん(2025年4月版)別次元の強さ「カップヌードル」、2位争いは和風麺

2025.04.17

25年2月の「商業動態統計調査」は11ヶ月連続のプラス

2025.04.16

25年3月の「景気の現状判断」は13ヶ月連続で50ポイント割れに

2025.04.16

25年3月の「景気の先行き判断」は7ヶ月連続の50ポイント割れに

2025.04.15

25年2月の「消費支出」は4ヶ月ぶりのマイナスに

週間アクセスランキング

1位 2024.05.10

消費者調査データ エナジードリンク(2024年5月版)首位は「モンエナ」、2位争いは三つ巴、再購入意向上位にPBがランクイン

2位 2024.03.08

消費者調査データ カップめん(2024年3月版)独走「カップヌードル」、「どん兵衛」「赤いきつね/緑のたぬき」が2位争い

3位 2025.04.11

「食と生活」のマンスリー・ニュースレター チョコレートの今後購入意向は80%以上! 意外にも男性20~30代と管理職が市場を牽引

4位 2024.10.24

MNEXT 日本を揺るがす「雪崩現象」―「岩盤保守」の正体

5位 2024.11.06

「食と生活」のマンスリー・ニュースレター 伸長するパン市場  背景にある簡便化志向や節約志向

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area