現実世界におけるクラスター分析の 5 つの例
クラスター分析は、データセット内の観測値のグループを見つけようとする機械学習で使用される手法です。
クラスター分析の目的は、各クラスター内の観測値が互いに非常に類似している一方で、異なるクラスター内の観測値が互いに大きく異なるようなクラスターを見つけることです。
次の例は、現実世界のさまざまな状況でクラスター分析がどのように使用されるかを示しています。
例 1: 小売マーケティング
小売企業はよくクラスタリングを使用して、類似した世帯のグループを特定します。
たとえば、小売業は次のような世帯情報を収集する場合があります。
- 世帯収入
- 世帯規模
- 世帯主の職業
- 最寄りの市街地までの距離
次に、これらの変数をクラスタリング アルゴリズムに導入して、次のクラスターを識別できる可能性があります。
- グループ 1: 少人数の家族、多額の支出をする
- グループ 2: 大家族、浪費家
- グループ 3: 少人数の家族、低支出
- グループ 4: 大家族、低支出
同社は、特定の種類の広告に反応する可能性に基づいて、各世帯にパーソナライズされた広告やセールスレターを送信できます。
例 2: ストリーミング サービス
ストリーミング サービスでは、クラスタリング分析を使用して、同様の動作を持つ視聴者を特定することがよくあります。
たとえば、ストリーミング サービスは個人に関する次のデータを収集する場合があります。
- 1 日あたりの視聴時間(分)
- 1 週間あたりの視聴セッションの合計数
- 1 か月あたりに視聴されたユニークな番組の数
これらの指標を使用して、ストリーミング サービスはクラスター分析を実行して、使用率の高いユーザーと低いユーザーを識別し、広告予算の大部分を誰に費やすべきかを知ることができます。
例 3: スポーツ科学
スポーツ チームのデータ サイエンティストは、類似した選手を特定するためにクラスタリングをよく使用します。
たとえば、プロ バスケットボール チームは次の選手情報を収集する場合があります。
- 1試合あたりのポイント
- 1試合あたりのリバウンド数
- 試合ごとのアシスト数
- 1試合あたりの盗塁数
次に、これらの変数をグループ化アルゴリズムに入力して、似たようなプレーヤーを特定し、お互いにトレーニングしたり、長所と短所に基づいて特定の訓練を実行したりすることができます。
例 4:電子メール マーケティング
多くの企業は、クラスター分析を使用して類似した消費者を特定し、収益を最大化する方法で消費者に送信する電子メールを調整しています。
たとえば、企業は消費者に関する次の情報を収集する場合があります。
- 開封されたメールの割合
- メールごとのクリック数
- メールチェックに費やした時間
これらの指標を使用すると、企業はクラスター分析を実行して、同様の方法で電子メールを使用する消費者を特定し、さまざまな顧客グループに送信する電子メールの種類と頻度を調整できます。
例 5: 健康保険
健康保険会社の保険計理士は、特定の方法で健康保険を利用する消費者の「クラスター」を特定するためにクラスター分析をよく使用してきました。
たとえば、保険数理士は世帯に関する次の情報を収集する場合があります。
- 年間の医師の合計訪問回数
- 世帯の合計人数
- 世帯あたりの慢性疾患の総数
- 世帯員の平均年齢
その後、保険計理士はこれらの変数をクラスタリング アルゴリズムに入力して、類似の世帯を特定できます。健康保険会社は、特定のグループの世帯がどのくらいの頻度で保険を利用すると予想されるかに基づいて、毎月の保険料を設定できます。
追加リソース
次のチュートリアルでは、統計プログラミング言語を使用してさまざまなタイプのクラスター分析を実行する方法について説明します。
Python で K-Means クラスタリングを実行する方法
R で K-Means クラスタリングを実行する方法
R で K-Medoids クラスタリングを実行する方法
R で階層的クラスタリングを実行する方法