5 przykładów analizy skupień w prawdziwym życiu


Analiza skupień to technika stosowana w uczeniu maszynowym , która próbuje znaleźć grupy obserwacji w zbiorze danych.

Celem analizy skupień jest znalezienie takich skupień, w których obserwacje w obrębie każdego skupienia są do siebie dość podobne, podczas gdy obserwacje w różnych skupieniach znacznie się od siebie różnią.

Poniższe przykłady pokazują, jak analiza skupień jest wykorzystywana w różnych sytuacjach rzeczywistych.

Przykład 1: Marketing detaliczny

Firmy detaliczne często korzystają z grupowania w celu identyfikacji grup podobnych gospodarstw domowych.

Na przykład firma zajmująca się sprzedażą detaliczną może gromadzić następujące informacje o gospodarstwie domowym:

  • Przychód domowy
  • Wielkość gospodarstwa domowego
  • Zawód głowy gospodarstwa domowego
  • Odległość do najbliższego obszaru miejskiego

Następnie mogą wprowadzić te zmienne do algorytmu grupowania, aby potencjalnie zidentyfikować następujące skupienia:

  • Grupa 1: Małe rodziny, duże wydatki
  • Grupa 2: Duża rodzina, duże wydatki
  • Grupa 3: Mała rodzina, niskie wydatki
  • Grupa 4: Duża rodzina, niskie wydatki

Firma może następnie wysyłać spersonalizowane reklamy lub listy sprzedażowe do każdego gospodarstwa domowego na podstawie prawdopodobieństwa reakcji na określone typy reklam.

Przykład 2: usługi przesyłania strumieniowego

Usługi przesyłania strumieniowego często korzystają z analizy skupień, aby zidentyfikować widzów o podobnych zachowaniach.

Na przykład usługa przesyłania strumieniowego może gromadzić następujące dane o osobach:

  • Minut oglądania dziennie
  • Łączna liczba sesji oglądania w tygodniu
  • Liczba unikalnych programów oglądanych w miesiącu

Korzystając z tych wskaźników, usługa przesyłania strumieniowego może przeprowadzić analizę skupień w celu zidentyfikowania użytkowników o wysokim i niskim poziomie wykorzystania, aby mogli wiedzieć, na kogo powinni wydać większość swojego budżetu reklamowego.

Przykład 3: Nauka o sporcie

Naukowcy zajmujący się danymi dotyczącymi drużyn sportowych często korzystają z grupowania w celu identyfikacji podobnych graczy.

Na przykład profesjonalne drużyny koszykówki mogą gromadzić następujące informacje o zawodnikach:

  • Punkty na mecz
  • Zbiórek na mecz
  • Asysty na mecz
  • Przechwyty na mecz

Następnie mogą wprowadzić te zmienne do algorytmu grupowania, aby zidentyfikować podobnych graczy, aby mogli trenować ze sobą i wykonywać określone ćwiczenia w oparciu o ich mocne i słabe strony.

Przykład 4: Marketing e-mailowy

Wiele firm korzysta z analizy skupień w celu identyfikacji podobnych konsumentów, aby móc dostosować e-maile wysyłane do konsumentów w sposób maksymalizujący przychody.

Na przykład firma może gromadzić następujące informacje o konsumentach:

  • Procent otwartych e-maili
  • Liczba kliknięć na e-mail
  • Czas spędzony na sprawdzaniu e-maili

Korzystając z tych wskaźników, firma może przeprowadzić analizę skupień, aby zidentyfikować konsumentów korzystających z poczty e-mail w podobny sposób i dostosować typy wiadomości e-mail oraz częstotliwość wysyłania wiadomości do różnych grup klientów.

Przykład 5: Ubezpieczenie zdrowotne

Aktuariusze zakładów ubezpieczeń zdrowotnych często korzystali z analizy skupień w celu zidentyfikowania „grup” konsumentów, którzy korzystają z ubezpieczenia zdrowotnego w określony sposób.

Na przykład aktuariusz może gromadzić następujące informacje o gospodarstwach domowych:

  • Całkowita liczba wizyt lekarskich w ciągu roku
  • Całkowita wielkość gospodarstwa domowego
  • Całkowita liczba chorób przewlekłych w gospodarstwie domowym
  • Średni wiek członków gospodarstwa domowego

Aktuariusz może następnie wprowadzić te zmienne do algorytmu grupowania w celu zidentyfikowania podobnych gospodarstw domowych. Zakład ubezpieczeń zdrowotnych może wówczas ustalić miesięczne składki na podstawie tego, jak często gospodarstwa domowe w określonych grupach będą korzystać z jego ubezpieczenia.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak przeprowadzać różne typy analiz skupień przy użyciu statystycznych języków programowania:

Jak wykonać grupowanie K-średnich w Pythonie
Jak wykonać grupowanie K-średnich w R
Jak wykonać grupowanie K-Medoids w R
Jak wykonać grupowanie hierarchiczne w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *