5 przykładów analizy skupień w prawdziwym życiu
Analiza skupień to technika stosowana w uczeniu maszynowym , która próbuje znaleźć grupy obserwacji w zbiorze danych.
Celem analizy skupień jest znalezienie takich skupień, w których obserwacje w obrębie każdego skupienia są do siebie dość podobne, podczas gdy obserwacje w różnych skupieniach znacznie się od siebie różnią.
Poniższe przykłady pokazują, jak analiza skupień jest wykorzystywana w różnych sytuacjach rzeczywistych.
Przykład 1: Marketing detaliczny
Firmy detaliczne często korzystają z grupowania w celu identyfikacji grup podobnych gospodarstw domowych.
Na przykład firma zajmująca się sprzedażą detaliczną może gromadzić następujące informacje o gospodarstwie domowym:
- Przychód domowy
- Wielkość gospodarstwa domowego
- Zawód głowy gospodarstwa domowego
- Odległość do najbliższego obszaru miejskiego
Następnie mogą wprowadzić te zmienne do algorytmu grupowania, aby potencjalnie zidentyfikować następujące skupienia:
- Grupa 1: Małe rodziny, duże wydatki
- Grupa 2: Duża rodzina, duże wydatki
- Grupa 3: Mała rodzina, niskie wydatki
- Grupa 4: Duża rodzina, niskie wydatki
Firma może następnie wysyłać spersonalizowane reklamy lub listy sprzedażowe do każdego gospodarstwa domowego na podstawie prawdopodobieństwa reakcji na określone typy reklam.
Przykład 2: usługi przesyłania strumieniowego
Usługi przesyłania strumieniowego często korzystają z analizy skupień, aby zidentyfikować widzów o podobnych zachowaniach.
Na przykład usługa przesyłania strumieniowego może gromadzić następujące dane o osobach:
- Minut oglądania dziennie
- Łączna liczba sesji oglądania w tygodniu
- Liczba unikalnych programów oglądanych w miesiącu
Korzystając z tych wskaźników, usługa przesyłania strumieniowego może przeprowadzić analizę skupień w celu zidentyfikowania użytkowników o wysokim i niskim poziomie wykorzystania, aby mogli wiedzieć, na kogo powinni wydać większość swojego budżetu reklamowego.
Przykład 3: Nauka o sporcie
Naukowcy zajmujący się danymi dotyczącymi drużyn sportowych często korzystają z grupowania w celu identyfikacji podobnych graczy.
Na przykład profesjonalne drużyny koszykówki mogą gromadzić następujące informacje o zawodnikach:
- Punkty na mecz
- Zbiórek na mecz
- Asysty na mecz
- Przechwyty na mecz
Następnie mogą wprowadzić te zmienne do algorytmu grupowania, aby zidentyfikować podobnych graczy, aby mogli trenować ze sobą i wykonywać określone ćwiczenia w oparciu o ich mocne i słabe strony.
Przykład 4: Marketing e-mailowy
Wiele firm korzysta z analizy skupień w celu identyfikacji podobnych konsumentów, aby móc dostosować e-maile wysyłane do konsumentów w sposób maksymalizujący przychody.
Na przykład firma może gromadzić następujące informacje o konsumentach:
- Procent otwartych e-maili
- Liczba kliknięć na e-mail
- Czas spędzony na sprawdzaniu e-maili
Korzystając z tych wskaźników, firma może przeprowadzić analizę skupień, aby zidentyfikować konsumentów korzystających z poczty e-mail w podobny sposób i dostosować typy wiadomości e-mail oraz częstotliwość wysyłania wiadomości do różnych grup klientów.
Przykład 5: Ubezpieczenie zdrowotne
Aktuariusze zakładów ubezpieczeń zdrowotnych często korzystali z analizy skupień w celu zidentyfikowania „grup” konsumentów, którzy korzystają z ubezpieczenia zdrowotnego w określony sposób.
Na przykład aktuariusz może gromadzić następujące informacje o gospodarstwach domowych:
- Całkowita liczba wizyt lekarskich w ciągu roku
- Całkowita wielkość gospodarstwa domowego
- Całkowita liczba chorób przewlekłych w gospodarstwie domowym
- Średni wiek członków gospodarstwa domowego
Aktuariusz może następnie wprowadzić te zmienne do algorytmu grupowania w celu zidentyfikowania podobnych gospodarstw domowych. Zakład ubezpieczeń zdrowotnych może wówczas ustalić miesięczne składki na podstawie tego, jak często gospodarstwa domowe w określonych grupach będą korzystać z jego ubezpieczenia.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak przeprowadzać różne typy analiz skupień przy użyciu statystycznych języków programowania:
Jak wykonać grupowanie K-średnich w Pythonie
Jak wykonać grupowanie K-średnich w R
Jak wykonać grupowanie K-Medoids w R
Jak wykonać grupowanie hierarchiczne w R