5 przykładów analizy skupień w prawdziwym życiu

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Analiza skupień to technika stosowana w uczeniu maszynowym , która próbuje znaleźć grupy obserwacji w zbiorze danych.

Celem analizy skupień jest znalezienie takich skupień, w których obserwacje w obrębie każdego skupienia są do siebie dość podobne, podczas gdy obserwacje w różnych skupieniach znacznie się od siebie różnią.

Poniższe przykłady pokazują, jak analiza skupień jest wykorzystywana w różnych sytuacjach rzeczywistych.

Przykład 1: Marketing detaliczny

Firmy detaliczne często korzystają z grupowania w celu identyfikacji grup podobnych gospodarstw domowych.

Na przykład firma zajmująca się sprzedażą detaliczną może gromadzić następujące informacje o gospodarstwie domowym:

Przychód domowy
Wielkość gospodarstwa domowego
Zawód głowy gospodarstwa domowego
Odległość do najbliższego obszaru miejskiego

Następnie mogą wprowadzić te zmienne do algorytmu grupowania, aby potencjalnie zidentyfikować następujące skupienia:

Grupa 1: Małe rodziny, duże wydatki
Grupa 2: Duża rodzina, duże wydatki
Grupa 3: Mała rodzina, niskie wydatki
Grupa 4: Duża rodzina, niskie wydatki

Firma może następnie wysyłać spersonalizowane reklamy lub listy sprzedażowe do każdego gospodarstwa domowego na podstawie prawdopodobieństwa reakcji na określone typy reklam.

Przykład 2: usługi przesyłania strumieniowego

Usługi przesyłania strumieniowego często korzystają z analizy skupień, aby zidentyfikować widzów o podobnych zachowaniach.

Na przykład usługa przesyłania strumieniowego może gromadzić następujące dane o osobach:

Minut oglądania dziennie
Łączna liczba sesji oglądania w tygodniu
Liczba unikalnych programów oglądanych w miesiącu

Korzystając z tych wskaźników, usługa przesyłania strumieniowego może przeprowadzić analizę skupień w celu zidentyfikowania użytkowników o wysokim i niskim poziomie wykorzystania, aby mogli wiedzieć, na kogo powinni wydać większość swojego budżetu reklamowego.

Przykład 3: Nauka o sporcie

Naukowcy zajmujący się danymi dotyczącymi drużyn sportowych często korzystają z grupowania w celu identyfikacji podobnych graczy.

Na przykład profesjonalne drużyny koszykówki mogą gromadzić następujące informacje o zawodnikach:

Punkty na mecz
Zbiórek na mecz
Asysty na mecz
Przechwyty na mecz

Następnie mogą wprowadzić te zmienne do algorytmu grupowania, aby zidentyfikować podobnych graczy, aby mogli trenować ze sobą i wykonywać określone ćwiczenia w oparciu o ich mocne i słabe strony.

Przykład 4: Marketing e-mailowy

Wiele firm korzysta z analizy skupień w celu identyfikacji podobnych konsumentów, aby móc dostosować e-maile wysyłane do konsumentów w sposób maksymalizujący przychody.

Na przykład firma może gromadzić następujące informacje o konsumentach:

Procent otwartych e-maili
Liczba kliknięć na e-mail
Czas spędzony na sprawdzaniu e-maili

Korzystając z tych wskaźników, firma może przeprowadzić analizę skupień, aby zidentyfikować konsumentów korzystających z poczty e-mail w podobny sposób i dostosować typy wiadomości e-mail oraz częstotliwość wysyłania wiadomości do różnych grup klientów.

Przykład 5: Ubezpieczenie zdrowotne

Aktuariusze zakładów ubezpieczeń zdrowotnych często korzystali z analizy skupień w celu zidentyfikowania „grup” konsumentów, którzy korzystają z ubezpieczenia zdrowotnego w określony sposób.

Na przykład aktuariusz może gromadzić następujące informacje o gospodarstwach domowych:

Całkowita liczba wizyt lekarskich w ciągu roku
Całkowita wielkość gospodarstwa domowego
Całkowita liczba chorób przewlekłych w gospodarstwie domowym
Średni wiek członków gospodarstwa domowego

Aktuariusz może następnie wprowadzić te zmienne do algorytmu grupowania w celu zidentyfikowania podobnych gospodarstw domowych. Zakład ubezpieczeń zdrowotnych może wówczas ustalić miesięczne składki na podstawie tego, jak często gospodarstwa domowe w określonych grupach będą korzystać z jego ubezpieczenia.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak przeprowadzać różne typy analiz skupień przy użyciu statystycznych języków programowania:

Jak wykonać grupowanie K-średnich w Pythonie
Jak wykonać grupowanie K-średnich w R
Jak wykonać grupowanie K-Medoids w R
Jak wykonać grupowanie hierarchiczne w R

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej