5 прикладів кластерного аналізу в реальному житті
Кластерний аналіз – це техніка, яка використовується в машинному навчанні , яка намагається знайти групи спостережень у наборі даних.
Мета кластерного аналізу полягає в тому, щоб знайти такі кластери, що спостереження всередині кожного кластера досить подібні одне до одного, тоді як спостереження в різних кластерах досить відрізняються одне від одного.
Наступні приклади показують, як кластерний аналіз використовується в різних ситуаціях реального світу.
Приклад 1: Роздрібний маркетинг
Компанії роздрібної торгівлі часто використовують кластеризацію для визначення груп схожих домогосподарств.
Наприклад, підприємство роздрібної торгівлі може збирати таку інформацію про сім’ю:
- Доходи домашніх господарств
- Розмір домогосподарства
- Голова домашнього господарства Професія
- Відстань до найближчого населеного пункту
Потім вони можуть ввести ці змінні в алгоритм кластеризації, щоб потенційно ідентифікувати такі кластери:
- Група 1: Маленькі сім’ї, великі марнотрати
- 2 група: велика сім’я, великі марнотрати
- 3 група: маленька сім’я, низькі витрати
- 4 група: Велика родина, невеликі витрати
Потім компанія може надсилати персоналізовану рекламу або рекламні листи кожній домогосподарству залежно від імовірності їхньої відповіді на певні типи реклами.
Приклад 2: потокові послуги
Сервіси потокового передавання часто використовують кластерний аналіз, щоб ідентифікувати глядачів із подібною поведінкою.
Наприклад, служба потокового передавання може збирати такі дані про осіб:
- Хвилин переглядів на день
- Загальна кількість сеансів перегляду на тиждень
- Кількість унікальних шоу, переглянутих за місяць
Використовуючи ці показники, служба потокового передавання може виконувати кластерний аналіз, щоб ідентифікувати користувачів із високим і низьким рівнем використання, щоб вони могли знати, на кого їм слід витратити більшу частину свого рекламного бюджету.
Приклад 3: Спортивна наука
Науковці даних спортивних команд часто використовують кластеризацію, щоб ідентифікувати схожих гравців.
Наприклад, професійні баскетбольні команди можуть збирати таку інформацію про гравців:
- Очки за гру
- Підбирання за гру
- Ассисти за матч
- Перехоплення за гру
Потім вони можуть ввести ці змінні в алгоритм групування, щоб визначити схожих гравців, щоб вони могли тренуватися один з одним і виконувати спеціальні вправи на основі їхніх сильних і слабких сторін.
Приклад 4: маркетинг електронною поштою
Багато компаній використовують кластерний аналіз, щоб визначити схожих споживачів, щоб вони могли адаптувати електронні листи, надіслані споживачам, таким чином, щоб збільшити дохід.
Наприклад, компанія може збирати таку інформацію про споживачів:
- Відсоток відкритих електронних листів
- Кількість кліків на електронний лист
- Час, витрачений на перевірку електронної пошти
Використовуючи ці показники, компанія може виконувати кластерний аналіз, щоб ідентифікувати споживачів, які використовують електронну пошту подібним чином, і підбирати типи електронних листів і частоту їх надсилання різним групам клієнтів.
Приклад 5: Медичне страхування
Актуарії медичних страхових компаній часто використовували кластерний аналіз, щоб ідентифікувати «кластери» споживачів, які певним чином використовують медичне страхування.
Наприклад, актуарій може збирати таку інформацію про домогосподарства:
- Загальна кількість відвідувань лікаря за рік
- Загальний розмір домогосподарства
- Загальна кількість хронічних захворювань на домогосподарство
- Середній вік членів домогосподарства
Потім актуарій може ввести ці змінні в алгоритм кластеризації для ідентифікації подібних домогосподарств. Потім медична страхова компанія може встановлювати щомісячні премії залежно від того, як часто домогосподарства певних груп користуватимуться її страхуванням.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати різні типи кластерного аналізу за допомогою мов статистичного програмування:
Як виконати кластеризацію K-Means у Python
Як виконати кластеризацію K-Means у R
Як виконати кластеризацію K-Medoids у R
Як виконати ієрархічну кластеризацію в R