5 esempi di analisi dei cluster nella vita reale


L’analisi dei cluster è una tecnica utilizzata nell’apprendimento automatico che tenta di trovare gruppi di osservazioni all’interno di un set di dati.

L’obiettivo dell’analisi dei cluster è trovare cluster tali che le osservazioni all’interno di ciascun cluster siano abbastanza simili tra loro, mentre le osservazioni in cluster diversi sono abbastanza diverse l’una dall’altra.

Gli esempi seguenti mostrano come viene utilizzata l’analisi dei cluster in varie situazioni del mondo reale.

Esempio 1: marketing al dettaglio

Le società di vendita al dettaglio utilizzano spesso il clustering per identificare gruppi di famiglie simili.

Ad esempio, un’attività di vendita al dettaglio potrebbe raccogliere le seguenti informazioni sulla famiglia:

  • Reddito familiare
  • Dimensione della famiglia
  • Capofamiglia Professione
  • Distanza dall’area urbana più vicina

Possono quindi introdurre queste variabili in un algoritmo di clustering per identificare potenzialmente i seguenti cluster:

  • Gruppo 1: Piccole famiglie, grandi spendaccioni
  • Gruppo 2: Famiglia numerosa, grandi spendaccioni
  • Gruppo 3: Famiglia piccola, poche spese
  • Gruppo 4: Famiglia numerosa, poche spese

L’azienda può quindi inviare annunci pubblicitari personalizzati o lettere di vendita a ciascuna famiglia in base alla loro probabilità di rispondere a specifici tipi di annunci.

Esempio 2: servizi di streaming

I servizi di streaming utilizzano spesso l’analisi di clustering per identificare gli spettatori con comportamenti simili.

Ad esempio, un servizio di streaming può raccogliere i seguenti dati sugli individui:

  • Minuti guardati al giorno
  • Numero totale di sessioni di visualizzazione a settimana
  • Numero di programmi unici visualizzati al mese

Utilizzando queste metriche, un servizio di streaming può eseguire un’analisi dei cluster per identificare gli utenti ad alto e basso utilizzo in modo che possano sapere su chi dovrebbero spendere la maggior parte del budget pubblicitario.

Esempio 3: scienza dello sport

I data scientist delle squadre sportive spesso utilizzano il clustering per identificare giocatori simili.

Ad esempio, le squadre di basket professionistiche possono raccogliere le seguenti informazioni sui giocatori:

  • Punti a partita
  • Rimbalzi a partita
  • Assist per partita
  • Rubate per partita

Possono quindi inserire queste variabili in un algoritmo di raggruppamento per identificare giocatori simili in modo che possano allenarsi insieme ed eseguire esercizi specifici in base ai loro punti di forza e di debolezza.

Esempio 4: marketing via e-mail

Molte aziende utilizzano l’analisi dei cluster per identificare consumatori simili in modo da poter personalizzare le e-mail inviate ai consumatori in modo da massimizzare le entrate.

Ad esempio, un’azienda può raccogliere le seguenti informazioni sui consumatori:

  • Percentuale di email aperte
  • Numero di clic per e-mail
  • Tempo impiegato a controllare le e-mail

Utilizzando questi parametri, un’azienda può eseguire un’analisi dei cluster per identificare i consumatori che utilizzano la posta elettronica in modi simili e personalizzare i tipi di e-mail e la frequenza delle e-mail che inviano a diversi gruppi di clienti.

Esempio 5: assicurazione sanitaria

Gli attuari delle compagnie di assicurazione sanitaria hanno spesso utilizzato l’analisi dei cluster per identificare “cluster” di consumatori che utilizzano la loro assicurazione sanitaria in modi specifici.

Ad esempio, un attuario potrebbe raccogliere le seguenti informazioni sulle famiglie:

  • Numero totale di visite mediche all’anno
  • Dimensione totale della famiglia
  • Numero totale di malattie croniche per famiglia
  • Età media dei componenti del nucleo familiare

Un attuario può quindi inserire queste variabili in un algoritmo di clustering per identificare famiglie simili. La compagnia di assicurazione sanitaria può quindi fissare premi mensili in base alla frequenza con cui si aspetta che le famiglie di gruppi specifici utilizzino la sua assicurazione.

Risorse addizionali

I seguenti tutorial spiegano come eseguire diversi tipi di analisi dei cluster utilizzando linguaggi di programmazione statistica:

Come eseguire il clustering K-Means in Python
Come eseguire il clustering K-Means in R
Come eseguire il clustering K-Medoids in R
Come eseguire il clustering gerarchico in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *