5 실생활에서의 군집 분석 사례

에 의해 벤자민 앤더슨 7월 23, 2023 가이드 댓글 0개

클러스터 분석은 데이터 세트 내에서 관찰 그룹을 찾으려고 시도하는 기계 학습 에 사용되는 기술입니다.

군집 분석의 목표는 각 군집 내의 관측값이 서로 매우 유사한 반면, 다른 군집의 관측값은 서로 상당히 다른 군집을 찾는 것입니다.

다음 예는 다양한 실제 상황에서 클러스터 분석이 어떻게 사용되는지 보여줍니다.

소매 회사에서는 유사한 가구 그룹을 식별하기 위해 클러스터링을 사용하는 경우가 많습니다.

예를 들어 소매업체는 다음과 같은 가구 정보를 수집할 수 있습니다.

그런 다음 이러한 변수를 클러스터링 알고리즘에 도입하여 잠재적으로 다음 클러스터를 식별할 수 있습니다.

그런 다음 회사는 특정 유형의 광고에 응답할 가능성을 기반으로 각 가구에 개인화된 광고 또는 판매 편지를 보낼 수 있습니다.

스트리밍 서비스는 클러스터링 분석을 사용하여 비슷한 행동을 하는 시청자를 식별하는 경우가 많습니다.

예를 들어 스트리밍 서비스는 개인에 대해 다음과 같은 데이터를 수집할 수 있습니다.

스트리밍 서비스는 이러한 지표를 사용하여 클러스터 분석을 수행하여 사용량이 많은 사용자와 낮은 사용자를 식별함으로써 대부분의 광고 예산을 누구에게 지출해야 하는지 알 수 있습니다.

스포츠 팀 데이터 과학자는 유사한 선수를 식별하기 위해 클러스터링을 사용하는 경우가 많습니다.

예를 들어, 프로 농구팀은 다음과 같은 선수 정보를 수집할 수 있습니다.

그런 다음 이러한 변수를 그룹화 알고리즘에 입력하여 유사한 플레이어를 식별함으로써 서로 훈련하고 강점과 약점에 따라 특정 훈련을 수행할 수 있습니다.

많은 기업에서는 클러스터 분석을 사용하여 유사한 소비자를 식별하고 수익을 극대화하는 방식으로 소비자에게 전송되는 이메일을 맞춤화할 수 있습니다.

예를 들어 기업은 소비자에 대해 다음과 같은 정보를 수집할 수 있습니다.

이러한 지표를 사용하여 기업은 클러스터 분석을 수행하여 비슷한 방식으로 이메일을 사용하는 소비자를 식별하고 이메일 유형과 다양한 고객 그룹에 보내는 이메일 빈도를 조정할 수 있습니다.

건강 보험 회사 보험계리사는 특정 방식으로 건강 보험을 사용하는 소비자의 “클러스터”를 식별하기 위해 클러스터 분석을 자주 사용해 왔습니다.

예를 들어, 보험계리사는 가구에 대해 다음과 같은 정보를 수집할 수 있습니다.

그런 다음 보험 계리사는 이러한 변수를 클러스터링 알고리즘에 입력하여 유사한 가구를 식별할 수 있습니다. 그런 다음 건강 보험 회사는 특정 그룹의 가구가 보험을 사용할 것으로 예상되는 빈도에 따라 월 보험료를 설정할 수 있습니다.

다음 튜토리얼에서는 통계 프로그래밍 언어를 사용하여 다양한 유형의 클러스터 분석을 수행하는 방법을 설명합니다.

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기