긴 데이터와 넓은 데이터: 차이점은 무엇인가요?


데이터 세트는 widelong 의 두 가지 형식으로 작성될 수 있습니다.

와이드 형식에는 첫 번째 열에서 반복 되지 않는 값이 포함됩니다.

형식에는 첫 번째 열에서 반복되는 값이 포함됩니다.

예를 들어, 서로 다른 형식으로 표현된 동일한 데이터를 포함하는 다음 두 개의 데이터세트를 생각해 보세요.

넓거나 긴 데이터 형식

확장된 데이터 세트에서 첫 번째 열의 각 값은 고유합니다.

반면 데이터세트에서는 첫 번째 열의 값이 반복됩니다.

두 데이터 세트 모두 정확히 동일한 팀 정보를 포함하지만 단순히 다른 형식으로 표현됩니다.

와이드 또는 롱 데이터를 사용해야 하는 경우

데이터로 수행하려는 작업에 따라 넓은 형식이나 긴 형식으로 표시하는 것이 더 합리적일 수 있습니다.

대형 포맷을 사용해야 하는 경우

일반적으로 데이터를 분석하는 경우 일반적으로 넓은 데이터 형식을 사용합니다.

예를 들어, 팀별 평균 득점, 어시스트, 리바운드를 알고 싶다면 데이터를 큰 형식으로 갖는 것이 더 쉬운 경우가 많습니다.

실제 세계에서 접하는 대부분의 데이터 세트는 우리의 두뇌가 해석하기 쉽기 때문에 넓은 형식으로도 저장됩니다.

예를 들어 위 형식에서는 같은 라인에 있는 각 팀의 득점, 어시스트, 리바운드 값을 쉽게 읽을 수 있습니다.

긴 형식을 사용해야 하는 경우

일반적으로 R 과 같은 통계 소프트웨어를 사용하여 플롯에서 여러 변수를 보는 경우 소프트웨어가 플롯을 생성할 수 있도록 데이터를 형식으로 변환해야 합니다.

실제 예를 보려면 특정 유형의 플롯을 만들기 위해 데이터가 형식이어야 하는 다음 R 튜토리얼을 확인하세요.

Python을 사용하는 경우 때로는 데이터를 다른 형식으로 변경해야 할 수도 있습니다.

다음 튜토리얼에서는 Python에서 데이터 프레임의 모양을 변경하는 방법을 설명합니다.

추가 리소스

다음 자습서에서는 일반적으로 사용되는 기타 통계 용어에 대한 정보를 제공합니다.

통계에서 관찰이란 무엇입니까?
통계에서 공변량이란 무엇입니까?
통계에서 잔차란 무엇입니까?

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다