긴 데이터와 넓은 데이터: 차이점은 무엇인가요?
데이터 세트는 wide 와 long 의 두 가지 형식으로 작성될 수 있습니다.
와이드 형식에는 첫 번째 열에서 반복 되지 않는 값이 포함됩니다.
긴 형식에는 첫 번째 열에서 반복되는 값이 포함됩니다.
예를 들어, 서로 다른 형식으로 표현된 동일한 데이터를 포함하는 다음 두 개의 데이터세트를 생각해 보세요.

확장된 데이터 세트에서 첫 번째 열의 각 값은 고유합니다.

반면 긴 데이터세트에서는 첫 번째 열의 값이 반복됩니다.

두 데이터 세트 모두 정확히 동일한 팀 정보를 포함하지만 단순히 다른 형식으로 표현됩니다.
와이드 또는 롱 데이터를 사용해야 하는 경우
데이터로 수행하려는 작업에 따라 넓은 형식이나 긴 형식으로 표시하는 것이 더 합리적일 수 있습니다.
대형 포맷을 사용해야 하는 경우
일반적으로 데이터를 분석하는 경우 일반적으로 넓은 데이터 형식을 사용합니다.
예를 들어, 팀별 평균 득점, 어시스트, 리바운드를 알고 싶다면 데이터를 큰 형식으로 갖는 것이 더 쉬운 경우가 많습니다.

실제 세계에서 접하는 대부분의 데이터 세트는 우리의 두뇌가 해석하기 쉽기 때문에 넓은 형식으로도 저장됩니다.
예를 들어 위 형식에서는 같은 라인에 있는 각 팀의 득점, 어시스트, 리바운드 값을 쉽게 읽을 수 있습니다.
긴 형식을 사용해야 하는 경우
일반적으로 R 과 같은 통계 소프트웨어를 사용하여 플롯에서 여러 변수를 보는 경우 소프트웨어가 플롯을 생성할 수 있도록 데이터를 긴 형식으로 변환해야 합니다.
실제 예를 보려면 특정 유형의 플롯을 만들기 위해 데이터가 긴 형식이어야 하는 다음 R 튜토리얼을 확인하세요.
Python을 사용하는 경우 때로는 데이터를 다른 형식으로 변경해야 할 수도 있습니다.
다음 튜토리얼에서는 Python에서 데이터 프레임의 모양을 변경하는 방법을 설명합니다.
추가 리소스
다음 자습서에서는 일반적으로 사용되는 기타 통계 용어에 대한 정보를 제공합니다.