종종 R의 특정 조건을 기반으로 하는 데이터 프레임의 하위 집합에 관심이 있을 수 있습니다. 다행히 dplyr 패키지의 filter() 함수를 사용하면 이 작업을 쉽게 수행할 수 있습니다. library(dplyr) 이 튜토리얼에서는 starwars 라는 내장 dplyr 데이터세트를 사용하여 이 기능을 실제로 사용하는 방법에 대한...
종종 R의 데이터 프레임에서 하나 이상의 열을 제거하고 싶을 수도 있습니다. 다행히 dplyr 패키지의 select() 함수를 사용하면 이 작업을 쉽게 수행할 수 있습니다. library (dplyr) 이 튜토리얼에서는 다음 데이터 프레임을 사용하여 실제로 이 함수를 사용하는 방법에 대한 몇 가지 예를 보여줍니다....
종종 R의 데이터 프레임에서 열을 다시 정렬하고 싶을 수도 있습니다. 다행히 dplyr 패키지의 select() 함수를 사용하면 이 작업을 쉽게 수행할 수 있습니다. library (dplyr) 이 튜토리얼에서는 다음 데이터 프레임을 사용하여 실제로 이 함수를 사용하는 방법에 대한 몇 가지 예를 보여줍니다. #create...
데이터를 분석할 때 수행하는 가장 일반적인 작업 중 두 가지는 데이터를 그룹화하고 요약하는 것입니다. 다행히 R의 dplyr 패키지를 사용하면 데이터를 빠르게 그룹화하고 요약할 수 있습니다. 이 튜토리얼은 dplyr을 시작하는 데 대한 빠른 가이드를 제공합니다. dplyr 패키지 설치 및 로드 dplyr 패키지의...
종종 R에서 여러 데이터 프레임을 결합하는 데 관심이 있을 수 있습니다. 다행히 dplyr 패키지의 left_join() 함수를 사용하면 이 작업을 쉽게 수행할 수 있습니다 . library(dplyr) 예를 들어 다음과 같은 세 가지 데이터 프레임이 있다고 가정합니다. #create data frame df1 <- data.frame(a...
학생들이 자주 혼동하는 두 가지 통계 테스트는 F-테스트 와 T-테스트 입니다. 이 튜토리얼에서는 두 테스트의 차이점을 설명합니다. F 테스트: 기본 사항 F 테스트는 두 모집단 분산이 동일한지 여부를 테스트하는 데 사용됩니다. 검정의 귀무가설과 대립가설은 다음과 같습니다. H 0 : σ 1...
Grubbs 테스트는 데이터 세트에서 이상값의 존재를 식별하는 데 사용됩니다. 이 검정을 사용하려면 데이터 세트가 대략적으로 정규 분포를 따르고 최소 7개의 관측치를 포함해야 합니다. 이 튜토리얼에서는 Python에서 Grubbs 테스트를 수행하는 방법을 설명합니다. Python의 Grubbs 테스트 Python에서 Grubbs 테스트를 수행하려면 다음 구문을 사용하는...
종종 여러 조건에 따라 Pandas DataFrame을 필터링해야 할 수도 있습니다. 다행히도 이는 부울 연산을 사용하여 쉽게 수행할 수 있습니다. 이 튜토리얼에서는 여러 조건에서 다음 Pandas DataFrame을 필터링하는 방법에 대한 몇 가지 예를 제공합니다. import pandas as pd #createDataFrame df = pd.DataFrame({'team':...
롤링 상관관계는 슬라이딩 윈도우에 대한 두 시계열 간의 상관관계입니다. 이러한 유형의 상관 관계의 이점 중 하나는 시간 경과에 따른 두 시계열 간의 상관 관계를 시각화할 수 있다는 것입니다. 이 튜토리얼에서는 Excel에서 롤링 상관 관계를 계산하고 시각화하는 방법을 설명합니다. Excel에서 롤링 상관관계를...
R의 데이터 프레임에서 NA(결측값)의 일부 또는 전부를 포함하는 행을 제거하려는 경우가 종종 있습니다. 이 튜토리얼에서는 Basic R 및 Tidyr 패키지를 사용하여 이러한 줄을 제거하는 방법을 설명합니다. 다음 각 예에 대해 다음 데이터 프레임을 사용합니다. #create data frame with some missing values...