[카테고리:] 가이드

R에서 백분위수 순위를 계산하는 방법(예제 2개)

값의 백분위수 순위는 순위가 주어진 값과 같거나 낮은 데이터세트의 값의 백분율을 알려줍니다. R에서 백분위수 순위를 계산하려면 다음 방법을 사용할 수 있습니다. 방법 1: 데이터세트의 백분위수 순위 계산 library (dplyr) df %>% mutate(percent_rank = rank(x)/length(x)) 방법 2: 그룹별 백분위수 순위 계산 library...

R에서 z 점수와 백분위 수를 변환하는 방법

z-점수는 특정 값이 데이터 세트의 평균과 얼마나 많은 표준 편차를 가지고 있는지 알려줍니다. 백분위수는 데이터 세트의 특정 값 아래로 떨어지는 관측치 의 비율을 알려줍니다. 종종 z-점수와 백분위수 간에 변환을 원할 수도 있습니다. R에서 이 작업을 수행하려면 다음 방법을 사용할 수 있습니다....

Pandas에서 수정하는 방법: 범위를 벗어난 나노초 단위의 타임스탬프

pandas를 사용할 때 발생할 수 있는 오류는 다음과 같습니다. OutOfBoundsDatetime : Out of bounds nanosecond timestamp: 2300-01-10 00:00:00 이 오류는 다음 범위를 벗어나는 타임스탬프를 생성하려고 할 때 발생합니다. import pandas as pd #display minimum timestamp allowed print (pd. Timestamp . min...

수정 방법: typeerror: 'dataframe' 개체를 호출할 수 없습니다.

Pandas를 사용할 때 발생할 수 있는 일반적인 오류는 다음과 같습니다. TypeError : 'DataFrame' object is not callable 이 오류는 일반적으로 대괄호 [ ] 대신 둥근 괄호 ()를 사용하여 pandas DataFrame의 변수에 대한 계산을 수행하려고 할 때 발생합니다. 다음 예에서는 실제로 이...

수정 방법: valueerror: 알 수 없는 라벨 유형: '연속'

Python에서 발생할 수 있는 일반적인 오류는 다음과 같습니다. ValueError : Unknown label type: 'continuous' 이 오류는 일반적으로 로지스틱 회귀 와 같은 분류 모델을 맞추기 위해 sklearn을 사용하려고 할 때 발생하며 응답 변수에 사용하는 값은 범주형이 아닌 연속형입니다. 다음 예에서는 실제로 이...

Python에서 일반 cdf를 계산하고 플롯하는 방법

누적 분포 함수( CDF ) 는 임의 변수가 특정 값보다 작거나 같은 값을 가질 확률을 알려줍니다. 이 튜토리얼에서는 Python에서 일반 CDF 값을 계산하고 플롯하는 방법을 설명합니다. 예제 1: Python에서 일반 CDF 확률 계산 Python에서 일반 CDF 확률을 계산하는 가장 쉬운 방법은...

Google 스프레드시트에 축 라벨을 추가하는 방법(예제 포함)

Google 스프레드시트의 차트에 축 라벨을 추가하거나 변경하려는 경우가 종종 있습니다. 다행히 차트 편집기 패널을 사용하면 이 작업을 쉽게 수행할 수 있습니다. 다음 단계별 예에서는 이 패널을 사용하여 Google 스프레드시트의 차트에 축 라벨을 추가하는 방법을 보여줍니다. 1단계: 데이터 입력 먼저 회사의 연간...

Google 스프레드시트 차트에 여러 추세선을 추가하는 방법

다음 단계별 예에서는 Google 스프레드시트에서 여러 추세선이 있는 차트를 만드는 방법을 보여줍니다. 1단계: 데이터 입력 먼저 서로 다른 연도에 서로 다른 두 제품의 총 판매량을 표시하는 몇 가지 값을 입력해 보겠습니다. 2단계: 차트 만들기 각 제품의 연도별 판매량을 시각화하는 차트를 만들려면...