가이드 - Statorials

Pandas: groupby를 사용하고 조건부로 계산하는 방법

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

다음 기본 구문을 사용하여 Pandas DataFrame에서 조건을 사용하여 그룹화 및 개수 계산을 수행할 수 있습니다. df. groupby (' var1 ')[' var2 ']. apply ( lambda x:(x==' val '). sum ()). reset_index (name=' count ') 이 특정 구문은 var1을 기준으로 DataFrame의 행을...

[계속 읽으세요...]

Pandas: 조건이 있는 열의 값을 계산하는 방법

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

다음 방법을 사용하여 특정 조건으로 Pandas DataFrame 열의 값 수를 계산할 수 있습니다. 방법 1: 조건이 있는 열의 값 계산 len(df[df[' col1 ']==' value1 ']) 방법 2: 조건이 있는 여러 열의 값 계산 len(df[(df[' col1 ']==' value1 ') & (df[' col2...

[계속 읽으세요...]

Pandas dataframe에 숫자 열을 추가하는 방법

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

다음 기본 구문을 사용하여 Pandas DataFrame에 “count” 열을 추가할 수 있습니다. df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ') 이 특정 구문은 var1 이라는 열의 값 수를 포함하는 DataFrame에 var1_count 라는 열을 추가합니다. 다음...

[계속 읽으세요...]

Pandas: 특정 열에 fillna()를 사용하는 방법

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

fillna() 와 함께 다음 메서드를 사용하여 Pandas DataFrame의 특정 열에 있는 NaN 값을 바꿀 수 있습니다. 방법 1: 특정 열에 fillna() 사용 df[' col1 '] = df[' col1 ']. fillna (0) 방법 2: 여러 특정 열에 fillna() 사용 df[[' col1 ',...

[계속 읽으세요...]

Pandas: 막대 그래프에서 막대에 주석을 추가하는 방법

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

다음 방법을 사용하여 Pandas 막대 그래프의 막대에 주석을 달 수 있습니다. 방법 1: 간단한 막대 그래프에서 막대에 주석 달기 ax = df. plot . bar () ax. bar_label ( ax.containers [ 0 ]) 방법 2: 그룹화된 막대 그래프의 막대에 주석 달기...

[계속 읽으세요...]

Python에서 정규성을 테스트하는 방법(4가지 방법)

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

많은 통계 테스트에서는 데이터 세트가 정규 분포를 따른다고 가정합니다 . Python에서 이 가설을 확인하는 네 가지 일반적인 방법이 있습니다. 1. (시각적 방법) 히스토그램을 생성합니다. 히스토그램이 대략 “종” 모양이면 데이터가 정규 분포를 따르는 것으로 간주됩니다. 2. (시각적 방법) QQ 플롯을 생성합니다. 그림의...

[계속 읽으세요...]

R에서 그룹별 백분율을 계산하는 방법(예제 포함)

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

다음 구문을 사용하여 R에서 그룹별 백분율을 계산할 수 있습니다. library (dplyr) df %>% group_by(group_var) %>% mutate(percent = value_var/sum(value_var)) 다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다. 예: R에서 그룹별 백분율 계산 서로 다른 팀의 농구 선수들이 득점한 점수를 보여주는 다음 데이터...

[계속 읽으세요...]

간격 대 사 분위수 범위 : 차이점은 무엇입니까?

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

통계에서 간격 과 사분위수 범위는 데이터 세트의 값 분포를 측정하는 두 가지 방법입니다. 범위는 데이터 세트의 최소값과 최대값 간의 차이를 측정합니다. 사분위간 범위는 데이터 세트의 첫 번째 사분위수(25번째 백분위수)와 세 번째 사분위수(75번째 백분위수) 간의 차이를 측정합니다. 이는 값의 중간 50%의 분포를...

[계속 읽으세요...]

가설 검정과 신뢰 구간: 차이점은 무엇인가요?

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

통계에서 가장 일반적으로 사용되는 두 가지 절차는 가설 검정 과 신뢰 구간 입니다. 둘 사이의 차이점은 다음과 같습니다. 가설 검정은 모집단 매개변수에 대한 가설이 참인지 여부를 결정하는 데 사용되는 공식적인 통계 검정입니다. 신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 매개변수가 포함될 가능성이...

[계속 읽으세요...]

통계에서 보급률이란 무엇입니까? (정의 & #038; 예)

에 의해 벤자민 앤더슨 7월 18, 2023 가이드 댓글 0개

통계에서 유병률은 특정 기간에 특정 특성을 나타내는 인구 집단의 개인 비율입니다. 연구자들은 일반적으로 모집단에서 개인을 무작위로 표본 으로 추출하고 표본에서 해당 특정 특성을 가진 개인의 수를 간단히 계산하여 유병률을 측정합니다. 예를 들어, 연구자가 특정 도시에서 질병 X의 유행을 이해하고 싶어한다고 가정해...

[계속 읽으세요...]

[카테고리:] 가이드