관찰자 편향은 관찰자(또는 연구자)의 믿음이나 기대가 연구에서 수집된 데이터에 영향을 미칠 수 있을 때 연구에서 발생합니다. 이는 한 연구의 결과를 신뢰할 수 없게 만들고 다른 연구 환경에서 복제하기 어렵게 만듭니다. 이 기사에서는 관찰자 편향의 두 가지 유명한 예와 실제로 이러한 유형의...
파레토 차트는 막대를 사용하여 개별 범주 빈도를 표시하고 선을 사용하여 누적 빈도를 표시하는 차트 유형입니다. 이 튜토리얼에서는 Google 스프레드시트에서 파레토 차트를 만드는 단계별 예를 제공합니다. 1단계: 데이터 생성 먼저 회사의 제품당 판매량을 표시하는 가짜 데이터세트를 만들어 보겠습니다. 2단계: 누적 빈도 계산...
Python에서 배열을 연결하는 가장 쉬운 방법은 다음 구문을 사용하는 numpy.concatenate 함수를 사용하는 것입니다. numpy.concatenate((a1, a2,….), 축 = 0) 금: a1, a2…: 테이블의 순서 axis: 테이블이 조인되는 축입니다. 기본값은 0입니다. 이 튜토리얼에서는 이 기능의 실제 사용에 대한 몇 가지 예를 제공합니다. 예시...
Pandas DataFrame의 두 열을 비교하고 비교 결과를 세 번째 열에 쓰는 경우가 종종 있습니다. 다음 구문을 사용하면 쉽게 이 작업을 수행할 수 있습니다. conditions=[(condition1),(condition2)] choices=[" choice1 "," choice2 "] df[" new_column_name "]=np. select (conditions, choices, default) 이 코드의 기능은 다음과 같습니다....
종종 Python에서 목록을 DataFrame으로 변환하고 싶을 수도 있습니다. 다행히도 다음 구문을 사용하는 pandas.DataFrame 함수를 사용하면 이 작업을 쉽게 수행할 수 있습니다. pandas.DataFrame(data=None, index=None, columns=None, …) 금: data: DataFrame으로 변환할 데이터 index: 결과 DataFrame에 사용할 인덱스 columns: 결과 DataFrame에 사용할 열 레이블...
사분위수 범위 와 표준 편차는 데이터 세트의 값 분포를 측정하는 두 가지 방법입니다. 이 튜토리얼에서는 두 측정항목 간의 유사점과 차이점과 함께 각 측정항목에 대한 간략한 설명을 제공합니다. 사분위수 범위 데이터 세트의 사 분위수 범위 (IQR)는 첫 번째 사분위수(25번째 백분위수)와 세 번째...
학생들이 통계에서 자주 혼동하는 두 가지 용어는 p-값 과 알파 입니다. 두 용어 모두 가설 검정 에 사용됩니다. 이는 가설을 기각하거나 기각하지 못하는 데 사용하는 공식적인 통계 테스트입니다. 예를 들어, 새로운 약이 현재의 표준 약보다 환자의 혈압을 더 많이 감소시킨다는 가설을...
분할표에서 변수의 주변 평균은 다른 변수의 각 수준에서 평균을 낸 해당 변수의 평균입니다. 이름에서 알 수 있듯이 이러한 평균은 분할표의 여백 에 나타납니다. 다음 예에서는 주어진 분할표에 대한 주변 평균을 계산하는 방법을 보여줍니다. 예: 한계 평균 계산 다음 분할표는 시험을 준비하기...
분할표는 두 범주형 변수 간의 관계를 요약하는 표 유형입니다. Python에서 분할표를 만들려면 다음 구문을 사용하는 pandas.crosstab() 함수를 사용할 수 있습니다. pandas.crosstab(색인, 열) 금: index : 분할표의 행에 표시할 변수의 이름 열: 분할표의 열에 표시할 변수의 이름 다음 단계별 예제에서는 이 함수를...
Bonferroni 수정은 제1종 오류가 발생할 확률을 제어하기 위해 일련의 통계 테스트에 대한 알파(α) 수준을 조정하는 프로세스를 의미합니다. Bonferroni 보정 공식은 다음과 같습니다. α 신규 = α 원본 / n 금: 원래 α: 원래 α 수준 n: 수행된 비교 또는 테스트의 총...