통계(Statistics)

t-test를 이용해서 두 집단간의 차이를 검정하는 방법

leebaro 2022. 12. 23.
728x90

두 집단 수가 동일할 경우

먼저, 두 집단 간의 평균 방문 일자의 차이를 확인하기 위해서는 scipy 패키지의 ttest_ind 함수를 사용할 수 있습니다. 이 함수는 두 개의 집단 간의 평균의 차이가 유의한 차이가 있는지 검정할 수 있는 t-검정을 수행합니다.

다음은 파이썬 코드 예시입니다.

from scipy import stats

# 두 집단의 평균 방문 일자가 저장된 데이터
group1 = [1, 2, 3, 4, 5]
group2 = [3, 4, 5, 6, 7]

# ttest_ind 함수를 사용해 t-검정을 수행
t_statistic, p_value = stats.ttest_ind(group1, group2)

# 검정 결과 출력
print("t-statistic:", t_statistic)
print("p-value:", p_value)

t-검정의 결과는 t-statistic과 p-value로 제공됩니다. t-statistic은 t-검정에 사용된 t-값을 의미하고, p-value는 유의 확률을 의미합니다. 일반적으로 p-value가 일정 기준값보다 작을 경우(일반적으로 0.05나 0.01이 사용됩니다) 유의 차이가 있다고 결론을 지을 수 있습니다.

 

두 집단 수가 다를 경우

import numpy as np
from scipy import stats

# 두 집단의 평균, 표준편차, 샘플 수
mean1 = 10
mean2 = 12
std1 = 3
std2 = 4
n1 = 20
n2 = 30

# t-검정 수행
t, p = stats.ttest_ind_from_stats(mean1, std1, n1, mean2, std2, n2)

# 결과 출력
print("t-검정 결과: t = %.3f, p = %.3f" % (t, p))
if p < 0.05:
    print("유의확률이 작기 때문에 귀무가설을 기각할 수 있습니다.")
else:
    print("유의확률이 크기 때문에 귀무가설을 기각할 수 없습니다.")

 

728x90

'통계(Statistics)' 카테고리의 다른 글

박스 플롯(box plot) 설명  (5) 2017.09.20
중심극한정리  (0) 2017.09.08