728x90

통계(Statistics) 3

t-test를 이용해서 두 집단간의 차이를 검정하는 방법

두 집단 수가 동일할 경우 먼저, 두 집단 간의 평균 방문 일자의 차이를 확인하기 위해서는 scipy 패키지의 ttest_ind 함수를 사용할 수 있습니다. 이 함수는 두 개의 집단 간의 평균의 차이가 유의한 차이가 있는지 검정할 수 있는 t-검정을 수행합니다. 다음은 파이썬 코드 예시입니다. from scipy import stats # 두 집단의 평균 방문 일자가 저장된 데이터 group1 = [1, 2, 3, 4, 5] group2 = [3, 4, 5, 6, 7] # ttest_ind 함수를 사용해 t-검정을 수행 t_statistic, p_value = stats.ttest_ind(group1, group2) # 검정 결과 출력 print("t-statistic:", t_statistic) pri..

통계(Statistics) 2022.12.23

박스 플롯(box plot) 설명

오늘 아는 분이 박스 플롯의 의미가 무엇이고 어떻게 그리는지 궁금하다고 말씀하셔서 이야기 나온김에 정리를 해본다. 박스 플롯을 사용하는 이유는 많은 데이터를 눈으로 확인하기 어려울 때 그림을 이용해 데이터 집합의 범위와 중앙값을 빠르게 확인할 수 있는 목적으로 사용한다. 또한 통계적으로 이상치(outlier)가 있는지도 확인이 가능하다. '박스 플롯'은 '상자 수염 그림'(Box-and-Whisker Plot) '상자 그림' 등 다양한 이름으로 불린다. 기술 통계학에서 박스 플롯은 수치적 자료를 표현하는 그래프이다. 이 그래프는 자료에서 얻은 다섯 수치 요약(five number summary)을 가지고 그린다. 다섯 수치 요약은 아래와 같다.최솟값 : 제 1사분위에서 1.5 IQR을 뺀 위치이다.제 1..

통계(Statistics) 2017.09.20

중심극한정리

오늘 회의시간에 중심극한정리에 대한 이야기가 나와서 다시 한번 확인해 보았다. 의미는 아래과 같다. 확률론과 통계학에서, 중심극한정리(central limit theorem, CLT)는 동일한 확률분포를 가진 독립 확률 변수 n개의 평균의 분포는 n이 적당하다면 정규분포에 가까워진다는 정의이다.확률과 통계학에서 큰 의미가 있으며 실용적인 면에서도 품질관리, 식스 시그마에서 많이 이용된다. 결론은 표본의 평균도 모집단의 평균과 같다는 것이다. 그런데 우리의 상황은 동일한 확률분포가 아니다. 이 경우에는 어떻게 해야하는지 확인이 필요할 것 같다. Referencehttps://ko.wikipedia.org/wiki/%EC%A4%91%EC%8B%AC%EA%B7%B9%ED%95%9C%EC%A0%95%EB%A6%..

통계(Statistics) 2017.09.08
728x90