본문 바로가기
자격증/[빅분기] 빅데이터분석기사

[작업형3] 단일표본검정, 대응표본검정은 df['']를쓰고 독립표본검정은 데이터프레임으로 왜 안받을까?

by 바다의 공간 2024. 11. 26.

공부를 하다가 왜 단일표본검정과 대응표본 검정데이터프레임형태를 쓰면서 값을 추출하는데 

독립표본검정은 데이터프레임이 아닌 시리즈나 리스트형태로 추출하는지 궁금하고 헷갈렸다.

 

그래서 찾아보니

단일표본검정과 대응표본검정1개의  주제를 비교하려고 하기때문에 각각의 그룹열)으로 검정을 해야하고

독립표본은 말 그대로 독립된 2개의 데이터를 가지고 비교하는것이니 데이터프레임을 통해서 그룹을 비교하는것이 아니라 그 자체를 비교하는것이기때문에 다르다고 한다.

 

즉!

단일표본검정과 대응표본검정은 데이터가 같은 그룹내에서 연결되어있으므로 df내에서 열을 기준으로 추출한것!

독립표본검정은 서로 독립된 두 집단의 평균을 비교하는것이기때문에 df내에 저장할 필요 없이 

리스트나 시리즈형태로 바로 비교하면 됨!!

 

 

 

 

 

 

 

정리: 독립 vs 대응 데이터 처리 방식

 

검정 유형데이터 입력 방식이유

독립표본검정 (ttest_ind) 리스트/시리즈 형태로 입력 독립된 두 그룹이 완전히 별개의 데이터로 취급되기 때문.
단일표본검정 (ttest_1samp) DataFrame 열 사용 단일 데이터 그룹을 비교하는 경우, 데이터를 하나의 테이블(DataFrame)로 관리하는 경우가 일반적이기 때문.
대응표본검정 (ttest_rel) DataFrame 열 사용 같은 집단의 연결된 데이터를 비교하므로 DataFrame에서 같은 행에 저장된 열 간의 연산이 자연스럽고 실무에서도 이런 형식이 자주 사용되기 때문.

GPT 4o