공부를 하다가 왜 단일표본검정과 대응표본 검정은 데이터프레임형태를 쓰면서 값을 추출하는데
독립표본검정은 데이터프레임이 아닌 시리즈나 리스트형태로 추출하는지 궁금하고 헷갈렸다.
그래서 찾아보니
단일표본검정과 대응표본검정은 1개의 주제를 비교하려고 하기때문에 각각의 그룹열)으로 검정을 해야하고
독립표본은 말 그대로 독립된 2개의 데이터를 가지고 비교하는것이니 데이터프레임을 통해서 그룹을 비교하는것이 아니라 그 자체를 비교하는것이기때문에 다르다고 한다.
즉!
단일표본검정과 대응표본검정은 데이터가 같은 그룹내에서 연결되어있으므로 df내에서 열을 기준으로 추출한것!
독립표본검정은 서로 독립된 두 집단의 평균을 비교하는것이기때문에 df내에 저장할 필요 없이
리스트나 시리즈형태로 바로 비교하면 됨!!
정리: 독립 vs 대응 데이터 처리 방식
검정 유형데이터 입력 방식이유
독립표본검정 (ttest_ind) | 리스트/시리즈 형태로 입력 | 독립된 두 그룹이 완전히 별개의 데이터로 취급되기 때문. |
단일표본검정 (ttest_1samp) | DataFrame 열 사용 | 단일 데이터 그룹을 비교하는 경우, 데이터를 하나의 테이블(DataFrame)로 관리하는 경우가 일반적이기 때문. |
대응표본검정 (ttest_rel) | DataFrame 열 사용 | 같은 집단의 연결된 데이터를 비교하므로 DataFrame에서 같은 행에 저장된 열 간의 연산이 자연스럽고 실무에서도 이런 형식이 자주 사용되기 때문. |
GPT 4o
'자격증 > [빅분기] 빅데이터분석기사' 카테고리의 다른 글
[9회 실기] 네?? 이거 맞아요?? (0) | 2024.12.05 |
---|---|
[기출] 작업형 1 (0) | 2024.11.21 |
[기출2] 풀이 코드 (0) | 2024.11.20 |
[작업형3] 이원 분산 분석 실습 + 심화 (0) | 2024.11.19 |
[작업형2] roc_acu_score 에러. (0) | 2024.11.18 |