본문 바로가기

오블완17

[작업형3] 단일표본검정, 대응표본검정은 df['']를쓰고 독립표본검정은 데이터프레임으로 왜 안받을까? 공부를 하다가 왜 단일표본검정과 대응표본 검정은 데이터프레임형태를 쓰면서 값을 추출하는데 독립표본검정은 데이터프레임이 아닌 시리즈나 리스트형태로 추출하는지 궁금하고 헷갈렸다. 그래서 찾아보니단일표본검정과 대응표본검정은 1개의  주제를 비교하려고 하기때문에 각각의 그룹열)으로 검정을 해야하고독립표본은 말 그대로 독립된 2개의 데이터를 가지고 비교하는것이니 데이터프레임을 통해서 그룹을 비교하는것이 아니라 그 자체를 비교하는것이기때문에 다르다고 한다. 즉!단일표본검정과 대응표본검정은 데이터가 같은 그룹내에서 연결되어있으므로 df내에서 열을 기준으로 추출한것!독립표본검정은 서로 독립된 두 집단의 평균을 비교하는것이기때문에 df내에 저장할 필요 없이 리스트나 시리즈형태로 바로 비교하면 됨!!       정리: 독.. 2024. 11. 26.
코딩테스트 :: 자료형_stack 문제 # 문제1. 소괄호는 짝을 맞춘 열린 괄호"(" 와 ")"로 구성한다.# 열린 괄호나 닫힌 괄호가 마구 뒤섞인 문자열이 있다.# 이때 소괄호가 정상적으로 열고 닫혀 있는지를 판별하는 함수를 작성하시오.#소괄호가 정상적으로 열고 닫혀있다면 True, 그렇지 않다면 False를 반환.# 제약조건: #1.열린 괄호는 자신과 가장  가까운 닫힌 괄호를 만나면 상쇄된다.# 2.반드시 열린 괄호가 먼저 와야하고, 열린 괄호와 닫힌 괄호 사이에# 아무것도 없어야한다. 풀이과정def sol(a): stack = [] # 스택 초기화 for i in a: if i == '(': # 여는 괄호가 나오면 스택에 추가 stack.append('(') else: .. 2024. 11. 24.
코딩테스트 :: 자료형_stack List (배열)Stack (쌓는다) First In Last OutQueue1. 선형맅스트(패턴을 예측할 수 있다)2. 검색은 빠르지만, 비효율적3. 정적,동적배열(한번 사이즈를 설정하면 변경 가능,불가능)4. appen() => 리스트를 생성(빈 리스트를 생성) test =[]5. 데이터를 삽입, 삭제 등 수정할 수 있다.* 딕셔너리                        자료구조 (key:value) : Hash* push, pop을 연산으로 부름    * top(변수)                                  - 즉  push, pop, top을 가지고 활용- 초기값은 -1을 가지고데이터가 들어오면 '먼저' 증가한다.흐름)stack 동작원리 밑에 이미지 참고  stack은 pu.. 2024. 11. 23.
[DL] CNN,RNN을 활용한 정확도, 예측도 확인하기 텐서플로우의 예제인 꽃 이미지를 분류하려고 합니다.## cnn2.py# CNN 꽃 이미지 분류def p(str): print(str, '\n')#라이브러리 로딩import matplotlib.pyplot as pltimport numpy as npimport PIL #이미지 처리하는 라이브러리import tensorflow as tffrom tensorflow import kerasfrom tensorflow.keras import layersfrom tensorflow.keras.models import Sequential# 데이터 로딩 : 3670장의 꽃 사진데이터 가져오기# 3670장의 꽃 사진은 daisy, dandelion, roses, sunflowers, tulips 로 5개의 클래스로.. 2024. 11. 22.
[기출] 작업형 1 작업형1 예시문제자동차 데이터 셋에서 qsec 컬럼을 Min-Max Scale로 변환 후 0.5보다 큰 값을 가지는 레코드(row) 수는?문제분석문제에서 qsec 컬럼만 묻고 있음 (다른 컬럼 신경 쓸 필요 없음)MinMax Scale 변환조건 0.5보다 큰 값 2024. 11. 21.
[기출2] 풀이 코드 # 기본데이터 import pandas as pddf = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv")df  문제1 주어진 데이터셋(members.csv)의 'views' 컬럼 상위 10개 데이터를 상위 10번째 값으로 대체한 후 'age'컬럼에서 80 이상인 데이터의 'views' 컬럼 평균값 구하기풀이 방향1. views컬럼 상위 10개 데이터 -> 상위 10번째 값 대체-> 이걸 하기 위해서는 sort_values()를 사용하고 ascending=False를 해야합니다. 왜 상위를 하려면 ascending =Fasle를 해야되냐면 생각을 해보자구요?! 그냥 sort_values를 .. 2024. 11. 20.
[작업형3] 이원 분산 분석 실습 + 심화 🟡이원 분산 분석  가정에서 재배하고 있는 네 가지 토마토 종자(A, B, C, D)에 대해 세 가지 종류의 비료 (11, 12, 13)를사용하여 재배된 토마토 수를 조사하였다. 종자 및 비료 종류 간의 토마토 수의 차이가 있는지유의수준 0.05하에서 검정하시오. (단, 정규성, 등분산성에 만족한 데이터)종자 (주 효과)귀무가설(H0): 종자 간의 토마토 수에 차이가 없다.대립가설(H1): 적어도 하나의 종자에서 토마토 수에 차이가 있다.비료 (주 효과)귀무가설(H0): 비료 종류 간의 토마토 수에 차이가 없다.대립가설(H1): 적어도 하나의 비료 종류에서 토마토 수에 차이가 있다.상호작용 효과:귀무가설(H0): 종자와 비료 간의 상호작용은 토마토 수에 영향을 미치지 않는다.대립가설(H1): 종자와 비.. 2024. 11. 19.
[작업형2] roc_acu_score 에러. https://dataq.goorm.io/exam/3/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/4 구름EDU - 모두를 위한 맞춤형 IT교육구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/edu.goorm.io이번에는 작업형2번을 구름edu에서 실행해보았습니다.(하..너무 힘들고 힘들었어요)일단 문제를 확인해보는 것보터 해볼게요! 일단 저희가 확인해야하는것은1.백화점 구매 고객의 성별을 예측하는 모델 만들기2.roc_auc_score을 통해서 점수 평가가된다는점 입니다. 일단 데이터를 확인해야겠죠?#데이터 확인print(tr.. 2024. 11. 18.
[작업형3] 일원분산분석 실습 + 심화실습 💬 일원 분산 분석   주어진 데이터는 4가지 다른 교육 방법을 적용한 대학생들의 학점 결과이다. 이 실험에서는 비슷한 실력을 가진 학생 40명을 무작위로 4개(A, B, C, D)그룹으로 나누었고, 각 그룹은 다른 교육 방법을 적용했다. 학생들의 학점 결과에는 교육 방법에 따른 차이가 있는지 유의수준 0.5하에서 검정하시오.귀무가설(H0): 네 가지 교육 방법에 의한 학생들의 학점 평균은 동일하다.대립가설(H1): 적어도 두 그룹의 학점 평균은 다르다.  import pandas as pddf = pd.DataFrame({ 'A': [3.5, 4.3, 3.8, 3.6, 4.1, 3.2, 3.9, 4.4, 3.5, 3.3], 'B': [3.9, 4.4, 4.1, 4.2, 4.5, 3.8, 4.. 2024. 11. 17.
[작업형3] 분산분석 개념 🟢분산분석🟢분산분석(ANOVA)분산분석(ANOVA)은 여러 집단(3개 이상)의 평균 차이를 통계적으로 유의미한지 검정일원 분산 분석 (One-way ANOVA): 하나의 요인(독립변수)에 따라 평균의 차이 검정 -  예를들어 식물의 성장(종속변수)이있을때 물의 양(독립변수) 에 따라 어떤 차이가 있는지?이원 분산 분석 (Two-way ANOVA): 두 개의 요인 (독립변수) 에 따라 평균의 차이 검정 -  예를들어 식물의 성장(종속변수)이있을때 물의 양(독립변수), 햇빛(독립변수)에 따라 어떤 차이가 있는지? 🟢 일원 분산 분석3개 이상의 집단 간의 평균의 차이가 통계적으로 유의한지 검정하나인 요인이고, 집단의 수가 3개 이상일 때 사용🟢기본가정독립성: 각 집단의 관측치는 독립적이다.정규성: 각 .. 2024. 11. 16.
[작업형3] 다선형회귀, 범주형이 섞여있다면? 😊 다중선형회귀를 예측해보고 싶습니다. 일단 간단한 데이터를 만들었습니다. 아래의 데이터로 최종예측까지 해보려고합니다.import pandas as pddf = pd.DataFrame({ '매출액': [300, 320, 250, 360, 315, 328, 310, 335, 326, 280, 290, 300, 315, 328, 310, 335, 300, 400, 500, 600], '광고비': [70, 75, 30, 80, 72, 77, 70, 82, 70, 80, 68, 90, 72, 77, 70, 82, 40, 20, 75, 80], '플랫폼': [15, 16, 14, 20, 19, 17, 16, 19, 15, 20, 14, .. 2024. 11. 14.
[작업형3] 회귀분석-단순 선형 회귀 분석 (3) 💛 단순 선형 회귀 분석 주어진 키와 몸무게 데이터로 회귀모델을 구축하고 각 소문제의 값을 구하시오.키: 종속변수몸무게: 독립변수💛 시험에서는 물론 csv파일로 하나의 변수에 담기겠지만 일단 연습용으로 데이터를 구축했어요. import pandas as pddf = pd.DataFrame({ '키': [150, 160, 170, 175, 165, 155, 172, 168, 174, 158, 162, 173, 156, 159, 167, 163, 171, 169, 176, 161], '몸무게': [74, 50, 70, 64, 56, 48, 68, 60, 65, 52, 54, 67, 49, 51, 58, 55, 69, 61, 66, 53]}) 💛 최소제곱법인.. 2024. 11. 13.
[작업형3] 회귀분석- 상관관계 (2) 🌚 이번에는 상관관계 데이터를 연습해보려고 합니다.상관관계는 말 그대로 그 둘사이의 관계 라고 생각하고있다.상관관계두 변수 간의 선형적인 관계두 변수 간의 선형 관계의 강도와 방향 (-1 ≤ r ≤ 1)여기서는 상관계수가 중요한데 (r)로 표현을 하고 r = 1: 강한 양의 선형관계r = 0: 선형 관계 없음r = -1: 강한 음의 선형관계1이면 강한 양의 선형, 0은 없음, -1은 음의 선형관계를 뜻합니다.  🌚 데이터 준비# 데이터import pandas as pddf = pd.DataFrame({ '키': [150, 160, 170, 175, 165], '몸무게': [42, 52, 75, 67, 56]}) 상관계수에 대한 t검정귀무가설: 두 변수 간에 상관관계가 없다.대립가설: 두 변.. 2024. 11. 12.
[작업형3] 회귀분석(1) 회귀 분석(Regression)-수치형변수를 다루고 있음-독립,종속관계 예측할 때 사용함.  상관관계두 변수 간의 선형적인 관계두 변수 간의 선형 관계의 강도와 방향 (-1 ≤ r ≤ 1)상관계수 r = 1: 강한 양의 선형관계r = 0: 선형 관계 없음r = -1: 강한 음의 선형관계작업형 3 문제에서 상관계수를 구하라 하면 피어슨, 스이퍼만상관계수or 켄달타우 구하라 하면 각각 쓰기df.corr() #피어슨 (기본값)df.corr(method='spearman') #스피어맨df.corr(method='kendall') #켄달타우  상관계수에 대한 t검정귀무가설: 두 변수 간에 상관관계가 없다. 대립가설: 두 변수 간에 상관관계가 있다.stats.pearsonr(x, y) #피어슨stats.spearm.. 2024. 11. 11.
[작업형3] 범주형 데이터 분석 - 적합도검정 범주형 데이터분석에는 카이제곱, 적합도, 독립성 검정 이렇게 3가지 가있습니다. 🔶 1. 적합도 검정 [문제] 지난 3년간 빅데이터 분석기사 점수 분포가 60점 미만: 50%, 60-70점 35%, 80점이상 15%로였다. 이번 회차부터 단답형을 제외하고, 작업형3을 추가하여 300명을 대상으로 적용한 결과 60점 미만: 150명, 60-70점: 120명, 80점이상: 30명이었다. 유의수준 0.05일 때, 새로운 시험문제 유형과 기존 시험문제 유형은 점수에 차이가 없는지 검정하시오.귀무가설(H0): 새로운 시험문제는 기존 시험문제 점수와 동일하다.대립가설(H1): 새로운 시험문제는 기존 시험문제 점수와 다르다.#관찰ob = [150, 120, 30]# 기대ex = [0.5*300, 0.35*300, .. 2024. 11. 9.
[작업형3] 범주형 데이터 분석 - 카이제곱검정 범주형 데이터 분석 - 퇴근후딴짓적합도 검정관찰도수와 기대도수의 차이 12 탕수육찍먹부먹 부산60%40%기대값수원1,1,2,2,1관찰값빈도(count)로 변경 (관찰값, 기대값)↓ 사용방법scipy.stats.chisquare(observed, expected)observed: 관찰된 빈도 리스트expected: 기대 빈도 리스트 observed  = 위 값으로 보면 [3,2] 이렇게 나옵 expected = [0.6*5  ,0.4*5]를 넣으면 됩니다.이렇게 넣으면 검정통계량, pvalue값을 뽑을 수 있습니다. 독립성 검정두 변수가 서로 독립적인지(연관성이 있는지) 확인교차표 테이블로 만들기문제에서 표로 주어졌을 때로우(원) 데이터가 주어졌을 때로우(원)데이터는 교차표 형태로 만들어주면됩니다.그 이후.. 2024. 11. 8.
[작업형3] 독립표본검정 + 심화 💙독립표본검정을 공부했습니다. 두 그룹의 차이를 통계적으로 검증합니다.💙독립표본검정다음은 빅데이터 분석기사 실기 시험 점수이다. A그룹과 B그룹의 평균 점수가 차이가 있는지 유의수준 0.05하에서 가설 검정하시오. (데이터는 정규분포를 따르고 분산이 동일하다고 가정한다.)귀무가설(H0): 그룹별 시험 평균 점수는 차이가 없다. (μ1 = μ2)대립가설(H1): 그룹별 시험 평균 점수는 차이가 있다. (μ1 ≠ μ2)💙데이터는 아래와 같습니다.# 데이터A = [85, 90, 92, 88, 86, 89, 83, 87, 84, 50, 60, 39, 28, 48, 38, 28]B = [82, 82, 88, 85, 84, 74, 79, 69, 78, 76, 85, 84, 79, 89]여기서 A.. 2024. 11. 7.