본문 바로가기

분류 전체보기48

[ML] 선형 회귀_Rent값 예측 모델 만들기(1) 머신러닝을 공부했다면! 이정도 알고리즘을 알아야하는것들을 학습&반복했습니다.솔직히 데이터시각화까지는 바지밑단잡고 질질 끌려가는느낌이었지만 ML들어가면서 수학적인부분이 확실히 들어가다보니 많이 이해하기가 힘들었습니다.그래서 수업에 그치지않고 유튜브, GPT을 이용해서 조금 더 공부를 해보려고 노력했습니다. Rent값 예측 모델 만들기전체 과정데이터 분할: 데이터를 훈련 데이터와 테스트 데이터로 나누기.모델 학습: 훈련 데이터를 사용해 모델을 학습시키기.모델 평가: 테스트 데이터를 사용해 모델이 얼마나 잘 예측하는지 평가하기.예측: 학습된 모델을 사용해 새로운 데이터의 임대료를 예측하기.으로 구성되어있고 이번 글은 1번에 해당하는 글 입니다.1. Rent 데이터셋(따로 받은 데이터셋입니다. 데이터를 이용해서.. 2024. 7. 2.
[ML] 아이리스 데이터셋(Iris DataSet) 1. Iris DataSetDataSet : 특정한 작업을 위해 데이터를 관련성 있게 모아놓은 것사이킷런 데이터셋 페이지from sklearn.datasets import load_irisiris = load_iris()irisprint(iris['DESCR'])class는 3가지 독립변수는 4가지 입니다. data =iris['data']data한 줄이 값이고 그게 150개가 있다는것2.레이블 확인target = iris['target']target0번꽃, 1번꽃, 2번에대한 부분 출력을 확인할 수 있음 150개컬럼명으로 쓸만한 이름이 4가지가 있다는것을 확인할 수 있습니다.feature_names = iris['feature_names']feature_names  3. padnas를 이용 및 확인im.. 2024. 7. 1.
[ML] 사이킷런(Scikit-learn) 이번챕터는 많이 딥하게 알 필요는 없지만 전반적인 줄거리를 볼 수 있습니다.1. 사이킷런(Scikit-learn)대표적인 파이썬 머신러닝 모듈안에는 다양한 머신러닝 알고리즘을 제공다양한 샘플 데이터를 제공머신러닝 결과를 검증하는 기능을 제공합니다.BSD(무료) 라이선스이기 때문에 무료로 사용 및 배포가 가능합니다.사이킷런 공식 홈페이지2. LinearSVC(사이킷런의 알고리즘 중 하나입니다)클래스를 구분으로 하는 분류 문제에서 각 클래스를 잘 구분하는 선을 그려주는 방식을 사용하는 알고리즘지도학습 알고리즘을 사용하는 학습 전용 데이터와 결과 전용 데이터를 모두 가지고 있어야 사용할 수 있음.이렇게 2차원적으로 한번에 되지는 않고 압축을 한 것으로 알고리즘이 됩니다. 3.사이킷런 사용해보기#구글은 pip할.. 2024. 6. 30.
[데이터 시각화] 떡볶이 프렌차이즈의 입점전략은 바로 이것. 호호 강사님이 아주 재미있는 썰을 말씀해주셨다.떡볶이집는 파리바게트 근처에 오픈해야 장사가 잘 된다는 썰인데 떡볶이를 그닥 좋아하진 않지만이런 썰이 진짜인지 확인하는것을 좋아하는편.. 꽤 흥미로운 주제였다.그래서 정말 열심히 들으려고 노력했지만 오우 이번은 아주 어려웠던.......그래도 프로젝트 기록을 하겠습니다.import pandas as pddf = pd.read_csv('소상공인시장진흥공단_상가(상권)정보_서울_202303.csv')dfdf.info()서울시 값이고 대부분이 null값이 없이 잘 들어가있는걸 확인할 수 있습니다. 떡볶이집 선택하기 shop변수에 들어갈 떡볶이집 5곳을 선택했습니다. 신전, 죠스, 엽떡, 청년다방, 감탄떡볶이를.. 2024. 6. 29.