본문 바로가기

데이터 시각화 및 애플리케이션 개발24

[Matplotlib] 상권별 업종 밀집 통계 데이터 이번에는 상권별 업종 밀집 통계자료를 가지고와서 데이터를 시각화해보려고 합니다.이번에는 pandas, numpy, matplotib모두를 이용할것입니다.shop = pd.read_csv('경로')위 데이터는 굉장히 많아서 가로로 봤을때 columns들이 다 보이지 않습니다.#생략된 부분을 펼쳐서 보기pd.set_option('display.max_columns', 40)shop화면이 작아서 다 보이진 않지만 스크롤바가 생기면서 모든 컬럼을 다 볼 수 있는것을 확인할 수 있습니다.물론 info를 통해서 확인할 수도 있습니다.shop.info()shop.columns남겨둘 컬럼만 남기겠습니다.view_columns= ['상호명', '지점명', '상권업종대분류명', '상권업종중분류명','상권업종소분류명', '.. 2024. 6. 21.
[Matplotlib] 가상 온라인 쇼핑몰 데이터 다루기 이번에는 54만개 이상 되는 많은 양의 데이터양의 CSV파일을 가져와서 다루어보려고 합니다.이번 데이터 csv는 retail에 대한 값입니다.  1.데이터 분석 2. 시각화 표현 아래에있는 내용의 기본정보입니다.InvoiceNo: 주문 번호StockCode: 상품 코드Description: 상품 설명Quantity: 주문 수량InvoiceDate: 주문 날짜UnitPrice: 상품 가격CustomerID: 고객 아이디Country: 고객 거주지역(국가)가장먼저 pandas로 임포트를 해주고저는 구글드라이브에있는 파일연동을 시켜줍니다.import pandas as pdfrom google.colab import drivedrive.mount('/content/drive')retail = pd.read_cs.. 2024. 6. 20.
[Matplotlib] 파이썬을 이용하여 그래프 만들기 1. Matplotlib 파이썬 기반 시각화 라이브러리한글에 대한 지원이 완벽하지 않음pandas와 연동이 용이함Matplotlib 공식 홈페이지 리디렉션 알림 www.google.com설치하기- 구글코랩에는 기본적으로 설치되어있지만 주피터를 사용할때는 또 따로 설치를 해야하기때문에 기록.!pip install matplotlib#MATLAB과 비슷하게 명령어 스타일로 동작하는 함수들의 모음import matplotlib.pyplot as pltplot는 선 그래프를 넣어주는그래프입니다.plt.plot([1,2,3,4]) #하나만 넣는다면 리스트의 값들은 y값들이며, x값은 자동으로 만들어줌plt.show()plt.plot([1,2,3,4],[1,2,3,4])plt.show 넘파이를 이용할 수도있습니다... 2024. 6. 19.
[Python] 판다스(pandas) 데이터 프레임 합치기,산술연산, 원핫인코딩 등 1. 데이터 프레임 행 합치기이번에는 df1 과 df2의 데이터를 합쳐보았습니다.df2는 임의로 작성한 연봉과 가족수를 넣은 자료들입니다. 일단 df1는 따로 copy를 따놓고 df_copy라는 이름으로  해두었습니다. 행을 합치는 매소드 concat을 이용하여서 데이터를 합쳐보겠습니다.pd.concat([df1, df_copy])  (사실 같은 파일)여기서 기본값은 axis = 0(행)이기때문에 밑으로 합쳐지게 됩니다.이러면 인덱스가 0~19, 0~19가 있고 이것이 행으로 합쳐지게 됩니다.인덱스가 겹치니 인덱스를 새롭게 적용하고 싶어집니다.이럴때 사용 할 수 있는 매소드는reset_index() : 새롭게 인덱스를 적용하기 입니다.변수하나로 다시 담아놓고df_concat = pd.concat([df1.. 2024. 6. 18.