본문 바로가기
데이터 시각화 및 애플리케이션 개발

[Matplotlib] 상권별 업종 밀집 통계 데이터

by 바다의 공간 2024. 6. 21.

이번에는 상권별 업종 밀집 통계자료를 가지고와서 데이터를 시각화해보려고 합니다.

이번에는 pandas, numpy, matplotib모두를 이용할것입니다.

shop = pd.read_csv('경로')

위 데이터는 굉장히 많아서 

가로로 봤을때 columns들이 다 보이지 않습니다.

#생략된 부분을 펼쳐서 보기
pd.set_option('display.max_columns', 40)
shop

화면이 작아서 다 보이진 않지만 스크롤바가 생기면서 모든 컬럼을 다 볼 수 있는것을 확인할 수 있습니다.

물론 info를 통해서 확인할 수도 있습니다.

shop.info()


shop.columns


남겨둘 컬럼만 남기겠습니다.

view_columns= ['상호명', '지점명', '상권업종대분류명', '상권업종중분류명','상권업종소분류명', '시도명', '시군구명', '도로명', '도로명주소', '경도', '위도' ]
shop =shop[view_columns]
shop.head()

 

null값 확인

shop.isnull().sum()

 


시각화를 하기 위해  한글폰트를 설치해줍니다.

!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
plt.rc('font', family='NanumBarunGothic')

 

shop.plot.scatter(x='경도', y='위도', grid=True, figsize=(6,8))

shop.head()

 

 

서울데이터만 사용하기

shop_seoul = shop.loc[shop['도로명주소'].str.startswith('서울')]
shop_seoul

서울이 아닌 데이터들만 뽑기

shop_seoul = shop.loc[shop['도로명주소'].str.startswith('서울')]
shop_seoul

~ 물결을 사용하면 제외하고 데이터를 뽑을 수 있습니다.

서울상권 확인하기

shop_seoul.plot.scatter(x='경도',y='위도', grid=True, figsize=(10,8))

부산 상권 확인하기

shop_except_seoul.plot.scatter(x='경도',y='위도', grid=True, figsize=(10,8))