이번에는 상권별 업종 밀집 통계자료를 가지고와서 데이터를 시각화해보려고 합니다.
이번에는 pandas, numpy, matplotib모두를 이용할것입니다.
shop = pd.read_csv('경로')
위 데이터는 굉장히 많아서
가로로 봤을때 columns들이 다 보이지 않습니다.
#생략된 부분을 펼쳐서 보기
pd.set_option('display.max_columns', 40)
shop
화면이 작아서 다 보이진 않지만 스크롤바가 생기면서 모든 컬럼을 다 볼 수 있는것을 확인할 수 있습니다.
물론 info를 통해서 확인할 수도 있습니다.
shop.info()
shop.columns
남겨둘 컬럼만 남기겠습니다.
view_columns= ['상호명', '지점명', '상권업종대분류명', '상권업종중분류명','상권업종소분류명', '시도명', '시군구명', '도로명', '도로명주소', '경도', '위도' ]
shop =shop[view_columns]
shop.head()
null값 확인
shop.isnull().sum()
시각화를 하기 위해 한글폰트를 설치해줍니다.
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
plt.rc('font', family='NanumBarunGothic')
shop.plot.scatter(x='경도', y='위도', grid=True, figsize=(6,8))
shop.head()
서울데이터만 사용하기
shop_seoul = shop.loc[shop['도로명주소'].str.startswith('서울')]
shop_seoul
서울이 아닌 데이터들만 뽑기
shop_seoul = shop.loc[shop['도로명주소'].str.startswith('서울')]
shop_seoul
~ 물결을 사용하면 제외하고 데이터를 뽑을 수 있습니다.
서울상권 확인하기
shop_seoul.plot.scatter(x='경도',y='위도', grid=True, figsize=(10,8))
부산 상권 확인하기
shop_except_seoul.plot.scatter(x='경도',y='위도', grid=True, figsize=(10,8))
'데이터 분석 및 시각화' 카테고리의 다른 글
[데이터 시각화] 전국 도시공원 데이터 활용 (0) | 2024.06.23 |
---|---|
[seaborn] 상권별 업종 밀집 통계 데이터(2) (0) | 2024.06.22 |
[Matplotlib] 가상 온라인 쇼핑몰 데이터 다루기 (1) | 2024.06.20 |
[Matplotlib] 파이썬을 이용하여 그래프 만들기 (0) | 2024.06.19 |
[Python] Streamlit으로 웹 애플리케이션 개발하기 (0) | 2024.06.09 |