공공데이터(2)
-
[서울 상권 분석] 대치동과 목동에는 입시학원이 많을까?(2편)
1편에 이어서 분석한 결과를 바탕으로 시각화를 해보았다! 시각화를 하기 앞서 "상권업종소분류명", "시군구명"으로 그룹화를 하고, "상호명"으로 빈도수를 계산한다. 이 프로젝트에서는 "학원-입시" 데이터를 살펴보기 때문에 loc를 통해 index값을 가져온다. 따라서 시군구 별 ["학원-입시"]를 가져온 결과 아래와 같이 구별 "학원-입시"학원의 수를 볼 수 있다. Pandas의 plot으로 시각화 강남구 > 양천구 > 서초구 순으로 입시학원이 많이 분포하고 있다는 것을 알 수 있다. 경도와 위도를 scatterplot으로 표현하기 1) scatterplot 으로 경도와 위도를 표현하고, 시군구명으로 색상을 다르게 표현한다. 2) scatterplot 으로 경도와 위도를 표현하고, "상권업종소분류명"으로..
2020.11.26 -
[서울 상권 분석] 대치동과 목동에는 입시학원이 많을까?(1편)
공공데이터포털에 있는 소상공인 상권정보 상가업소 데이터 를 이용하여 분석해본다. 데이터 전처리 단계 1. 파일 불러오기 csv파일을 읽고, shape를 조회해보니 573680개가 있는 것을 확인할 수 있다. 2. head, tail을 이용하여 데이터 미리보기 3. column값들 살펴보기 4. 결측치 확인, 사용하지 않는 칼럼(결측치가 너무 많은 칼럼) 삭제 데이터 분석 학원의 분류명을 알아보기 위해 "상권업종대분류명"의 unique 값을 추출해본다. "시도명"이 "서울특별시"이고 "상권업종대분류명"이 "학문/교육" 인 데이터를 서브셋으로 가져온다. "상호명"으로 빈도수를 확인한다. "시군구명" 으로 빈도수를 확인한다. "상권업종소분류명"으로 빈도수를 확인한다. "상권업종소분류명"으로 빈도수를 확인한 후..
2020.11.23