[서울 상권 분석] 대치동과 목동에는 입시학원이 많을까?(1편)

2020. 11. 23. 23:06PROJECT/Python_공간데이터분석

728x90
반응형

대한민국 사교육이라고 하면 "대치동", "목동" 이 떠오른다.

공공데이터포털에 있는

소상공인 상권정보 상가업소 데이터 를 이용하여 분석해본다.

 

이번 분석에 이용할 데이터!


  • 데이터 전처리 단계

1. 파일 불러오기

csv파일을 읽고, shape를 조회해보니 573680개가 있는 것을 확인할 수 있다.

 

 

2. head, tail을 이용하여 데이터 미리보기

 

3. column값들 살펴보기

 

 

4. 결측치 확인, 사용하지 않는 칼럼(결측치가 너무 많은 칼럼) 삭제

 


  • 데이터 분석

학원의 분류명을 알아보기 위해 "상권업종대분류명"의 unique 값을 추출해본다.

 

"시도명"이 "서울특별시"이고 "상권업종대분류명"이 "학문/교육" 인 데이터를 서브셋으로 가져온다.

 

"상호명"으로 빈도수를 확인한다.

 

"시군구명" 으로 빈도수를 확인한다.

강남구>서초구>양천구>광진구>송파구 순으로 학원이 많은 것을 확인할 수 있다.

 

"상권업종소분류명"으로 빈도수를 확인한다.

 

"상권업종소분류명"으로 빈도수를 확인한 후,
빈도수가 1000개 이상인 데이터만 따로 본다.

 

강남구에는 어떤 종류의 학원이 많은지 살펴본다.

 

위에서 구한 결과를 시군구명, 상호수로 seaborn으로 시각화해본다.

강남구>양천구>노원구 순으로 결과가 나타나는 것을 볼 수 있다.


상권업종소분류명을 빈도수로 계산했을 때 1000개 이상인 데이터만 가져와서 본다.

1000개 이상인 데이터의 "시군구명"으로 빈도수를 센다.


"대치동" 과 "목동"의 데이터를 살펴보기 위해 시군구 데이터가 아닌 "법정동명" 데이터를 살펴본다.

  • 먼저 "대치동" 살펴보기

입시학원과 외국어/어학학원이 많은 것을 확인할 수 있다.

  • "목동" 살펴보기

목동 역시 입시학원과 외국어/어학학원이 많은 것을 확인할 수 있다.

 

 


오늘은 여기까지...

다음 편에는 분석한 데이터를 바탕으로 시각화를 해본다!

 

 

 

 

 

(강의 듣고 정리하는 프로젝트입니다.)