[서울 상권 분석] 대치동과 목동에는 입시학원이 많을까?(2편)

2020. 11. 26. 22:44PROJECT/Python_공간데이터분석

728x90
반응형

1편에 이어서

분석한 결과를 바탕으로 시각화를 해보았다!


시각화를 하기 앞서

"상권업종소분류명", "시군구명"으로 그룹화를 하고, "상호명"으로 빈도수를 계산한다.

이 프로젝트에서는 "학원-입시" 데이터를 살펴보기 때문에 loc를 통해 index값을 가져온다.

따라서 시군구 별 ["학원-입시"]를 가져온 결과 아래와 같이 구별 "학원-입시"학원의 수를 볼 수 있다.

  • Pandas의 plot으로 시각화

"학원-입시" 구 별 데이터

강남구 > 양천구 > 서초구 순으로 입시학원이 많이 분포하고 있다는 것을 알 수 있다.

 

  • 경도와 위도를 scatterplot으로 표현하기

1) scatterplot 으로 경도와 위도를 표현하고, 시군구명으로 색상을 다르게 표현한다.

2) scatterplot 으로 경도와 위도를 표현하고, "상권업종소분류명"으로 색상을 다르게 표현한다.

3) "상권업종소분류명"이 "학원-입시" 인 데이터만 그려본다.

3-1) "상권업종소분류명"이 "어린이집" 인 데이터만 그려본다.(입시학원 데이터와 비교하려고)

강남, 종로가 아닌 양천구, 강서구, 노원구 같은 지역에 어린이집이 많이 분포하고 있는 것을 확인하였다.

3-2) "어린이집"과 "입시학원"을 한번에 비교해본다.

강남이 확실히 입시학원이 많다.

  • Folium으로 지도 활용하기

위에서 그렸던 "어린이집"과 "입시학원"에 대한 상호 데이터를 지도에 시각화해본다.

먼저 예시로 [0] index에 있는 해법수학을 띄어본다.

하지만 위도와 경도를 하나하나 입력하여 표현하는 것은 무리이다.

for문을 이용하여 1000개, 100개를 나타내보자.

지도에서 상호명과 도로명주소, 위도, 경도를 담아준다.

1000개를 나타내면 이러한 결과가...

이런 결과는 의미가 없다!

 

(+) 다른 지도 유형 적용해보기

tiles='Stamen Toner'을 적용해본다.

마커 또한 바꿀 수 있다.

folium.CircleMarker 이용하여 표현해보았다.


결론 :

대치동과 목동에는 입시학원이 많을까?

-> Yes.

여러 시각화를 통해 그래프를 보고, 데이터를 확인한 결과

대치동이 있는 "강남구"와 목동이 있는 "양천구"에 입시학원이 많은 것을 확인할 수 있었다.