2020. 11. 23. 23:06ㆍPROJECT/Python_공간데이터분석


공공데이터포털에 있는
소상공인 상권정보 상가업소 데이터 를 이용하여 분석해본다.

- 데이터 전처리 단계
1. 파일 불러오기

csv파일을 읽고, shape를 조회해보니 573680개가 있는 것을 확인할 수 있다.
2. head, tail을 이용하여 데이터 미리보기

3. column값들 살펴보기

4. 결측치 확인, 사용하지 않는 칼럼(결측치가 너무 많은 칼럼) 삭제
- 데이터 분석
학원의 분류명을 알아보기 위해 "상권업종대분류명"의 unique 값을 추출해본다.

"시도명"이 "서울특별시"이고 "상권업종대분류명"이 "학문/교육" 인 데이터를 서브셋으로 가져온다.

"상호명"으로 빈도수를 확인한다.

"시군구명" 으로 빈도수를 확인한다.

"상권업종소분류명"으로 빈도수를 확인한다.

"상권업종소분류명"으로 빈도수를 확인한 후,
빈도수가 1000개 이상인 데이터만 따로 본다.

강남구에는 어떤 종류의 학원이 많은지 살펴본다.

위에서 구한 결과를 시군구명, 상호수로 seaborn으로 시각화해본다.

상권업종소분류명을 빈도수로 계산했을 때 1000개 이상인 데이터만 가져와서 본다.

1000개 이상인 데이터의 "시군구명"으로 빈도수를 센다.

"대치동" 과 "목동"의 데이터를 살펴보기 위해 시군구 데이터가 아닌 "법정동명" 데이터를 살펴본다.
- 먼저 "대치동" 살펴보기

- "목동" 살펴보기

오늘은 여기까지...
다음 편에는 분석한 데이터를 바탕으로 시각화를 해본다!
(강의 듣고 정리하는 프로젝트입니다.)
'PROJECT > Python_공간데이터분석' 카테고리의 다른 글
[서울상권분석] 스타벅스 vs 이디야 매장 위치 비교하기(1편-전처리 과정) (0) | 2020.12.17 |
---|---|
[상권 분석] 프랜차이즈 입점분석 (2편-시각화) (0) | 2020.12.01 |
[상권 분석] 프랜차이즈 입점분석 (1편-전처리 과정) (0) | 2020.11.29 |
[서울 상권 분석] 대치동과 목동에는 입시학원이 많을까?(2편) (0) | 2020.11.26 |