Analysis(2)
-
[상권 분석] 프랜차이즈 입점분석 (1편-전처리 과정)
배스킨라빈스 vs 던킨도너츠 -> 근처에 입지한 것을 종종 볼 수 있다. 파리바게뜨 vs 뚜레주르 -> 주변에서 많이 볼 수 있는 프랜차이즈 중 하나 이런 프랜차이즈 매장이 얼마나 모여 있는지, 흩어져 있는지 지도에 표시를 해보면서 대용량 데이터에서 원하는 특정 데이터를 추출해본다. 데이터 불러오기 공공데이터 포털 : 소상공인시장진흥공단 상가업소정보 데이터 활용 df = pd.read_csv 한 뒤 df.head를 통해 데이터 구조를 확인한다. 데이터 크기 보기 df_shape를 통해 데이터 크기를 볼 수 있다. info 보기 info를 사용하여 데이터의 전체적인 정보를 본다.(데이터 사이즈, 타입, 메모리 사용량 등) 결측치 보기 isnull을 사용하여 결측치를 본다. 결측치는 True로 값이 있다면 ..
2020.11.29 -
[서울 상권 분석] 대치동과 목동에는 입시학원이 많을까?(1편)
공공데이터포털에 있는 소상공인 상권정보 상가업소 데이터 를 이용하여 분석해본다. 데이터 전처리 단계 1. 파일 불러오기 csv파일을 읽고, shape를 조회해보니 573680개가 있는 것을 확인할 수 있다. 2. head, tail을 이용하여 데이터 미리보기 3. column값들 살펴보기 4. 결측치 확인, 사용하지 않는 칼럼(결측치가 너무 많은 칼럼) 삭제 데이터 분석 학원의 분류명을 알아보기 위해 "상권업종대분류명"의 unique 값을 추출해본다. "시도명"이 "서울특별시"이고 "상권업종대분류명"이 "학문/교육" 인 데이터를 서브셋으로 가져온다. "상호명"으로 빈도수를 확인한다. "시군구명" 으로 빈도수를 확인한다. "상권업종소분류명"으로 빈도수를 확인한다. "상권업종소분류명"으로 빈도수를 확인한 후..
2020.11.23