카테고리 없음

R 서대문구 치킨집 분석

agingcurve 2022. 4. 19. 17:26
반응형

치킨집이 가장 많은 지역 찾기

'서울시의 특정구를 선정하여 해당 구안에서 동별 치킨집 분포를 트리맵을 이용하여 시각화'

library(readxl)

ck <- read_excel("치킨집_가공.xlsx")

head(ck)

# 소재지 천체주소 열에서 xxx동만 남기고 이후 상세 주소 삭제(추출)
# 특정 문자열에서 일부를 추출하는 방법 : subset(문자열, 시작위치, 끝위치)

addr<- substr(ck$소재지전체주소, 12, 16)
addr

# 숫자제거
addr_num <- gsub("[0-9]","",addr)
head(addr_num)

# 공백제거
addr_trim <- gsub(" ","",addr_num)
head(addr_trim)


# table(데이터 셋1) : 도수분포표 생성
# table(데이터 셋1, 데이터 셋2) : 교차표 생성
# 시각화시 반드시 frame화 해야됨 안그럴시 factor 형태로 들어감

addr_count <- addr_trim %>% table() %>% data.frame()
head(addr_count)

# 트리맵 패키지
install.packages("treemap")
library(treemap)
treemap(addr_count, index=".", vSize="Freq", title = "서대문구 동별 치킨집 분포포")