반응형
치킨집이 가장 많은 지역 찾기
'서울시의 특정구를 선정하여 해당 구안에서 동별 치킨집 분포를 트리맵을 이용하여 시각화'
library(readxl)
ck <- read_excel("치킨집_가공.xlsx")
head(ck)
# 소재지 천체주소 열에서 xxx동만 남기고 이후 상세 주소 삭제(추출)
# 특정 문자열에서 일부를 추출하는 방법 : subset(문자열, 시작위치, 끝위치)
addr<- substr(ck$소재지전체주소, 12, 16)
addr
# 숫자제거
addr_num <- gsub("[0-9]","",addr)
head(addr_num)
# 공백제거
addr_trim <- gsub(" ","",addr_num)
head(addr_trim)
# table(데이터 셋1) : 도수분포표 생성
# table(데이터 셋1, 데이터 셋2) : 교차표 생성
# 시각화시 반드시 frame화 해야됨 안그럴시 factor 형태로 들어감
addr_count <- addr_trim %>% table() %>% data.frame()
head(addr_count)
# 트리맵 패키지
install.packages("treemap")
library(treemap)
treemap(addr_count, index=".", vSize="Freq", title = "서대문구 동별 치킨집 분포포")