경기도 인공지능 개발 과정/R

R ggplot2

agingcurve 2022. 4. 17. 15:41
반응형

### R 그래프 : 대표적인 ggplot2 패키지
# 산점도 : 변수 간 관게 표현
# 1. 배경설정
# ggplot(data=데이터프레임, aes(x=변수 , y=변수))
ggplot(data = mpg, aes(x=displ, y=hwy))

# 2. 그래프 추가 : + geom_point()
ggplot(data = mpg, aes(x=displ, y=hwy)) + geom_point()

#### 경고 메시지
# Removed 3 rows containing missing values (geom_point).
# 결측치를 포함하는 3개의 행을 제거했습니다,,

# 3. 축에 대한 범위 조정
# xlim(축의 시작값, 축의 끝나는 값) / ylim(축의 시작값, 축의 끝나는 값)
ggplot(data = mpg, aes(x=displ, y=hwy)) + geom_point() + xlim(3,6)

ggplot(data = mpg, aes(x=displ, y=hwy)) + geom_point() + xlim(3,6) + ylim(10,30)


# 막대 그래프 : + geom_col()
# mpg 데이터를 이용하여 "구동 방식별 평균 고속도로 연비" => 막대 그래프 화
# 구동 방식별 : drv 를 그룹화 / 고속도로 연비 : hwy
# 평균 : mean()

df_mpg <- mpg %>% group_by(drv) %>% summarise(mean_hwy=mean(hwy, na.rm = T))

# x : 구동방식 / y : 평균연비
ggplot(data = df_mpg, aes(x=drv, y=mean_hwy)) + geom_col()

# 크기 순으로 정렬 : reorder(정렬할 변수, 정렬 기준 변수)
# 정렬 기준 변수 : 오름 차순 / -정렬 기준 변수 : 내림차순
ggplot(data = df_mpg, aes(x=reorder(drv, mean_hwy), y=mean_hwy)) + geom_col()

ggplot(data = df_mpg, aes(x=reorder(drv, -mean_hwy), y=mean_hwy)) + geom_col()



# 빈도 막대 그래프 : 데이터의 갯수를 이용하여 막대의 길이를 표현 + geom_bar()
# 구동 방식에 대한 데이터 갯수
ggplot(data = mpg, aes(x=drv)) + geom_bar()

# 고속도로 연비에 따른 데이터 갯수
ggplot(data = mpg, aes(x=hwy)) + geom_bar()




# 선 그래프 : 시간에 따른 데이터를 표현(시계열) + geom_line()
# ggplot2 내의 미국경제지표(economics)
# x : date / y : unemploy
ggplot(data = economics, aes(x=date, y=unemploy)) + geom_line()


# 상자 그래프 : 집단간의 관계 (분포 차이) 표현 + geom_boxplot()
# ggplot2 내의 mpg
# x : drv / y : hwy
ggplot(data = mpg, aes(x=drv, y=hwy)) + geom_boxplot()










'경기도 인공지능 개발 과정 > R' 카테고리의 다른 글

R 야구 데이터 분석  (0) 2022.04.19
R 서울시 역세권 아파트 가격 분석  (0) 2022.04.19
R 이상치  (0) 2022.04.17
R 결측치  (0) 2022.04.17
R 패키지 ggplot2, dplyr  (0) 2022.04.17