경기도 인공지능 개발 과정/R

R 기본문법(summary, dplyr 패키지, ifelse, table, hist)

agingcurve 2022. 4. 17. 15:17
반응형


# exam <- read.csv("../data_files/csv_exam.csv") : 부모폴더
# exam <- read.csv("./data_files/csv_exam.csv") : 현위치

exam <- read.csv("csv_exam.csv")
head(exam, 10)
tail(exam, 10)

dim(exam)

str(exam)

# 데이터에 대한 전반적인 요약  : summary()
summary(exam)

### ggplot2 의 mpg 데이터를 바로 데이터 프레임으로 생성
# mpg <- as.data.frame(패키지명::데이터이름)
mpg <- as.data.frame(ggplot2::mpg)
head(mpg)

str(mpg)

?mpg

summary(mpg)
######################################
# 변수명 변경시 : dplyr 패키지 필요
df_raw <- data.frame(var1 = c(1,2,1), 
                     var2 = c(2,3,2))

# 데이터 복사
df_new <- df_raw

# 데이터프레임 내의 변수(속성,열,필드)명 변경
# rename(데이터프레임, 변경할변수명 = 변경될변수명)
# df_new $var1 / $var2
df_new <- rename(df_new, v1 = var1)

# 데이터프레임의 변수 연산 결과를 추가할 경우
df <- data.frame(var1 = c(4, 3, 8), var2 = c(2, 6, 1) )

df$var_sum <-df$var1 + df$var2

df$var_mean <- (df$var1 + df$var2) / 2

#######################################
summary(mpg$total)

# 통합연비(cty / hwy)변수 추가
mpg$total <- (mpg$cty + mpg$hwy) / 2

# 통합연비에 대한 분포 시각화 작업 : hist()
# hist() : 히스토그램 시각화 결과 출력 (빈도에 대한 분포 표현)
hist(mpg$total)
hist(mpg$cty)
hist(mpg$hwy)

# mpg$test <- ifelse(조건 , 참일 경우, 거짓일 경우)
mpg$test <- ifelse(mpg$total >= 20, "pass", "fail")
summary(mpg$test)
head(mpg$test, 20)
tail(mpg$test, 20)

# mpg$test : 값(데이터)에 대한 빈도수를 표(Table)형태로 출력
table(mpg$test)

# mpg$total 을 이용한 등급 부여(A:30,B:20,C)
mpg$grade <- ifelse(mpg$total >= 30, "A",
                                          ifelse(mpg$total >= 20, "B", "C")
                    )
table(mpg$grade)

qplot(mpg$grade)



'경기도 인공지능 개발 과정 > R' 카테고리의 다른 글

R ggplot2  (0) 2022.04.17
R 이상치  (0) 2022.04.17
R 결측치  (0) 2022.04.17
R 패키지 ggplot2, dplyr  (0) 2022.04.17
R 기본문법 ( 변수, 연산, plot그리기, 데이터프레임생성)  (0) 2022.04.17