# exam <- read.csv("../data_files/csv_exam.csv") : 부모폴더
# exam <- read.csv("./data_files/csv_exam.csv") : 현위치
exam <- read.csv("csv_exam.csv")
head(exam, 10)
tail(exam, 10)
dim(exam)
str(exam)
# 데이터에 대한 전반적인 요약 : summary()
summary(exam)
### ggplot2 의 mpg 데이터를 바로 데이터 프레임으로 생성
# mpg <- as.data.frame(패키지명::데이터이름)
mpg <- as.data.frame(ggplot2::mpg)
head(mpg)
str(mpg)
?mpg
summary(mpg)
######################################
# 변수명 변경시 : dplyr 패키지 필요
df_raw <- data.frame(var1 = c(1,2,1),
var2 = c(2,3,2))
# 데이터 복사
df_new <- df_raw
# 데이터프레임 내의 변수(속성,열,필드)명 변경
# rename(데이터프레임, 변경할변수명 = 변경될변수명)
# df_new $var1 / $var2
df_new <- rename(df_new, v1 = var1)
# 데이터프레임의 변수 연산 결과를 추가할 경우
df <- data.frame(var1 = c(4, 3, 8), var2 = c(2, 6, 1) )
df$var_sum <-df$var1 + df$var2
df$var_mean <- (df$var1 + df$var2) / 2
#######################################
summary(mpg$total)
# 통합연비(cty / hwy)변수 추가
mpg$total <- (mpg$cty + mpg$hwy) / 2
# 통합연비에 대한 분포 시각화 작업 : hist()
# hist() : 히스토그램 시각화 결과 출력 (빈도에 대한 분포 표현)
hist(mpg$total)
hist(mpg$cty)
hist(mpg$hwy)
# mpg$test <- ifelse(조건 , 참일 경우, 거짓일 경우)
mpg$test <- ifelse(mpg$total >= 20, "pass", "fail")
summary(mpg$test)
head(mpg$test, 20)
tail(mpg$test, 20)
# mpg$test : 값(데이터)에 대한 빈도수를 표(Table)형태로 출력
table(mpg$test)
# mpg$total 을 이용한 등급 부여(A:30,B:20,C)
mpg$grade <- ifelse(mpg$total >= 30, "A",
ifelse(mpg$total >= 20, "B", "C")
)
table(mpg$grade)
qplot(mpg$grade)
'경기도 인공지능 개발 과정 > R' 카테고리의 다른 글
R ggplot2 (0) | 2022.04.17 |
---|---|
R 이상치 (0) | 2022.04.17 |
R 결측치 (0) | 2022.04.17 |
R 패키지 ggplot2, dplyr (0) | 2022.04.17 |
R 기본문법 ( 변수, 연산, plot그리기, 데이터프레임생성) (0) | 2022.04.17 |