경기도 인공지능 개발 과정/R 19

R 멤버십 프로젝트 기획 (RFM 분석과 의사결정나무 이용)

colnames(customer_r) 고객의 미래 구매 행동을 예측하는 기법 신경망을 적용한 모형: 로지스틱 회귀 모형을 보완하는 차원에서 연구 확률적 RFM모형 -> Colmbo와 Weina의 확률적인 RFM모형은 -> 과거의 고객의 응답 이력으로 고객의 미래 응답을 예측하는 행동모델임 이를 바탕으로 맴버쉽 분석을 실시하고자 함 # 지적별 예약 건수 빈도표 table(reservation_r$branch) 가설 : 전체 예약 건과 예약 완료 건 비율 유사할 것임 # 주문 최소되지 않은 경우만 선택 no_cancel_data % filter(cancel == "N") # 주문 취소되지 않은 예약 건의 부서별 빈도표 table(no_cancel_data$branch) # 데이터 분석을 위해 원천 데이터 가..

R flexdashborad

1. flexdashboar 에 대한 소개 및 특징 RStudio Team 이 당시 flexdashboard 에 대해 소개한 내용은 아래와 같다. - flexdashboard 를 이용하면 R 로 유연하고(flexible), 매력적이며(attractive), 쌍방향의(Interactive) 대시보드를 쉽게(easily) 만들 수 있음 - 대시보드 작성 및 커스터마이제이션은 Rmarkdown 에 기반하여 이루어지며, Shiny 컴포넌트들도 덧붙일수도 있다. - 이외에도 htmlwidgets, base/lattice/grid 그래픽, tabula(표) 데이터, 주석 같은 다양한 컴포넌트들까지도 지원하며, 열과 행 기반 레이아웃, 스토리보드 등이 제공된다는 장점도 가지고 있음 - flexdashboard 는 R..

R 군집분석 & 연관분석

군집 분석이란? - 각 객체(대상)의 유사성을 측정하여 유사성이 높은 대상 집단을 분류하고, 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체간의 상이성을 규명하는 분석 방법이다. - 특성에 따라 고객을 여러 개의 배타적인 집단으로 나눈다. - 군집의 개수나 구조에 대한 가정 없이 데이터로부터 거리를 기준으로 군집화를 유도한다. - 유사성의 거리는 '유클리드 거리'를 이용한다 1. 유클리드 거리 유클리드 거리(Euclidean distance)는 두 점 사이의 거리를 계산하는 방법으로 이 거리를 이용하여 유클리드 공간을 정의한다 1. 관측 대상의 두 벡터의 차이를 구한다. 2. 각 차의 제곱의 합을 구한다. 3. 제곱근을 취한다. (1) matrix 생성 x x : numeric matrix, ..

R R 마크다운(Rpubs)

R 마크다운을 이용하여 데이터 분석 내용을 별도 문서로 작성해서 공유할 수 있슴 R 마크다운을 이용하면 보고서를 만들 수 있음 Rpubs는 HTML, WORD, PDF 방식이 있음 (PDF의 경우, 한글 적용이 안됨) 마크다운은 일반 텍스트 기반의 마크업(markup)언이임. 텍스트 서식과 내용을 코드로 작성하여 공유할 때, 사용되며 다른 언어에 비해 문법이 쉽고 HTML 문서로 쉽게 변환이 가능 설치 후, HTML로 설정을 하면 Publish를 선택하는 창이 뜨는데, RPubs 를 사용하여 공유가 가능함 마크다운 기존에 우리가 인터넷 세상에서 보는 웹 페이지( = 결국 문서지..)는 HTML 이라는 Markup(마크업) 언어인데, HTML 을 제대로 쓰려면 태그 등을 알아야 하는 부담이 있다. 이러한 ..

R 웹 크롤링

패키지 설치 install.packages("rvest") single_table_page % html_node("table") %>% html_table() - 문서 내부에 추출할 데이터가 테이블 태그 내에 존재하면 특정 요소를 직접 찾아낼때 사용됨 css 선택자를 사용하여 속성값을 추출함 products_page % html_nodes(".product-list li .name") products_page %>% html_nodes(".product-list li .name") %>% html_text() - 앞 코드에서 html_nodes()는 HTML 노드 집합을 반환 - html_text() 함수는 각 HTML 노드에서 내부 텍스트를 추출하여 문자형 벡터로 반환할 만큼 똑똑함 products_p..

R 웹 크롤링(HTML 기본문법)

웹스크래핑 개요 웹크롤링(web crawling): 포털 등에서 자동으로 웹 사이트의 링크 정보를 수집 하여 저장하는 기술 웹 스크래핑(web scraping): 웹 사이트로부터 웹문서를 다운로드 받아 필요한 정보를 추출하는 기술 html4, html5의 엔진이 다름 특정서버를 컴파일 해주는 것이 아닌 웹브라우저가 해석하는 것 해석기가 제각기 다름 : 시작태그 : 닫는태그 둘이 한쌍을 이루어 줘야 함 다른태그와 중첩되어있으면 안됨 웹 크롤링을 하려면 body와 body사이에 있는 값을 찾아야 함 title과 title 사이의 보여주는 글자 태그는 인코딩 예 ) , head와 head사이로 들어감 body와 body사이는 실제로 보여주는 화면으로 들어감 p태그 = 달락을 만들어줌 -> 나타내면 한줄이 비게..