전체 글 212

[파이썬] XGB 활용하여 성적예측

import pandas as pd import numpy as np X_train = pd.read_csv("X_train.csv") X_test = pd.read_csv("X_test.csv") y_train = pd.read_csv("y_train.csv") y_test = pd.read_csv("y_test.csv") # trainindex 678 # StudentID 제거 필요, 통합데 이터 alldata = pd.concat([X_train, X_test], axis=0) alldata2 = alldata.drop("StudentID",axis=1) y_train_dr = y_train.drop("StudentID",axis=1) from sklearn.preprocessing import L..

[파이썬] ProPhet을 활용하여 삼성전자 주식 데이터 예측해보기

1. yahoo finaince에서 삼성전자 일자별 장마감 가격을 갖고오기(크롤링을 이용해서 갖고와 보기) 패키지 설치 import pandas as pd import pandas_datareader as web import numpy as np import matplotlib.pyplot as plt from bs4 import BeautifulSoup from urllib.request import urlopen, Request from fbprophet import Prophet from datetime import datetime 이후에 패키지 사용을 위해서 yahoo finance(https://finance.yahoo.com/) 에서 검색해서 일자별 데이터를 가지고 옴 html코드를 분석하여 ..

[파이썬] ProPhet 활용하여 시계열 예측

# Sin 그래프를 그리는 함수 만들어보기 import matplotlib.pyplot as plt import numpy as np %matplotlib inline def plotSinWave(amp, freq, endTIme, smapleTime, startTime, bias): """ plot sin wave y = a sin(2 pi f t + t_0) + b """ time = np.arange(startTime, endTIme, smapleTime) result = amp * np.sin(2 * np.pi * freq * time + startTime) + bias plt.figure(figsize=(12, 6)) plt.plot(time, result) plt.grid(True) plt.x..

[파이썬] 서울날씨데이터 분석

서울날씨 데이터를 분석함 코드참고 : jh_lee@g.kmou.ac.kr님의 서울 날씨 데이터 분석 환경 : Google Colab #데이터 다운로드 import pandas as pd import numpy as np rawdata = pd.read_csv('https://raw.githubusercontent.com/kmouleejunhyuk/bigdata_analysist_practical/main/seoul.csv', encoding = 'cp949') #data 살펴보기 rawdata.head() rawdata.describe() rawdata.shape -> 5개의 컬럼과 39748개의 행으로 구성되어 있음 #결측치, 중복 여부 검사 및 제거 rawdata.isnull().sum() #날짜 파..

카테고리 없음 2022.04.23

[파이썬] 수치형 변수의 요약, 기술통계

환경 : Google Colab 데이터: mpg 데이터 사용 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 파이썬 버전 확인 print(pd.__version__) 3print(sns.__version__) # 데이터 확인 df.head(4) df.info() # 결측데이터 확인 df.isnull().sum() horesepower 변수가 6개의 결측치가 확인 # 비율로 확인 # 기초통계량 확인 df.describe() # 범주형 데이터의 기초통계량 확인 df.describe(include="object") # mpg 변수의 고윳값 갯수 보기 df["mpg"].nunique() # ..

SQL 과제 - 팀별 SQL퀴즈 풀기

4조 성민제, 조은정, 이다은 [문제 준비] # 계정생성 CREATE USER 'user4'@'%' IDENTIFIED BY '1234'; GRANT ALL ON *.* TO 'user4'@'%' WITH GRANT OPTION; # 데이터베이스 생성 CREATE DATABASE IF NOT EXISTS employeedb4; USE employeedb4; # 부서 테이블 생성 CREATE TABLE DEPT_4 (DEPTNO INT PRIMARY KEY, DNAME VARCHAR(10), LOC VARCHAR(10)); # 사원 테이블 생성 CREATE TABLE EMP_4 (EMPNO INT PRIMARY KEY, ENAME VARCHAR(10) NOT NULL, JOB VARCHAR(5) NOT N..

SQL 활용

# 과목번호, 이름, 강의실, 개설학과, 시수 열로 구성된 과목2 테이블을 생성하시오 # 과목번호를 기본키로 설정하시오 CREATE TABLE 과목2( 과목번호 CHAR(4) NOT NULL PRIMARY KEY, 이름 VARCHAR(20) NOT NULL, 강의실 CHAR(4) NOT NULL, 개설학과 VARCHAR(20) NOT NULL, 시수 INT NOT NULL ); SELECT * FROM 과목2; # 학생2 테이블 생성하시오 CREATE TABLE 학생2 (학번 CHAR(4) NOT NULL, 이름 VARCHAR(20) NOT NULL, 주소 VARCHAR(50) DEFAULT "미정", 학년 INT NOT NULL, 나이 INT NULL, 성별 CHAR(1) NOT NULL, 휴대폰번호 ..

SQL 기초

SQL 관계형 데이터베이스 표준 언어로서 가장 많이 사용되는 데이터 언어 - SYSTEM R’이라는 실험용 DBMS를 위한 데이터 언어로 IBM 연구소에서 처음 개발 -현재는 미국 표준(ANSI)과 국제 표준(ISO) 관계형 데이터베이스 표준 언어로 승인 ORACLE, MS SQL-Server, MySQL 등 거의 모든 관계형 DBMS가 지원 SQL을 구성하는 3가지 부속 언어의 분류와 관련 주요 기능 MySQL 개요  세계에서 가장 많이 사용하는 오픈소스 RDBMS, 1995년에 최초 개발  코드가 공개되어 있어 누구나 다운로드하여 사용할 수 있는 데이터베이스 관리 시스템  무료임에도 불구하고 처리 속도가 빠르고 설치도 쉬움  오라클, MS-SQL Server와 함께 가장 많이 사용하는 DBMS..

SQL mysql 실습 셋팅

# 새로운 manger 관리자 생성 CREATE USER "manger" @ "%" IDENTIFIED BY "1234"; # 생성한"manger"관리자 계정에 권한을 부여함 GRANT ALL ON *.* TO "manager" @ "%" WITH GRANT OPTION; # univdb 생성 CREATE DATABASE IF NOT EXISTS univDB; use univdb; CREATE TABLE 과목 ( 과목번호 char(4) NOT NULL PRIMARY KEY, 이름 VARCHAR(20) NOT NULL, 강의실 CHAR(3) NOT NULL, 개설학과 VARCHAR(20) NOT NULL, 시수 INT NOT NULL ) ; CREATE TABLE 학생 ( 학번 CHAR(4) NOT NUL..