파이썬 이것저것 77

[파이썬] 서울 CCTV 데이터 분석해보기

목표 1. 서울시 CCTV데이터를 정리하고 정렬하기 2. 그래프로 시각화 해보기 3. 전체적인 데이터 인사이트를 보기 4. 이상치를 강조해보기 사용데이터 서울시 자치구 연도별 CCTV 설치 현황 데이터를 불러와서 진행해봄 데이터는 13년이 이전 ~ 16년도 데이터를 사용해봄 import pandas as pd In [2]: CCTV_Seoul = pd.read_csv("../data/01. Seoul_CCTV.csv") CCTV_Seoul.head() CCTV_Seoul.columns Out[3]: Index(['기관명', '소계', '2013년도 이전', '2014년', '2015년', '2016년'], dtype='object') In [4]: CCTV_Seoul.columns[0] Out[4]: '..

[파이썬] 스타벅스, 이디야 매장 크롤링 및 분석

- 서울 스타벅스, 이디야 매장데이터를 가지고 옴 - 각각 매장이름, 주소, 구 이름을 판다스로 저장함 패키지 갖고오기 import time import pandas as pd import seaborn as sns import numpy as np import matplotlib.pyplot as plt import seaborn as sns import numpy as np import matplotlib.pyplot as plt import seaborn as sns from tqdm import tqdm_notebook from selenium import webdriver from bs4 import BeautifulSoup from matplotlib import rc from tqdm imp..

[파이썬] XGB 활용하여 성적예측

import pandas as pd import numpy as np X_train = pd.read_csv("X_train.csv") X_test = pd.read_csv("X_test.csv") y_train = pd.read_csv("y_train.csv") y_test = pd.read_csv("y_test.csv") # trainindex 678 # StudentID 제거 필요, 통합데 이터 alldata = pd.concat([X_train, X_test], axis=0) alldata2 = alldata.drop("StudentID",axis=1) y_train_dr = y_train.drop("StudentID",axis=1) from sklearn.preprocessing import L..

[파이썬] ProPhet을 활용하여 삼성전자 주식 데이터 예측해보기

1. yahoo finaince에서 삼성전자 일자별 장마감 가격을 갖고오기(크롤링을 이용해서 갖고와 보기) 패키지 설치 import pandas as pd import pandas_datareader as web import numpy as np import matplotlib.pyplot as plt from bs4 import BeautifulSoup from urllib.request import urlopen, Request from fbprophet import Prophet from datetime import datetime 이후에 패키지 사용을 위해서 yahoo finance(https://finance.yahoo.com/) 에서 검색해서 일자별 데이터를 가지고 옴 html코드를 분석하여 ..

[파이썬] ProPhet 활용하여 시계열 예측

# Sin 그래프를 그리는 함수 만들어보기 import matplotlib.pyplot as plt import numpy as np %matplotlib inline def plotSinWave(amp, freq, endTIme, smapleTime, startTime, bias): """ plot sin wave y = a sin(2 pi f t + t_0) + b """ time = np.arange(startTime, endTIme, smapleTime) result = amp * np.sin(2 * np.pi * freq * time + startTime) + bias plt.figure(figsize=(12, 6)) plt.plot(time, result) plt.grid(True) plt.x..

[파이썬] 수치형 변수의 요약, 기술통계

환경 : Google Colab 데이터: mpg 데이터 사용 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 파이썬 버전 확인 print(pd.__version__) 3print(sns.__version__) # 데이터 확인 df.head(4) df.info() # 결측데이터 확인 df.isnull().sum() horesepower 변수가 6개의 결측치가 확인 # 비율로 확인 # 기초통계량 확인 df.describe() # 범주형 데이터의 기초통계량 확인 df.describe(include="object") # mpg 변수의 고윳값 갯수 보기 df["mpg"].nunique() # ..

[크롤링] GS25 매장 크롤링 -1

거주하고 있는 고양시의 GS25 매장들을 크롤링 하고자 한다. 매장이름, 주소, 기능을 갖고옴 목표 - 페이지 접속과 페이지의 각 요소의 html 속성을 확인 - 1페이지의 각 요소를 갖고와서 저장하기 url : http://gs25.gsretail.com/gscvs/ko/store-services/locations GS25 일상생활의 중심, 하루의 시작 Lifestyle Platform GS25 gs25.gsretail.com - 특히 3번의 기능 을 갖고오는데 많은 고민을 했다. 일단 리스트 형태로 갖고오는것을 목표로 함 1. 필요 패키지 설치 # 필요 패키지 설치 from selenium import webdriver from webdriver_manager.chrome import ChromeDr..