파이썬 이것저것/파이썬 데이터분석 6

[파이썬] 주유소 데이터 분석

2022년 3월 11일자로 갖고온 데이터를 기반으로 주유소 데이터를 분석해본다. data=pd.read_excel("서울시주유소데이터.xlsx",index_col=0, thousands=",") import pandas as pd import numpy as np import matplotlib_hangle import matplotlib.pyplot as plt import seaborn as sns import folium # 데이터 정제 # 주유소 이름을 index로 설정 data = data.set_index('이름') In [9]: data.tail() # 결측값 확인 data.isnull().sum() 주소 0 브랜드 0 휘발유 0 경유 0 셀프여부 0 세차장 0 충전소 0 경정비 0 편의점 ..

[파이썬] 서울범죄율 데이터 분석

프로젝트 개요 1. 서울시의 5대범죄에 대한 데이터를 가지고 구별 어떤차이가 있는지 확인해봄 2. GoogleMaps, Folium, Seaborn, Pandas의 피봇테이블 등을 활요아하여 분석해봄 2. 데이터 개요 import numpy as np import pandas as pd In [3]: # 데이터 읽기 crime_raw_data = pd.read_csv("02. crime_in_Seoul.csv", thousands=",", encoding="euc-kr") # thousands 숫자값을 문자로 인식할 수 있어서 설정 crime_raw_data.head() crime_raw_data.info() RangeIndex: 65534 entries, 0 to 65533 Data columns (t..

[파이썬] 서울 CCTV 데이터 분석해보기

목표 1. 서울시 CCTV데이터를 정리하고 정렬하기 2. 그래프로 시각화 해보기 3. 전체적인 데이터 인사이트를 보기 4. 이상치를 강조해보기 사용데이터 서울시 자치구 연도별 CCTV 설치 현황 데이터를 불러와서 진행해봄 데이터는 13년이 이전 ~ 16년도 데이터를 사용해봄 import pandas as pd In [2]: CCTV_Seoul = pd.read_csv("../data/01. Seoul_CCTV.csv") CCTV_Seoul.head() CCTV_Seoul.columns Out[3]: Index(['기관명', '소계', '2013년도 이전', '2014년', '2015년', '2016년'], dtype='object') In [4]: CCTV_Seoul.columns[0] Out[4]: '..

[파이썬] ProPhet을 활용하여 삼성전자 주식 데이터 예측해보기

1. yahoo finaince에서 삼성전자 일자별 장마감 가격을 갖고오기(크롤링을 이용해서 갖고와 보기) 패키지 설치 import pandas as pd import pandas_datareader as web import numpy as np import matplotlib.pyplot as plt from bs4 import BeautifulSoup from urllib.request import urlopen, Request from fbprophet import Prophet from datetime import datetime 이후에 패키지 사용을 위해서 yahoo finance(https://finance.yahoo.com/) 에서 검색해서 일자별 데이터를 가지고 옴 html코드를 분석하여 ..

[파이썬] ProPhet 활용하여 시계열 예측

# Sin 그래프를 그리는 함수 만들어보기 import matplotlib.pyplot as plt import numpy as np %matplotlib inline def plotSinWave(amp, freq, endTIme, smapleTime, startTime, bias): """ plot sin wave y = a sin(2 pi f t + t_0) + b """ time = np.arange(startTime, endTIme, smapleTime) result = amp * np.sin(2 * np.pi * freq * time + startTime) + bias plt.figure(figsize=(12, 6)) plt.plot(time, result) plt.grid(True) plt.x..

[파이썬] 수치형 변수의 요약, 기술통계

환경 : Google Colab 데이터: mpg 데이터 사용 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 파이썬 버전 확인 print(pd.__version__) 3print(sns.__version__) # 데이터 확인 df.head(4) df.info() # 결측데이터 확인 df.isnull().sum() horesepower 변수가 6개의 결측치가 확인 # 비율로 확인 # 기초통계량 확인 df.describe() # 범주형 데이터의 기초통계량 확인 df.describe(include="object") # mpg 변수의 고윳값 갯수 보기 df["mpg"].nunique() # ..