전체 글 썸네일형 리스트형 파이썬 오픈 API 활용(파파고 번역) NAVER 오픈 API 활용 - 파파고 번역 1. 네이버 개발자센터 https://developers.naver.com/main/ NAVER Developers 네이버 오픈 API들을 활용해 개발자들이 다양한 애플리케이션을 개발할 수 있도록 API 가이드와 SDK를 제공합니다. 제공중인 오픈 API에는 네이버 로그인, 검색, 단축URL, 캡차를 비롯 기계번역, 음 developers.naver.com - 네이버 로그인 2. Products - Papago 번역 - 오픈 API 이용 신청 애플리케이션 이름 : 원하는 이름 설정 사용 API : Papago 번역 선택 비로그인 오픈 API 서비스 환경 : WEB 설정 / 웹 서비스 URL : http://localhost (임의.. 더보기 파이썬 웹크롤링(1) - 정적페이지 웹 페이지 종류 정적 페이지 : 웹 브라우저에 화면이 한번 뜨면 이벤트에 의한 화면의 변경이 없는 페이지 동적 페이지 : 웹 브라우저에 화면이 뜨고 이벤트가 발생하면 서버에서 데이터를 가져와 화면을 변경하는 페이지 requests html 문자열로 파싱 : 주로 정적 페이지 크롤링 json 문자열로 파싱 : 주로 동적 페이지 크롤링 selenium 브라우저를 직접 열어서 데이터 받음 크롤링 속도 requests json > requests html > selenium KOSPI 일별 시세 데이터 조회 - naver 코스피 - 네이버 증권 (naver.com) 코스피 - 네이버 증권 관심종목의 실시간 주가를 가장 빠르게 확인하는 곳 m.stock.naver.com ** 웹크롤링 기본 순서 ** URL 파악.. 더보기 파이썬 이변량 분석(3) - (숫자/범주->범주형) 이번 포스팅에서도 타이타닉 데이터로 진행 #타이타닉 데이터 불러오기! titanic = sns.load_dataset(('titanic')) titanic.head() 범주 → 범주 1) 교차표( pd.crosstab() ) # 두 범주별 빈도수를 교차표 생성 pd.crosstab(titanic['survived'], titanic['sex']) normalize : 비율로 변환 pd.crosstab(titanic['survived'], titanic['embarked'], normalize = 'all') 2) 시각화 # 모자익플롯 라이브러리 from statsmodels.graphics.mosaicplot import mosaic # 모자익 플롯 그리기 mosaic(titanic,['embarked'.. 더보기 파이썬 이변량 분석(2) - (범주형->숫자형) ** 항상 시작하기전에 아래 라이브러리를 불러와서 실행! 필수! # 라이브러리 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # warnings 무시 import warnings warnings.filterwarnings('ignore') # 폰트설정 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False # 그래프 선명 %config InlineBackend.figure_format = 'retina' 이번 분석은 타이타닉 데이터로 진행 #타이타닉 데이터 불러오기! titanic =.. 더보기 파이썬 이변량 분석(1) - (숫자형->숫자형) 단변량 분석 포스팅에서 사용한 air_incheon 데이터 사용 - 파이썬 단변량 분석(EDA) (tistory.com) air_incheon 1. 상관분석 1) 산점도 - plot() var_col = ['SO2', 'CO', 'O3', 'NO2', 'PM10'] plt.figure(figsize=(15,10)) for i,v in enumerate(var_col): plt.subplot(2,3,i+1) plt.title(v + ' - PM25') plt.scatter(air_incheon[v], air_incheon['PM25']) plt.xlabel(v) plt.ylabel('PM25') plt.show() --- 점들이 모여있고 추세를 보일수록 상관성이 높다. --- => PM25와 PM10은 상.. 더보기 파이썬 단변량 분석(EDA) 이전 포스팅에서는 폴더 내 데이터를 한번에 불러오고 병합하는 방법을 몰라서 2022년 2월 데이터만 사용했었음... 이번 포스팅에서는 2021년 1월 ~ 2021년 12월 대기정보 데이터 사용 ** 데이터 다운로드 에어코리아 → 통계정보 → 최종확정 측정자료 조회 → 확정자료 다운로드 → 2021년 데이터 다운로드 https://www.airkorea.or.kr/web/last_amb_hour_data?pMENU_NO=123 1. 라이브러리 # 라이브러리 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # warnings 무시 import warnings warnings.filterwar.. 더보기 파이썬 int타입_datetime타입으로 변환 파이썬 단변량 분석(EDA) (tistory.com) 에서 측정일시를 datetime으로 변환하는 데 여러 문제가 발생했다. 1. datetime으로 변환 가능한 형식이 아니다. or 2. datetime은 00 ~ 23시를 표현할 수 있다. (24 불가) 이번 포스팅은 이 문제들을 해결한 과정이다. 해결은 했지만... 효율적으로 작업한것이지 모르기 때문에 댓글로 더 좋은 방법을 알려주시면 감사합니다. 데이터 확인 # 측정일시 컬럼 데이터타입 확인 print(air['측정일시'].dtypes) # air 데이터 프레임 상위 5개 확인 air.head() => 측정일시는 int형이고, yyyymmddhh 형식임. => 바로 pd.to_datetime(air['측정일시'])를 작성하면 형식이 안맞게 변환 됨.. 더보기 파이썬 seaborn(1) - 숫자형 변수 seaborn 이전 포스팅에서 사용했던 데이터프레임 사용하여 실습 파이썬 matplotlib(1) - 숫자형 변수 (tistory.com) 파이썬 matplotlib(1) - 숫자형 변수 matplotlib - 라이브러리 # 라이브러리 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # warnings 무시 import warnings warnings.filterwarnings('ignore') # 폰트설정 plt.rcParams['font.family'] = 'Ma gooduci.tistory.com - 선그래프 ( sns.lineplot() ) # 선그래프 sns.lineplot(x=.. 더보기 이전 1 2 3 4 5 다음