본문 바로가기

전체 글

파이썬 matplotlib(1) - 숫자형 변수 matplotlib - 라이브러리 # 라이브러리 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # warnings 무시 import warnings warnings.filterwarnings('ignore') # 폰트설정 plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False # 그래프 선명 %config InlineBackend.figure_format = 'retina' => 이제부터는 위 코드는 항상 실행하고 시작. - 데이터 준비 (이전 포스팅과 같음 - 변수명만 변경) - 파.. 더보기
파이썬 시각화 시각화 라이브러리 - matplotlib - seaborn 데이터 준비 1) 데이터 다운로드 - 2022년 2월 서울특별시 중구 대기정보 데이터 사용 에어코리아 → 통계정보 → 최종확정 측정자료 조회 → 확정자료 다운로드 → 2022년 데이터 다운로드 https://www.airkorea.or.kr/web/last_amb_hour_data?pMENU_NO=123 에어코리아 : 최종확정 측정자료 조회 최종확정 측정자료 조회 www.airkorea.or.kr 2) 데이터 준비 - 라이브러리 # 라이브러리 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns - 데이터 준비 df = pd.read_.. 더보기
파이썬 데이터프레임 집계 데이터프레임 집계 # 타이타닉 데이터 불러오기 import pandas as pd import numpy as np import seaborn as sns titanic = sns.load_dataset(('titanic')) # # survived, pclass, sex, age, embarked 컬럼만 조회할 수 있는 데이터 프레임 생성 df = titanic[['survived','pclass','sex','age','fare']] df => titanic 데이터에서 survived, pclass, sex, age, fare 데이터만 조회할 수 있는 데이터프레임 생성 데이터프레임 데이터 형태별 집계 방법 범주형 데이터 갯수, 최빈값 연속형 데이터 합, 평균, 최댓값, 최솟값 # 합 print('합'.. 더보기
파이썬 데이터프레임 - pandas 기초(4-3) 4. 데이터프레임 변경 # 라이브러리 불러오기 import pandas as pd import numpy as np import seaborn as sns # 타이타닉 데이터 불러오기 import pandas as pd import numpy as np import seaborn as sns titanic = sns.load_dataset(('titanic')) # # survived, pclass, sex, age, embarked 컬럼만 조회할 수 있는 데이터 프레임 생성 df = titanic[['survived','pclass','sex','age','embarked']] # 인덱스 컬럼으로 가져옴 df.reset_index(inplace=True) df 4.3.1 데이터프레임 병합 ( conca.. 더보기
파이썬 데이터프레임 - pandas 기초(4-2) 4. 데이터프레임 변경 4.2.1 결측치 처리 결측치(NaN)은 정확한 분석을 방해, 오류가 발생할 수 있음 # 라이브러리 불러오기 import pandas as pd import numpy as np import seaborn as sns # 타이타닉 데이터 불러오기 titanic = sns.load_dataset(('titanic')) # survived, pclass, sex, age, embarked 컬럼만 조회할 수 있는 데이터 프레임 생성 df = titanic[['survived','pclass','sex','age','embarked']] df - 결측치 찾기 info() # info() df.info() => info() 함수를 통해 데이터 정보 확인. => 결측치는 Non-Null Co.. 더보기
파이썬 데이터프레임 - pandas 기초(4-1) 4. 데이터프레임 변경 # 라이브러리 불러오기 import pandas as pd import numpy as np import seaborn as sns # 타이타닉 데이터 불러오기 titanic = sns.load_dataset(('titanic')) # survived, pclass, sex, age 컬럼만 조회할 수 있는 데이터 프레임 생성 df = titanic[['survived','pclass','sex','age']] df 4.1.1 컬럼명 변경 모든 컬럼명 변경 - 변경할 컬럼명을 리스트로 생성 후, 리스트를 데이터프레임 컬럼명에 대입해준다. li = ['생존', '티켓클래스', '성별', '나이'] df.columns = li df.head() => 리스트 li 바꿔줄 컬럼명을 넣고, .. 더보기
파이썬 데이터프레임 - pandas 기초(3) 3. 데이터프레임 조회 # 라이브러리 불러오기 import pandas as pd import numpy as np import seaborn as sns # 타이타닉 데이터 불러오기 titanic = sns.load_dataset(('titanic')) titanic.head() 3.1 특정 컬럼 조회 df.loc[:, ['컬럼명1', '컬럼명2']] df[['컬럼명1', '컬럼명2']] ******** loc : 행과 열이름으로 데이터 조회 가능 # pclass 컬럼 불러오기 titanic.loc[:, 'pclass'] # titanic['pclass'] => 데이터 컬럼 pclass를 조회. 시리즈 형태로 출력(컬럼 하나만 출력할 경우, 시리즈 형태로 출력됨) # pclass 컬럼 불러오기 tita.. 더보기
파이썬 데이터프레임 - pandas 기초(2) 2.1 데이터프레임 탐색 # 라이브러리 불러오기 import pandas as pd import numpy as np import seaborn as sns # 타이타닉 데이터 불러오기 titanic = sns.load_dataset(('titanic')) titanic 상위 데이터 확인 # head() titanic.head() => 데이터프레임.head() : 데이터프레임 상위 5개 출력 => 데이터프레임.head(10) : 데이터프레임 상위 10개 출력 하위 데이터 확인 # tail() titanic.tail() => 데이터프레임.tail() : 데이터프레임 하위 5개 출력 => 데이터프레임.tail(10) : 데이터프레임 하위 10개 출력 데이터 크기 확인 # 크기확인 : shpae titanic.. 더보기