[성동1기 전Z전능 데이터 분석가] 33일차 python 데이터 분석 기초

728x90

1. 데이터 파악하기

exam 데이터를 파악해보자.

import pandas as pd
exam = pd.read_csv("C:/Users/anjiyoung/Documents/exam.csv")

head() 데이터 앞부분 확인하기

tail() - 데이터 뒷부분 확인하기

shape - 데이터가 몇 행, 몇 열로 구성되는지 알아보기

info - 변수 속성 파악하기

Non-Null Count: 결측치를 제외하고 구한 값의 개수

변수속성: int64(정수), float64(실수), object(문자), datetime64(날짜시간)

64: 64비트

- 1비트로 두 개의 값 표현 가능

- int64: 2^64개의 정수 표현 가능

describe() - 요약 통계량 구하기

2. 변수명 바꾸기

mpg = mpg.rename(columns = {'manufacturer':'company'})

3. 파생변수 만들기

mpg['total'] = (mpg['cty']+mpg['hwy'])/2 # 변수 조합

mpg['test'] = np.where(mpg['total'] >= 20, 'pass', 'fail') # 조건문 활용

[성동1기 전Z전능 데이터 분석가] 43일차 프로젝트 (0)	2023.12.13
[성동1기 전Z전능 데이터 분석가] 37일차 python 프로젝트(통계분석) (0)	2023.12.05
[성동1기 전Z전능 데이터 분석가] 32일차 python 데이터 프레임 (0)	2023.11.28
[성동1기 전Z전능 데이터 분석가] 32일차 python 기초 - 함수, 패키지 (0)	2023.11.28
[성동1기 전Z전능 데이터 분석가] 31일차 python 기초 - 제어문 (0)	2023.11.27

안졍의 성장기