본문 바로가기
파이썬/파이썬기본문법

파이썬 판다스 데이터 분석

by flycoding 2024. 1. 20.
반응형

파이썬 판다스 데이터 보기 - head(), tail()

DataFrame의 개요를 간단히 파악하기 위해 가장 많이 사용되는 방법 중 하나는 head() 이다.

head() 메서드는 헤더와 지정된 수의 행을 반환하며, 맨 위부터 시작한다.

DataFrame의 처음 10개 행을 인쇄하여 간단한 개요를 확인할 수 있다:

import pandas as pd

df = pd.read_csv('data.csv')

print("df = pd.read_csv('data.csv') : \n", df)

print('df.head(10) : \n', df.head(10))

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 데이터 보기 - head() 함수 활용 예제

 

예를 들어 'data.csv'라는 CSV 파일을 사용한다.

data.csv
0.00MB

 



참고: 행 수를 지정하지 않으면 head() 메서드가 상위 5개 행을 반환한다.

DataFrame의 처음 5행을 인쇄한다:

import pandas as pd

df = pd.read_csv('data.csv')

print("df = pd.read_csv('data.csv') : \n", df)

print('df.head() : \n', df.head())

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 데이터 보기 - head() 함수 활용 예제

 

또한 DataFrame의 마지막 행을 보기 위한 tail() 메서드도 있다.

tail() 메서드는 헤더와 지정된 수의 행을 반환하며, 맨 아래부터 시작한다.

DataFrame의 마지막 5행을 인쇄한다:

import pandas as pd

df = pd.read_csv('data.csv')

print("df = pd.read_csv('data.csv') : \n", df)

print('df.tail() : \n', df.tail())

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 데이터 보기 - tail() 함수 활용 예제

 

파이썬 판다스 데이터에 관한 정보 - info()

DataFrame 개체에는 데이터 집합에 대한 자세한 정보를 제공하는 info()라는 메서드가 있다.

데이터에 대한 정보를 인쇄한다:

import pandas as pd

df = pd.read_csv('data.csv')

print("df = pd.read_csv('data.csv') : \n", df)

print('df.info() : \n', df.info())

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 데이터 정보- info() 함수 활용 예제

 

파이썬 판다스 데이터 분석 - null 값, info()

info() 메소드는 또한 각 열에 Non-Null 값이 몇 개 있는지 알려주며, 데이터 집합에서는 "Calories" 열에 Non-Null 값 164개가 있는 것으로 보인다.

즉, 어떤 이유로든 "열" 열에 값이 전혀 없는 행이 5개 있다는 뜻이다.

빈 값, 즉 Null 값은 데이터를 분석할 때 좋지 않을 수 있으므로 빈 값이 있는 행을 제거하는 것을 고려해야 한다. 이것은 데이터 클리닝이라고 불리는 것을 향한 단계이며, 다음 장에서 자세히 배울 것이다.

 

이번 글에서는 파이썬 판다스에서 데이터 분석에 대해서 살펴보았다.

파이썬 판다스에서 데이터 정보에 대해서 head(), tail(), info() 메소드를 통해 다양한 데이터 정보를 제공해준다.

꼭 손으로 눈으로 머리로 익히며 실습하기를 바란다.

모두 화이팅입니다.!!!

 

출처 : 이 글의 출처는 w3schools사이트를 참고하였으며 필자가 추가하여 정리한 글입니다.

반응형

댓글