본문 바로가기
파이썬/파이썬기본문법

파이썬 판다스 CSV 파일 읽기

by flycoding 2024. 1. 18.
반응형

파이썬 판다스 CSV 파일 읽기 - read_csv()

빅 데이터 세트를 저장하는 간단한 방법은 CSV 파일(콤마 구분 파일)을 사용하는 것이다.
CSV 파일은 일반 텍스트를 포함하고 있으며 팬더를 포함한 모든 사람이 읽을 수 있는 잘 알려진 형식이다.

예제에서는 'data.csv'라는 CSV 파일을 사용한다.

data.csv
0.00MB

 

 


CSV를 데이터 프레임에 로드한다:

import pandas as pd

df = pd.read_csv('data.csv')

print(df.to_string())

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 CSV 파일 읽기 read_csv() to_string() 활용 예제

 

팁: to_string()을 사용하여 DataFrame 전체를 인쇄한다.

 

행이 많은 큰 DataFrame을 사용하는 경우 Panda는 처음 5개의 행과 마지막 5개의 행만 반환한다:

To_string() 메서드 없이 DataFrame 인쇄:

import pandas as pd

df = pd.read_csv('data.csv')

print("df = pd.read_csv('data.csv') : \n", df)

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 CSV 파일 읽기 read_csv() 활용 예제

 

파이썬 판다스 CSV - 최대 행

반환되는 행 수는 Pandas 옵션 설정에 정의된다.
pd.options.display.max_rows 문으로 시스템의 최대 행을 확인할 수 있다.

반환되는 최대 행 수를 확인한다:

import pandas as pd

print('pd.options.display.max_rows : ', pd.options.display.max_rows)

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 CSV  pd.options.display.max_rows 활용 예제

 

제 시스템에서 숫자는 60이다. 즉, DataFrame에 60개 이상의 행이 포함된 경우 print(df) 문은 헤더와 처음 및 마지막 5개 행만 반환한다.

같은 문으로 최대 행 번호를 변경할 수 있다.

전체 DataFrame을 표시할 최대 행 수를 늘린다:

import pandas as pd

pd.options.display.max_rows = 9999

df = pd.read_csv('data.csv')

print(df)

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 CSV  pd.options.display.max_rows 활용 예제

 

이번 글에서는 파이썬 판다스 CSV 파일을 읽는 방법, 최대 읽을 수 있는 행의 개수 등에 대해서 간략히 살펴보았다.

파이썬 판다스 CSV 파일을 읽는 read_csv() 함수, csv 파일에서 모든 행을 읽어서 인쇄하는 to_string() 함수,  csv 파일을 최대 읽을 수 있는 행의 수를 정의하는 pd.options.display.max_rows 를 설정하는 등의 실습을 하였다.

꼭 손으로 눈으로 머리로 익히며 실습하기를 바란다.

모두 화이팅입니다.!!!

 

출처 : 이 글의 출처는 w3schools사이트를 참고하였으며 필자가 추가하여 정리한 글입니다.

반응형

댓글