파이썬 판다스 CSV 파일 읽기 - read_csv()
빅 데이터 세트를 저장하는 간단한 방법은 CSV 파일(콤마 구분 파일)을 사용하는 것이다.
CSV 파일은 일반 텍스트를 포함하고 있으며 팬더를 포함한 모든 사람이 읽을 수 있는 잘 알려진 형식이다.
예제에서는 'data.csv'라는 CSV 파일을 사용한다.
CSV를 데이터 프레임에 로드한다:
import pandas as pd df = pd.read_csv('data.csv') print(df.to_string()) |
위의 코드를 실행하면 아래 그림과 같다.
팁: to_string()을 사용하여 DataFrame 전체를 인쇄한다.
행이 많은 큰 DataFrame을 사용하는 경우 Panda는 처음 5개의 행과 마지막 5개의 행만 반환한다:
To_string() 메서드 없이 DataFrame 인쇄:
import pandas as pd df = pd.read_csv('data.csv') print("df = pd.read_csv('data.csv') : \n", df) |
위의 코드를 실행하면 아래 그림과 같다.
파이썬 판다스 CSV - 최대 행
반환되는 행 수는 Pandas 옵션 설정에 정의된다.
pd.options.display.max_rows 문으로 시스템의 최대 행을 확인할 수 있다.
반환되는 최대 행 수를 확인한다:
import pandas as pd print('pd.options.display.max_rows : ', pd.options.display.max_rows) |
위의 코드를 실행하면 아래 그림과 같다.
제 시스템에서 숫자는 60이다. 즉, DataFrame에 60개 이상의 행이 포함된 경우 print(df) 문은 헤더와 처음 및 마지막 5개 행만 반환한다.
같은 문으로 최대 행 번호를 변경할 수 있다.
전체 DataFrame을 표시할 최대 행 수를 늘린다:
import pandas as pd pd.options.display.max_rows = 9999 df = pd.read_csv('data.csv') print(df) |
위의 코드를 실행하면 아래 그림과 같다.
이번 글에서는 파이썬 판다스 CSV 파일을 읽는 방법, 최대 읽을 수 있는 행의 개수 등에 대해서 간략히 살펴보았다.
파이썬 판다스 CSV 파일을 읽는 read_csv() 함수, csv 파일에서 모든 행을 읽어서 인쇄하는 to_string() 함수, csv 파일을 최대 읽을 수 있는 행의 수를 정의하는 pd.options.display.max_rows 를 설정하는 등의 실습을 하였다.
꼭 손으로 눈으로 머리로 익히며 실습하기를 바란다.
모두 화이팅입니다.!!!
출처 : 이 글의 출처는 w3schools사이트를 참고하였으며 필자가 추가하여 정리한 글입니다.
'파이썬 > 파이썬기본문법' 카테고리의 다른 글
파이썬 판다스 데이터 분석 (0) | 2024.01.20 |
---|---|
파이썬 판다스 JSON 읽기 (0) | 2024.01.19 |
파이썬 판다스 데이터프레임-DataFrame() (0) | 2024.01.17 |
파이썬 판다스 시리즈(Series) (0) | 2024.01.16 |
파이썬 Pandas 개요 (1) | 2024.01.15 |
댓글