본문 바로가기
파이썬/파이썬기본문법

파이썬 Pandas 개요

by flycoding 2024. 1. 15.
반응형

파이썬 판다스(Pandas) 개요

판다스는 파이썬 라이브러리이다.
판다스는 자료를 분석하는데 사용된다.

 

판다스는 데이터 세트 작업에 사용되는 파이썬 라이브러리이다.
데이터 분석, 청소, 탐색, 조작 등의 기능을 갖추고 있다.
Pandas라는 이름은 Panel Data와 Python Data Analysis를 모두 의미하며 2008년 Wes McKinney가 만들었다.

 

왜 파이썬 판다스를 사용할까?

판다는 빅데이터를 분석하고 통계학적 이론을 바탕으로 결론을 내릴 수 있게 해준다.
판다스는 지저분한 데이터 세트를 정리할 수 있고, 그것들을 읽을 수 있고 적절하도록 만들 수 있다.
관련 데이터는 데이터 과학에서 매우 중요하다.

 

데이터 사이언스(Data Science)는 컴퓨터 과학의 한 분야로, 컴퓨터 과학에서 정보를 도출하기 위해 데이터를 저장, 사용 및 분석하는 방법을 연구하고 있다.

 

파이썬 판다스는 무엇을 할 수 있을까?

판다스는 데이터에 대한 답을 제공한다. 예를 들어:

  • 두 개 이상의 열 사이에 상관 관계가 있는가?
  • 평균값이란?
  • 최댓값?
  • 최소값?

판다스는 관련이 없거나 빈 값 또는 NULL 값과 같은 잘못된 값을 포함하는 행을 삭제할 수도 있다. 이를 데이터 정리라고 한다.

판다스 코드베이스는 어디에 있을까?

Pandas의 소스 코드는 이 github 저장소 https://github.com/pandas-dev/pandas 에 있다.

 

github: 많은 사람들이 동일한 코드베이스에서 작업할 수 있게 해준다.

 

판다스 설치

시스템에 이미 Python과 PIP가 설치되어 있다면 Panda를 설치하는 것은 매우 쉽다.

다음 명령을 사용하여 설치한다:

C:\Users\Your Name>pip install pandas

 

이 명령이 실패하면 Anaconda, Spyder 등 Panda가 이미 설치되어 있는 Python 배포판을 사용한다.

 

판다스 사용하기(import pandas

import pandas

 

예제:

import pandas as pd

mydataset = {
  '자동차': ["BMW", "Volvo", "Ford"],
  '승객수': [3, 7, 2]
}

print('mydataset : ', mydataset)

myvar = pd.DataFrame(mydataset)

print('myvar = pd.DataFrame(mydataset) : \n', myvar)

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 사용하기 DataFrame() 함수 예제

 

파이썬 판단스 단축어 - Pandas as pd

판다는 보통 pd 가명으로 사용될 수 있다.

alias: Python alias에서 같은 것을 가리키는 대체 이름이다.

가져오는 동안 as 키워드를 사용하여 별칭을 만든다:

import pandas as pd

 

이제 팬더 패키지는 팬더 대신 pd라고 불릴 수 있다.

import pandas as pd

mydataset = {
  '자동차': ["BMW", "Volvo", "Ford"],
  '승객수': [3, 7, 2]
}

print('mydataset : ', mydataset)

myvar = pd.DataFrame(mydataset)

print('\n myvar = pd.DataFrame(mydataset) : \n', myvar)

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 사용하기 import pandas as pd 함수 예제

 

파이썬 판다스 버전 검사

버전 문자열은 __version__ 속성으로 저장된다.

import pandas as pd

print('파이썬 pandas version : ', pd.__version__)

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 사용하기 import pandas 버전 검사 __version__ 함수 예제

 

 

이번 글에서는 파이썬 판다스(pandas) 개요에 대해서 살펴보았다.

파이썬 판다스의 개념, 사용 용도, 설치하는 방법, 코딩에서 어떻게 사용 가능하지 import에 대해서도 살펴보았다.

꼭 손으로 눈으로 머리로 익히며 실습하기를 바란다.ㅏ

모두 화이팅입니다.!!!

 

출처 : 이 글의 출처는 w3schools사이트를 참고하였으며 필자가 추가하여 정리한 글입니다.

반응형

댓글