본문 바로가기
파이썬/파이썬기본문법

파이썬 판다스 도표 - 플로팅(Plotting)

by flycoding 2024. 1. 27.
반응형

파이썬 판다스 plotting - plot()

판다는 plot() 메소드를 사용하여 도표를 만듭니다.

Matplotlib 라이브러리의 하위 모듈인 Pyplot을 사용하여 화면에 다이어그램을 시각화할 수 있다.

Matplotlib에서 pyplot을 가져와 DataFrame을 시각화한다:

import sys
import matplotlib
matplotlib.use('Agg')

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

#Two  lines to make our compiler able to draw:
plt.savefig(sys.stdout.buffer)
sys.stdout.flush()

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 도표 plot() 함수 활용 예제

 

파이썬 판다스 산점도 - scatter plot - plot(), kind=scatter

kind 인수를 사용하여 산점도를 지정한다:

kind = 'scatter'

산점도에는 x축과 y축이 필요하다.

아래 예제에서는 x축에 "Duration"을 사용하고 y축에 "Calories"를 사용한다.

다음과 같이 x 및 y 인수를 포함합니다:
x = 'Duration', y = 'Calories'

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 산점도 scatter plot plot() kind=scatter 활용 예제

 

기억하세요: 앞의 예에서 우리는 "Duration"과 "Calories" 사이의 상관관계가 0.922721이라는 것을 알게 되었고, 지속시간이 길수록 더 많은 칼로리가 소모된다는 사실로 결론을 내렸다.

산점도를 보고 동의한다.

"Duration" 및 "Maxpulse"와 같이 열 사이에 나쁜 관계가 있는 다른 산점도를 생성하고 상관 관계는 0.009403이다:

열 사이에 관계가 없는 산점도:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 산점도 scatter plot plot() kind=scatter 활용 예제

 

파이썬 판다스 히스토그램(histogram) 도수분포표, 막대그래프 - kind='hist'

kind 인수를 사용하여 히스토그램을 지정한다:

kind = 'hist'

히스토그램은 하나의 열만 필요하다.

히스토그램은 각 간격의 빈도(예: 50분에서 60분 사이의 운동 횟수)를 보여준다?

아래 예제에서는 "Duration" 열을 사용하여 히스토그램을 작성한다:

#Three lines to make our compiler able to draw:
import sys
import matplotlib
matplotlib.use('Agg')

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df["Duration"].plot(kind = 'hist')


plt.show()

#Two  lines to make our compiler able to draw:
plt.savefig(sys.stdout.buffer)
sys.stdout.flush()

위의 코드를 실행하면 아래 그림과 같다.

파이썬 판다스 히스토그램 histogram plot() kind=hist 활용 예제

 

참고: 히스토그램은 50분에서 60분 사이에 진행된 100개 이상의 운동이 있었음을 알려준다.

 

이번 글에서는 파이썬 판다스 도표(plot)에 대해서 살펴보았다.

파이썬 판다스 도표에는 다양한 도표를 지원하는 데, 일반적인 도표로 plot(), 산점도는 kind='scatter', 막대그래프는 kind='hist' 그래프 등을 표현할 수 있다.

꼭 손으로 눈으로 머리로 익히며 실습하기를 바란다.

모두 화이팅입니다.

 

출처 : 이 글의 출처는 w3schools사이트를 참고하였으며 필자가 추가하여 정리한 글입니다.

반응형

댓글