본문 바로가기

파이썬 pandas12

파이썬 판다스 도표 - 플로팅(Plotting) 파이썬 판다스 plotting - plot() 판다는 plot() 메소드를 사용하여 도표를 만듭니다. Matplotlib 라이브러리의 하위 모듈인 Pyplot을 사용하여 화면에 다이어그램을 시각화할 수 있다. Matplotlib에서 pyplot을 가져와 DataFrame을 시각화한다: import sys import matplotlib matplotlib.use('Agg') import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('data.csv') df.plot() plt.show() #Two lines to make our compiler able to draw: plt.savefig(sys.stdout.buffer) sys.stdo.. 2024. 1. 27.
파이썬 판다스 데이터 상관관계 파이썬 판다스 관계 찾기 Pandas 모듈의 가장 큰 특징은 corr() 방식이다. corr() 메소드는 데이터 집합의 각 열 사이의 관계를 계산한다. Duration Pulse Maxpulse Calories 60 110 130 409.1 60 117 145 479 60 103 135 340 45 109 175 282.4 45 117 148 406 60 102 127 300 60 110 136 374 45 104 134 253.3 30 109 133 195.1 60 98 124 269 60 103 147 329.3 60 100 120 250.7 60 106 128 345.3 60 104 132 379.3 60 98 123 275 60 98 120 215.2 60 100 120 300 45 90 112 .. 2024. 1. 26.
파이썬 판다스 데이터 클리닝 중복 데이터 파이썬 판다스 데이터 클리닝 중복 데이터 발견 - duplicated() 중복 행은 한 번 이상 등록된 행이다. Duration Date Pulse Maxpulse Calories 0 60 '2020/12/01' 110 130 409.1 1 60 '2020/12/02' 117 145 479.0 2 60 '2020/12/03' 103 135 340.0 3 45 '2020/12/04' 109 175 282.4 4 45 '2020/12/05' 117 148 406.0 5 60 '2020/12/06' 102 127 300.0 6 60 '2020/12/07' 110 136 374.0 7 450 '2020/12/08' 104 134 253.3 8 30 '2020/12/09' 109 133 195.1 9 60 '20.. 2024. 1. 25.
파이썬 판다스 잘못된 데이터 파이썬 판다스 잘못된 데이터 "잘못된 데이터"는 "빈 셀" 또는 "잘못된 형식"일 필요가 없으며, 마치 누군가가 "1.99" 대신 "199"를 등록한 것처럼 잘못될 수 있다. 데이터 세트를 보고 잘못된 데이터를 발견할 수 있다. 왜냐하면 데이터 세트가 무엇이어야 하는지에 대한 기대가 있기 때문이다. 데이터 세트를 살펴보면 7행에서 지속 시간은 450이지만 다른 모든 행에서는 지속 시간이 30에서 60 사이임을 알 수 있다. 틀릴 필요는 없지만 이것이 누군가의 운동에 대한 데이터 세트라는 점을 고려하여 이 사람이 450분 동안 운동을 하지 않았다는 사실로 결론을 내린다. Duration Date Pulse Maxpulse Calories 0 60 '2020/12/01' 110 130 409.1 1 60 '.. 2024. 1. 24.