본문 바로가기

분류 전체보기589

파이썬 판다스 빈셀 데이터 클리닝 파이썬 판다스 데이터 클리닝 - 빈셀 빈 셀은 데이터를 분석할 때 잘못된 결과를 제공할 수 있다. 파이썬 판다스 데이터 클리닝 - 행 제거 빈 셀을 처리하는 한 가지 방법은 빈 셀을 포함하는 행을 제거하는 것이다. 데이터 세트가 매우 클 수 있기 때문에 몇 개의 행을 제거해도 결과에 큰 영향을 미치지 않으므로 일반적으로 괜찮다. 빈 셀이 없는 새 데이터 프레임을 반환한다: import pandas as pd df = pd.read_csv('data.csv') print("df = pd.read_csv('data.csv') : \n", df) new_df = df.dropna() print('\nnew_df = df.dropna()\n') print(new_df.to_string()) 위의 코드를 실행하면.. 2024. 1. 22.
파이썬 판다스 데이터 클리닝(Data Cleaning) 파이썬 판다스 데이터 클리닝(data cleaning) 데이터 클리닝은 데이터 세트의 잘못된 데이터를 수정하는 것을 의미한다. 잘못된 데이터는 다음과 같다: 빈 셀 잘못된 형식의 데이터 잘못된자료 복제품 이 자습서에서는 이 모든 것을 다루는 방법에 대해 배우게 된다. Duration Date Pulse Maxpulse Calories 0 60 '2020/12/01' 110 130 409.1 1 60 '2020/12/02' 117 145 479.0 2 60 '2020/12/03' 103 135 340.0 3 45 '2020/12/04' 109 175 282.4 4 45 '2020/12/05' 117 148 406.0 5 60 '2020/12/06' 102 127 300.0 6 60 '2020/12/07' .. 2024. 1. 21.
파이썬 판다스 데이터 분석 파이썬 판다스 데이터 보기 - head(), tail() DataFrame의 개요를 간단히 파악하기 위해 가장 많이 사용되는 방법 중 하나는 head() 이다. head() 메서드는 헤더와 지정된 수의 행을 반환하며, 맨 위부터 시작한다. DataFrame의 처음 10개 행을 인쇄하여 간단한 개요를 확인할 수 있다: import pandas as pd df = pd.read_csv('data.csv') print("df = pd.read_csv('data.csv') : \n", df) print('df.head(10) : \n', df.head(10)) 위의 코드를 실행하면 아래 그림과 같다. 예를 들어 'data.csv'라는 CSV 파일을 사용한다. 참고: 행 수를 지정하지 않으면 head() 메서드가.. 2024. 1. 20.
파이썬 판다스 JSON 읽기 파이썬 판다스 JSON 읽기 빅 데이터 세트는 종종 저장되거나 JSON으로 추출된다. JSON은 평이한 텍스트이지만 개체의 형식을 가지고 있으며, 판다스를 포함한 프로그래밍 세계에서 잘 알려져 있다. 예제에서는 'data.json'이라는 JSON 파일을 사용합니다. data.json을 엽니다. JSON 파일을 DataFrame에 로드합니다: import pandas as pd df = pd.read_json('data.json') print("df = pd.read_json('data.json') :\n", df) print('\ndf.to_string() : \n', df.to_string()) 위의 코드를 실행하면 아래 그림과 같다. 팁: to_string()을 사용하여 DataFrame 전체를 인쇄.. 2024. 1. 19.