728x90
300x250
import pandas as pd
df = pd.DataFrame({ 'a' : [1,2,3], 'b' : [4,5,6], 'c' : [7,8,9] })
- 결측 유무 확인 = df.isnull( ) = NaN 존재시 True로 뜸
- 결측값 개수 확인 = df.isnull( ).sum( )
- 결측값이 포함된 행 지우기 = df.dropna( )
- 저장하고 싶으면 inplace = True
- 결측값이 포함된 열 지우기 = df.dropna( axis = 1 )
- 결측값을 다른값으로 대체하기 = df.fillna( 0, inplace = True )
- 결측값을 앞이나 뒤에 숫자로 바꾸기
# 뒤에 값으로 바꾸기
df.fillna(method = 'bfill')
# 앞에 값으로 바꾸기
df.fillna(method = 'ffill')
- limit 설정 = df.fillna( method = 'bfill' , limit = 1 )
- 평균 = df.mean( )
- a 평균으로 채우기 = df.fillna( df.mean( )[ 'a' ] )
- b, c의 결측값을 전체 평균으로 채우기 = df.fillna( df.mean( ) [ [ 'b', 'c' ] ] )
728x90
300x250
'파이썬 및 데이터 분석 > 데이터 전처리' 카테고리의 다른 글
Python - 정렬 (0) | 2023.06.14 |
---|---|
Python - 조건에 맞는 데이터 추출 (0) | 2023.06.14 |
Python - loc 와 iloc 를 이용한 원하는 위치에 데이터 추출 (0) | 2023.06.14 |
Python - 시리즈 (0) | 2023.06.14 |
Python - copy를 이용한 데이터 복사 (0) | 2023.06.14 |