본문 바로가기
파이썬 및 데이터 분석/데이터 전처리

Python - 결측값 처리

by 진영03 2023. 6. 14.
728x90
300x250
import pandas as pd 
df = pd.DataFrame({ 'a' : [1,2,3], 'b' : [4,5,6], 'c' : [7,8,9] })

 

- 결측 유무 확인 = df.isnull( ) = NaN 존재시 True로 뜸

- 결측값 개수 확인 = df.isnull( ).sum( )

 

- 결측값이 포함된 행 지우기 = df.dropna( ) 

- 저장하고 싶으면 inplace = True

 

- 결측값이 포함된 열 지우기 = df.dropna( axis = 1 )

 

- 결측값을 다른값으로 대체하기 = df.fillna( 0, inplace = True )

- 결측값을 앞이나 뒤에 숫자로 바꾸기 

# 뒤에 값으로 바꾸기 
df.fillna(method = 'bfill')

# 앞에 값으로 바꾸기 
df.fillna(method = 'ffill')

 

- limit 설정 = df.fillna( method = 'bfill' , limit = 1 )

 

- 평균 = df.mean( )

- a 평균으로 채우기 = df.fillna( df.mean( )[ 'a' ] )

- b, c의 결측값을 전체 평균으로 채우기 = df.fillna( df.mean( ) [ [ 'b', 'c' ] ] )

728x90
300x250