Python - 조건에 맞는 데이터 추출
import pandas as pd df = pd.DataFrame({ 'a' : [1,2,3], 'b' : [4,5,6], 'c' : [7,8,9] }) - a가 3 이상인 데이터 출력 = df[ df[ 'a' ] >= 3 ] - a가 3 이상인 데이터중 a,c 얄만 출력 = df[ df[ 'a' ] >= 3 ] [ [ 'a', 'c' ] ] - a가 3 이상이고 b가 16 미만인 데이터 출력 = df[ ( df[ 'a' ] >= 3 ) & ( df[ 'b' ] = 3 ) & ( ( df[ 'b' ] < 16 ) | ( df[ 'c' ] == 30 ) ) ]
2023. 6. 14.
Python - loc 와 iloc 를 이용한 원하는 위치에 데이터 추출
import pandas as pd df = pd.DataFrame({ 'a' : [1,2,3], 'b' : [4,5,6], 'c' : [7,8,9] }) - df[ 'a', 'b' ] = a열과 b열의 데이터를 추출하려고 이렇게 쓰면 error 남 - 해결법 = df[ [ 'a', 'b' ] ] - 0번째 행 데이터 추출 = df.loc[ 0 ] - index가 문자로 되어있으면 당연히 df.loc[ 'g' ] 로 해야함 - 열이 a, c이며 인덱스가 g, i 인 데이터 추출 = df.loc[ [ 'g', 'i' ], [ 'a', 'c' ] ] - loc는 컬럼명을 직접 적거나 조건식을 써줌으로써 사람이 쉽게 읽기 편함 - iloc는 정수값만 들어가야하고, 컴퓨터가 읽기 쉬운 숫자로 접근!
2023. 6. 14.
Python - 시리즈
- df = pd.DataFrame({ 'a' : [1,2,3], 'b' : [4,5,6], 'c' : [7,8,9] }) - a열 추출 = df[ 'a' ] - 시리즈 생성방법 import pandas as pd a = pd.Series( [ 1,2,3,1,2,3] ) - DataFrame 과 마찬가지로 index값을 변경 할 수 있음 ex) index를 날짜로 - 유일한 값 찾기 = a.unique (중복된 값이 사라짐, 또한 list형식으로 출력) - 추가로 내가 궁금해서 찾아본거 = DataFrame 과 Series 차이점은 Series는 1차원 배열이고 DataFrame은 2차원 배열이다 ( 행과 열이 있단 소리)
2023. 6. 14.
Python - 컬럼명 추출 및 변경
import pandas as pd df = pd.DataFrame({ 'a' : [1,2,3], 'b' : [4,5,6], 'c' : [7,8,9] }) df.columns # ['a','b','c'] df.columns[0] # 'a' - 컬럼명 변경 = df.columns = [ 'd', 'e', 'f' ] - 컬럼명 변경 = df.rename( columns = { 'd' : '디', 'f' : '에프' }, inplace=True ) - 저장 = inplace = True
2023. 6. 14.