import pandas as pd


df = pd.DataFrame({"A":[1,2,3,1,2,3],'B':[3,2,1,3,2,1],'C':[1,2,3,4,3,2]})
df


# A를 기준으로 중복 제거(첫 행 남김) keep의 기본 값은 'first'
df.drop_duplicates(subset=['A'])


# 저장 하지 않았기 때문에 삭제했던 행이 다시 보임
df


# A를 기준으로 중복 제거(마지막 행 남김) keep='last'
df.drop_duplicates(subset=['A'], keep='last')

[pandas] .loc를 사용하여 조건에 맞는 행 인덱싱(마스킹 인덱싱) (0)	2021.04.15
[pandas] 판다스 DataFrame정렬 sort_values() (0)	2021.04.13
[pandas] Series 데이터 정렬하기 sort_values(), .value_counts(), .unique() (0)	2021.04.12
[pandas] groupby를 이용한 조건부 통계 (0)	2021.04.10
[pandas] pivot_table을 이용한 조건별 변수별 통계량 파악 (0)	2021.04.09

Data Navigator

[pandas] DaraFrame의 중복 제거 .drop_duplicates 본문