import os
import pandas as pd
os.chdir(r"D:/bigdata/jupyter/data_preprocessing/1. 데이터 핸들링\데이터/")


df1 = pd.read_csv("merge_실습_employee_group.csv", engine="python")
df2 = pd.read_csv("merge_실습_employee_hire_date.csv", engine="python")

df1

df2


# 합칠 컬럼은 자동으로 
merged_df = pd.merge(df1, df2)
merged_df.head()


# on을 사용하여 merge = 특정 컬럼의 키 값을 기준으로 통합
merged_df2 = pd.merge(df1, df2, on=["employee"])
merged_df2.head()


df1 = pd.read_csv("merge_실습_employee_group.csv", engine="python")
df2 = pd.read_csv("merge_실습_name_hire_date.csv", engine="python")

df1

df2


# df1을 기준으로 df2에 있는 데이터를 합침
merged_df3 = pd.merge(df1, df2, left_on="employee", right_on="name")
merged_df3.head()


merged_df3.drop('name', inplace=True, axis=1)
merged_df3


df1 = pd.read_csv("merge_실습_employee_group.csv", engine="python")
df2 = pd.read_csv("merge_실습_name_hire_date.csv", engine="python", index_col="name")

df1

df2


merged_df4 = pd.merge(df1, df2, left_on ="employee", right_index=True)
merged_df4

	employee	group
0	Bob	Accounting
1	Jake	Engineering
2	Lisa	Engineering
3	Sue	HR

	employee	hire_date
0	Lisa	2004
1	Bob	2008
2	Jake	2012
3	Sue	2014

	employee	group	hire_date
0	Bob	Accounting	2008
1	Jake	Engineering	2012
2	Lisa	Engineering	2004
3	Sue	HR	2014

	employee	group	hire_date
0	Bob	Accounting	2008
1	Jake	Engineering	2012
2	Lisa	Engineering	2004
3	Sue	HR	2014

	employee	group
0	Bob	Accounting
1	Jake	Engineering
2	Lisa	Engineering
3	Sue	HR

[pandas] merge로 데이터 프레임 합치기

Pandas - merge를 이용한 데이터 프레임 통합¶

index를 사용한 데이터 통합¶