728x90
분석를 진행하다보면 데이터가 여기저기 분산되어 있는 경우가 생각보다 많다.
조각난 데이터를 분석에 필요한 데이터셋으로 만들기 위해 데이터프레임을 병합해서 사용해야 한다.
한개 이상의 데이터프레임을 병합할 때, 주로 사용하는 함수를 알아보았다.
pd.merge(베이스 df, 병합할 df)
- df : 데이터프레임
how : 'left' , 'right' , 'inner' , 'outer'
left_on : key값이 다른 경우, 베이스 df의 key 설정
right_on : key값이 다른 경우, 병합 df의 key 설정
merge 실습
df 생성
merge_df1 = pd.DataFrame({
'이름': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L'],
'국어': [100, 70, 70, 70, 60, 90, 90, 70, 70, 80, 100, 100],
'영어': [100, 90, 80, 50, 70, 100, 70, 90, 100, 100, 80, 100]
}, columns=['이름', '국어', '영어'])
merge_df2 = pd.DataFrame({
'일어': [80, 100, 100, 90, 70, 50, 100],
'수학': [90, 70, 100, 80, 70, 80, 90],
'이름': ['A', 'B', 'F', 'I', 'D', 'G', 'L'],
}, columns=['일어', '수학', '이름'])
df 확인
# 데이터프레임 확인
merge_df1
# 데이터프레임 확인
merge_df2
병합 테스트 : no how
# 병합 테스트 : no how
pd.merge(merge_df1,merge_df2)
병합 테스트 : how = outer
# 병합 테스트 : how = outer
pd.merge(merge_df1,merge_df2, how = 'outer')
병합 테스트 : how = left
# 병합 테스트 : how = left
pd.merge(merge_df1,merge_df2, how = 'left')
병합 테스트 : how = right
# 병합 테스트 : how = right
pd.merge(merge_df1,merge_df2, how = 'right')
728x90
'파이썬' 카테고리의 다른 글
[파이썬] 코랩으로 EDA 해보기 (보스턴주택가격) (0) | 2022.04.24 |
---|---|
[파이썬] 데이터프레임 인덱스 편집 (0) | 2022.04.24 |
[파이썬] 데이터 분석해보기 (All Lending Club loan data) (0) | 2022.04.24 |
[파이썬] NaN, None, Null 차이 및 제거 방법 (0) | 2022.04.22 |
[파이썬] 넘파이(Numpy) 특수 array 생성하기 (0) | 2022.04.22 |